رئيس التحرير: حسام حسين لبش
مدير التحرير: علي عجمي

مولدات الذكاء الاصطناعي تفقد أصالتها بسرعة

شارك

نتائج مهمة للدراسة

أظهرت دراسة نُشرت في دورية Patterns أن نماذج توليد الصور المعتمدة على الذكاء الاصطناعي، مثل Stable Diffusion XL وLLaVA، تواجه حدودًا واضحة في الخيال البصري عند إعادة تفسير الصور مرارًا وتكرارًا. وتصف النتائج بأنها تشبه موسيقى المصاعد البصرية: صورًا أنيقة ومصقولة لكنها بلا روح فنية حقيقية وتبدو مألوفة إلى حد الملل، وتصلح أكثر للزخرفة على جدران الفنادق منها للعرض في قاعات المعارض. جرى اختبار ذلك عبر تجربة أُطلق عليها اسم «الهاتف المرئي»، حيث يحوّل نموذج Stable Diffusion XL نصًا شعريًا إلى صورة، ثم تقوم LLaVA بوصف الصورة، وتُعاد الوصفية إلى Stable Diffusion لإنتاج صورة جديدة، وتتكرر العملية مئة مرة متتالية.

أظهرت النتائج أن المعنى الأصلي يبدأ بالتلاشي بسرعة، فبحلول الجولة العاشرة أو العشرين لا يبقى هناك تشابه يُذكر مع الفكرة الأصلية، لكن المفاجأة كانت في تقارب الوجهات البصرية. عبر أكثر من ألف تجربة، لاحظ الباحثون أن النماذج كانت تنتهي تقريبًا إلى نفس الوجهات: منارات، أفق مدن ليلية، عمارة ريفية، مشاهد داخلية عامة وصور مألوفة تفتقر إلى الجرأة أو الغرابة.

تداعيات الإبداع الاصطناعي

تؤكد الدراسة أن جميع سلاسل الصور تقريبًا تنهار في نهاية المطاف إلى واحد من اثني عشر نمطًا بصريًا مهيمنًا، بغض النظر عن مدى غرابة النص الأصلي. ويتحول التحول عادة تدريجيًا، وأحيانًا يقع فجأة ليصبح النمط النهائي بلا ملامح فنية مميزة. وحتى عند استبدال النماذج أو توسيع التجربة إلى ألف جولة، تظل النتيجة ثابتة إلى حد كبير وتتحول الجولات اللاحقة إلى اختلافات طفيفة على الفكرة نفسها.

تشير النتائج إلى أن الإبداع الاصطناعي يواجه إطارًا بصريًا ضيقًا يفتقر إلى مفاجآت البشر. بينما يحقق النظام إنتاج صور عالية الجودة تقنياً، يظل بعيدًا عن القدرة على المفاجأة والمجازفة التي تميز الإبداع البشري. يعود ذلك جزئيًا إلى طبيعة بيانات التدريب التي تركز على صور بشرية وتكرار أنماط متشابهة على الإنترنت، ما يجعل الذكاء الاصطناعي يعيد تشغيل «الألحان البصرية» الأكثر انتشارًا.

مقالات ذات صلة