حدود الإبداع في مولدات الصور بالذكاء الاصطناعي
تكشف دراسة حديثة أن مولدات الصور المعتمدة على الذكاء الاصطناعي تظهر حدوداً واضحة للخيال البصري عند إعادة تفسير الصور مرارًا وتكرارًا، حيث تميل إلى الاستقرار عند عدد محدود من الأساليب البصرية المتكررة وتفسح المجال لأقل من اثني عشر نمطًا مهيمنًا.
أجرت الدراسة اختبارات على نماذج شهيرة مثل Stable Diffusion XL وLLaVA، ووصفَت النتائج بأنها أشبه بـ”موسيقى المصاعد البصرية”: صور أنيقة ومصقولة لكنها بلا روح فنية حقيقية وتفتقر إلى الجرأة أو الغرابة، وتصلح غالباً لجدران الفنادق أكثر من قاعات المعارض.
أطلق الباحثون تجربة باسم لعبة الهاتف المرئي لاختبار حدود الإبداع لدى الذكاء الاصطناعي. بدأ النص الشعري على النحو التالي: “بينما كنت أجلس وحيدًا وسط الطبيعة، عثرت على كتاب قديم من ثماني صفحات فقط، يحكي قصة بلغة منسية تنتظر من يقرأها ويفهمها”. حوّل Stable Diffusion XL النص إلى صورة، ثم وصفها LLaVA بالكلمات، وأعيد الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر هذا التبادل 100 مرة في غرفة صدى رقمية.
بدأت الفكرة الأصلية بالتلاشي خلال جولات قليلة، فبحلول الجولة العاشرة أو العشرين يفقد التشابه بين الصورة الجديدة والفكرة الأولية، لكن المفاجأة أنها تتحول غالباً إلى وجهات بصرية تقليدية مثل المنارات وأفق مدن ليلية وعمارات ريفية ومشاهد داخلية عامة، وبصورة مألوفة لا تبرز الجرأة أو الغرابة.
تبيّن أن جميع سلاسل الصور تقريبًا تنهار إلى واحد من اثني عشر نمطًا بصريًا مهيمنًا، وتبقى النهاية النهائية مظهرًا مألوفًا بغض النظر عن مدى غرابة النص الأصلي أو شاعرته.
تبقى النتيجة عند تبديل النماذج أو استخدام إصدارات مختلفة من أدوات التوليد والوصف كما هي، وتزداد قوة هذه الظاهرة عند التوسع إلى ألف جولة، حيث تستقر السلسلة على نمط واحد وتظهر فروق بسيطة فقط على الفكرة الأساسية.
تشير النتائج إلى أن الإبداع الاصطناعي يتجه إلى إزالة الشذوذ وتنعيم الاختلافات بسبب طبيعة بيانات التدريب التي تغلب عليها صور الطبيعة والمناظر الشائعة، ما يجعل الآلة تعيد تشغيل الألحان البصرية الأكثر انتشاراً.
تؤكد الدراسة أن الإبداع الاصطناعي، رغم قدرته على إنتاج صور تقنية جميلة، يظل محكومًا بإطار تقاليد بصرية ضيق، وهو ما يطرح تساؤلات حول قدرة الآلة على منافسة الإبداع البشري القائم على المفاجأة والمجازفة وكسر المألوف، خصوصاً في سياقات الفن الحقيقي.



