ذات صلة

اخبار متفرقة

كيف تشاهد ريلز إنستغرام وتتصفح القنوات وتستخدم الحسابات على التلفزيون؟

تبدأ اختبارات تطبيق إنستجرام للشاشة المنزلية في الولايات المتحدة،...

الصين تكشف عن أول روبوت بشري ذو ستة أذرع

أعلنت الصين كشف روبوت بشري من طراز ميرو يو...

السلمون من أقوى الأطعمة التي تحتوي على فيتامين د

أقوى الأطعمة التي تحتوي على فيتامين د تناول السلمون والأسماك...

بعد حلقة برنامج صاحبة السعادة: عشر صور تجمع بين العوضي وياسمين عبد العزيز

ظهر أحمد العوضي كضيف في حلقة خاصة من برنامج...

أسباب وأعراض مرض الفنان إدوارد في قدمه

تعرض الفنان إدوارد لتواء بسيط في الكاحل بالقدم، وهو...

مولدات الصور بالذكاء الاصطناعي تفقد أصالتها بسرعة لهذا السبب

تكشف دراسة حديثة أن مولدات الصور المعتمدة على الذكاء الاصطناعي تعاني من حدود واضحة في الخيال البصري، فبحسب بحث نُشر في دورية Patterns، تميل هذه النماذج عند إعادة تفسير الصور مرارًا إلى التخلي عن التفرد والاستقرار في عدد محدود من الأساليب البصرية المتكررة لا يتجاوز 12 نمطًا.

اختبرت الدراسة نماذج شهيرة مثل Stable Diffusion XL وLLaVA، ووصف النتائج بأنها أشبه بـ “موسيقى المصاعد البصرية”: صور أنيقة ومصقولة لكنها بلا روح فنية حقيقية، مألوفة إلى حد الملل، وصالحة أكثر لجدران الفنادق منها لقاعات المعارض.

لإختبار حدود الإبداع، صمّم الباحثون تجربة بعنوان “لعبة الهاتف المرئي” مستوحاة من لعبة الأطفال التي يلتقط فيها المعنى من نقل الرسالة بين الأشخاص. بدأوا بطلب نصي شاعري لنموذج Stable Diffusion XL: “بينما كنت أجلس وحيدًا وسط الطبيعة، عثرت على كتاب قديم من ثماني صفحات فقط، يحكي قصة بلغة منسية تنتظر من يقرأها ويفهمها”.

حوّل النموذج النص إلى صورة، ثم وصف الصورة إلى LLaVA، ثم أعادت الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر التبادل 100 مرة متتالية في غرفة صدى رقمية مغلقة.

مع التكرار، تلاشى المعنى الأصلي بسرعة، فبحلول الجولة العاشرة أو العشرين لم يعد هناك تشابه يذكر بين الصورة الجديدة والفكرة الأولى، لكن المفاجأة أن الوجهة النهائية كانت مقاربة عبر أكثر من 1000 تجربة: انتهت السلاسل عادة إلى وجهات بصرية محدودة مثل منارات، أفق مدن ليلية، عمارة ريفية، مشاهد داخلية عامة وصور مألوفة بلا جرأة أو غرابة.

12 نمطًا بصريًا تهيمن على الخيال الاصطرافي

خلصت الدراسة إلى أن جميع سلاسل الصور تقريبا كانت تتحطم في نهاية المطاف إلى واحد من 12 نمطًا بصريًا مهيمنًا، فبغض النظر عن مدى غرابة النص الأول أو تجريده، تكون النتيجة في النهاية صورة تبدو مألوفة بشكل مقلق.

يحدث التحول تدريجيًا غالبًا، إذ تفقد الصور خصوصيتها جولة بعد أخرى، وأحيانًا يقع التحول فجأة إلى مشهد نمطي بلا ملامح فنية مميزة، لكن الوجهة النهائية تبقى واحدة.

حتى عند استبدال النماذج أو استخدام إصدارات مختلفة من أدوات التوليد والوصف استمرت الظاهرة نفسها، ومع توسيع التجربة إلى 1000 جولة تصبح السلسلة البصرية مستقرة على نمط واحد وتتحول الجولات التالية إلى فروقات بسيطة على الفكرة نفسها. تقول الدراسة: عبر 1000 تكرار، معظم سلاسل الصور تنتهي إلى واحد من 12 نمطًا بصريًا مهيمنًا.

ماذا يعني ذلك للمفهوم الإبداعي للذكاء الاصطناعي؟

يرى الباحثون أن النتائج تطرح تساؤلات حول طبيعة الإبداع لدى الذكاء الاصطناعي. فالذكاء الاصطناعي يميل إلى إزالة الاختلافات والشذوذ، بينما في لعبة الهاتف البشرية ينتهي الأمر بتباين كبير بسبب تفسير كل شخص للرسالة بطريقته. يواجه الذكاء الاصطناعي المشكلة المعاكسة: مهما كان النص الأصلي غريبًا، يعود دائمًا إلى مجموعة ضيقة من الأساليب.

ينسب الباحثون هذا السلوك جزئيًا إلى طبيعة بيانات التدريب، فالنماذج تتعلم من صور صنعها البشر ومعظمها في فئات متشابهة كالمشاهد الطبيعية والشوارع والغرف الداخلية والغروب، فتصبح إعادة تشغيل “الألحان البصرية” الأكثر شيوعًا أمرًا طبيعيا.

إبداع بلا مفاجآت؟

تكشف الدراسة أن الذكاء الاصطناعي، رغم قدرته على إنتاج صور جميلة تقنيًا، لا يزال مقيدًا بإطار ضيق من التقاليد البصرية، وهذا التقييد قد يصلح للاستخدام التجاري أو الترفيهي لكنه يثير تساؤلات حول قدرة الآلة على منافسة الإبداع البشري الذي يقوم على المفاجأة والمجازفة وكسر المألوف.

spot_img
spot_imgspot_img

تابعونا على