ذات صلة

اخبار متفرقة

بهذه الطريقة تؤثر مشروبات الطاقة في صحة قلبك والأوعية الدموية

تُعَد مشروبات الطاقة خياراً شائعاً يتناوله الملايين حول العالم،...

توقف عن التعامل مع كل شيء كأنه حالة طارئة، فكيف تتحرر من التسرع المزمن؟

تشعر بأن حياتك سريعة الإيقاع تتحول إلى سباق دائم...

وصفة مكرونة بالطاسة الواحدة بدون سلق خلال 15 دقيقة

ابدأ بتحضير مكرونة الطاسة الواحدة بدون سلق في 15...

لماذا يزيد الوزن بعد الرجيم؟ يقدم استشاري تغذية 5 حلول | فيديو

أوضح الدكتور أحمد صبري، استشاري التغذية ونحت القوام، أن...

تخسر مولدات الصور المدعومة بالذكاء الاصطناعي أصالتها بسرعة بسبب هذا السبب

أظهرت دراسة جديدة أن مولدات الصور المعتمدة على الذكاء الاصطناعي تواجه حدودًا واضحة في الخيال البصري، إذ تتجه غالبًا إلى تقليل التنوع والتكرار في الأساليب البصرية عند إعادة تفسير الصور.

نشرت الدراسة في دورية Patterns واختبرت نماذج شهيرة مثل Stable Diffusion XL وLLaVA، ووصف الباحثون النتائج بأنها تشبه «موسيقى المصاعد البصرية»: صور أنيقة ومصقولة، لكنها تفتقر إلى روح فنية حقيقية وتبدو مألوفة إلى حد الملل وتصلح أكثر لزينة جدران الفنادق من أنها تليق بالمعارض الفنية.

ولتقييم مدى خيال الآلة، صُمِّمت تجربة أطلق عليها الباحثون اسم «لعبة الهاتف المرئي»، تبدأ بتقديم نموذج Stable Diffusion XL طلبًا نصيًا شعريًا يصف فكرة عامة ثم يحوّله إلى صورة وتُحوِّل الصورة إلى وصف لفظي باستخدام نموذج LLaVA، ثم يُعاد الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرار ذلك التبادل بين الصورة والوصف 100 مرة متتالية في فضاء رقمي مغلق.

ثم يبدأ تلاشي المعنى الأصلي، فبحلول الجولة العاشرة أو العشرين يبدأ الاختلاف في الزوال، وتتشابه النتائج بشكل كبير عبر جولات متتالية، لكن المفاجأة ليست في التشويه بل في التقارب؛ حيث استمرت أكثر من 1000 تجربة في ملاحظة أن النماذج تقطع مسارها عادةً إلى الوجهات البصرية نفسها، مثل المنارات وأفق مدن ليلية وعمارة ريفية ومشاهد داخلية عامة وصور مألوفة تفتقر إلى الجرأة أو الغرابة.

وتوصلت النتائج إلى أن سلاسل الصور تقريبًا تنهار إلى واحد من 12 نمطًا بصريًا مهيمنًا، بغض النظر عن مدى غرابة النص الأصلي أو تجريده، وتتلاشى الخصوصية تدريجيًا حتى تتحول الجولة الأخيرة إلى صورة تلتزم بهذا النمط المهيمن.

وعند تمديد التجربة إلى 1000 جولة، تعززت النتيجة أكثر، فبحلول الجولة المئة تقريبًا تستقر السلسلة على نمط واحد وتتحول الجولات اللاحقة إلى فروق بسيطة ضمن الفكرة نفسها، وهو ما يعني أن معظم سلاسل الصور تنتهي إلى واحد من 12 نمطًا بصريًا رئيسيًا.

تشير هذه النتائج إلى أن الإبداع الاصطناعي يواجه تحديًا في إدخال التفسيرات غير المتوقعة والانحرافات الشخصية كما يفعل البشر، فبينما يسعى البشر لإضفاء لمسات فردية عند نقل الأفكار، يعاني الذكاء الاصطناعي من مشكلة معاكسة جزئيًا؛ فمهما كان النص الأصلي غريبًا، يعود النموذج إلى مجموعة ضيقة من الأساليب بسبب طبيعة بيانات التدريب التي تعتمد على صور منشورة على الإنترنت وتكون غالبًا في فئات تتكرر مثل المناظر الطبيعية والشوارع والغروب، ولذلك يصعب استعادة «الألحان البصرية» غير التقليدية.

تظهر النتائج أن الإبداع الاصطناعي، رغم قدرته على إنتاج صور جميلة تقنيًا، يظل مقيدًا بإطار تقاليدي بصري، وهو ما يثير تساؤلات حول قدرته على منافسة الإبداع البشري القائم على المفاجأة والمجازفة وكسر المألوف، خاصة عند الاعتماد على بيانات تدريب تميل إلى تكرار الأنماط البصرية الشائعة.

spot_img
spot_imgspot_img

تابعونا على