ذات صلة

اخبار متفرقة

هل حلاقة الشعر في المناطق الحساسة تشكل ضررًا للنساء؟.. مخاطر قد لا تعرفها

السلامة والطرق الصحيحة لحلاقة شعر العانة تعتبر حلاقة شعر العانة...

تحذير من تناول الشاي بالحليب مع كحك العيد: أضراره ونصائح لتناوله بشكل صحي

يتصدر الشاي باللبن مع كحك العيد قائمة المشروبات المفضلة...

خلال عيد الفطر احرص على تناول تلك الأطعمة لضبط مستويات السكر

ابدأ بتنظيم النظام الغذائي في عيد الفطر ليختلف عن...

مشروبات ترطب جسمك بعد تناول الرنجة والفسيخ في العيد

تشتهر أكلات العيد التقليدية بمكانة كبيرة في المائدة، خصوصًا...

الهند تستعد لإطلاق حقن رخيصة الثمن لإنقاص الوزن

تستعد الهند لإطلاق نسخ جنيسة منخفضة التكلفة من حقن...

مولدات الصور بالذكاء الاصطناعى تفقدن أصالتها بسرعة، وهذا هو السبب

حدود الخيال في توليد الصور بالذكاء الاصطناعي من تجربة الهاتف المرئي

أظهر البحث الذي نُشر في Patterns أن توليدات الصور بالذكاء الاصطناعي تميل إلى الاستقرار عند عدد محدود من الأساليب البصرية المتكررة، حتى مع تنوع النصوص المدخلة.

اختبرت الدراسة نماذج شهيرة مثل Stable Diffusion XL وLLaVA، وأشارت النتائج إلى أنها تشبه موسيقى المصاعد البصرية: صور أنيقة ومصقولة لكنها تفتقد الروح الفنية وتبدو مناسبة أكثر لجدران الفنادق منها لقاعات المعارض.

جرّبت تجربة “الهاتف المرئي” لاختبار خيال الآلة، حيث بدأ الباحثون بمطالبة نصية شاعرية ثم حوّلت إلى صورة، ثم وصفت الصورة بنص بواسطة LLaVA، وأعيد الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر التبادل 100 مرة في غرفة صدى رقمية.

أظهرت النتائج أن المعنى الأصلي بدأ يتلاشى بسرعة، فبحلول الجولة العاشرة أو العشرين لم يعد هناك تشابه يذكر مع الفكرة الأصلية، لكن النتيجة كانت تقارب الوجهات البصرية المشتركة.

انتهت غالبية سلاسل الصور عبر أكثر من 1000 تجربة إلى أحد 12 نمطاً بصرياً مهيمنًا، بغض النظر عن مدى غرابة النص أو شاعرية الأسلوب.

أظهرت النتائج أن تبديل النماذج أو استخدام إصدارات مختلفة من أدوات التوليد والوصف لا يغيّر النتيجة: حتى مع التوسع إلى 1000 جولة تستقر السلسلة على نمط واحد من بين 12 نمطاً، وتبقى الاختلافات لاحقة هامشية.

تطرح النتائج أسئلة حول طبيعة الإبداع الاصطناعي، فبينما يدفع البشر عادةً إلى تفسير غير متوقع وانحراف شخصي عند نقل الفكرة، تميل النماذج إلى العودة إلى أساليب بصرية شائعة.

ترتكز بيانات التدريب على صور من صنع البشر، ومعظم المحتوى المتداول على الإنترنت ينتمي إلى فئات تقليدية مثل المناظر الطبيعية والشوارع والغرف الداخلية والغروب، وهذا يجعل النماذج تعيد تشغيل الألحان البصرية الأكثر شيوعًا.

تبيّن أن الإبداع الاصطناعي يظل مقيدًا بالتقاليد البصرية، وهو ما قد يخدم الاستخدامات التجارية أو الترفيهية لكنه يثير تساؤلات حول قدرة الآلة على منافسة الإبداع البشري القائم على المفاجأة والمجازفة.

spot_img
spot_imgspot_img

تابعونا على