ذات صلة

اخبار متفرقة

من المناعة إلى القلب.. فوائد صحية لعصير الجزر بالبرتقال

فوائد مباشرة للجسم يعزز مزيج عصير الجزر والبرتقال ترطيب الجسم...

باحثون يتمكنون من تصنيع مريء بالمختبر للأطفال المولودين بعيب خلقي نادر

طور باحثون في مستشفى جريت أورموند ستريت وكلية لندن...

انحراف الحاجز الأنفي: أسباب لا تتوقعها للشخير أثناء النوم

أسباب الشخير أثناء النوم يحدث الشخير عندما يتعرّض تدفّق الهواء...

كوب القهوة الصباحي.. أمراض خطيرة يمكن تفاديها

يرتبط استهلاك القهوة أحيانًا بارتفاع معدل ضربات القلب، إلا...

نفس اللوك يُثير الجدل على فيسبوك .. مقارنة بين ملك وليلي أحمد زاهر

احتفلت الفنانة ملك أحمد زاهر بخطوبتها على السيناريست شريف...

مولدات الصور بالذكاء الاصطناعى تفقدن أصالتها بسرعة، وهذا هو السبب

حدود الخيال في توليد الصور بالذكاء الاصطناعي من تجربة الهاتف المرئي

أظهر البحث الذي نُشر في Patterns أن توليدات الصور بالذكاء الاصطناعي تميل إلى الاستقرار عند عدد محدود من الأساليب البصرية المتكررة، حتى مع تنوع النصوص المدخلة.

اختبرت الدراسة نماذج شهيرة مثل Stable Diffusion XL وLLaVA، وأشارت النتائج إلى أنها تشبه موسيقى المصاعد البصرية: صور أنيقة ومصقولة لكنها تفتقد الروح الفنية وتبدو مناسبة أكثر لجدران الفنادق منها لقاعات المعارض.

جرّبت تجربة “الهاتف المرئي” لاختبار خيال الآلة، حيث بدأ الباحثون بمطالبة نصية شاعرية ثم حوّلت إلى صورة، ثم وصفت الصورة بنص بواسطة LLaVA، وأعيد الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر التبادل 100 مرة في غرفة صدى رقمية.

أظهرت النتائج أن المعنى الأصلي بدأ يتلاشى بسرعة، فبحلول الجولة العاشرة أو العشرين لم يعد هناك تشابه يذكر مع الفكرة الأصلية، لكن النتيجة كانت تقارب الوجهات البصرية المشتركة.

انتهت غالبية سلاسل الصور عبر أكثر من 1000 تجربة إلى أحد 12 نمطاً بصرياً مهيمنًا، بغض النظر عن مدى غرابة النص أو شاعرية الأسلوب.

أظهرت النتائج أن تبديل النماذج أو استخدام إصدارات مختلفة من أدوات التوليد والوصف لا يغيّر النتيجة: حتى مع التوسع إلى 1000 جولة تستقر السلسلة على نمط واحد من بين 12 نمطاً، وتبقى الاختلافات لاحقة هامشية.

تطرح النتائج أسئلة حول طبيعة الإبداع الاصطناعي، فبينما يدفع البشر عادةً إلى تفسير غير متوقع وانحراف شخصي عند نقل الفكرة، تميل النماذج إلى العودة إلى أساليب بصرية شائعة.

ترتكز بيانات التدريب على صور من صنع البشر، ومعظم المحتوى المتداول على الإنترنت ينتمي إلى فئات تقليدية مثل المناظر الطبيعية والشوارع والغرف الداخلية والغروب، وهذا يجعل النماذج تعيد تشغيل الألحان البصرية الأكثر شيوعًا.

تبيّن أن الإبداع الاصطناعي يظل مقيدًا بالتقاليد البصرية، وهو ما قد يخدم الاستخدامات التجارية أو الترفيهية لكنه يثير تساؤلات حول قدرة الآلة على منافسة الإبداع البشري القائم على المفاجأة والمجازفة.

spot_img
spot_imgspot_img

تابعونا على