ذات صلة

اخبار متفرقة

التفاصيل الكاملة لعرض التوظيف في شركات إيلون ماسك: كلمة السر Grok AI

تفتح شركة xAI باب التوظيف لمهندسي أندرويد عالميين للانضمام...

كيف تشاهد ريلز إنستغرام وتتصفح القنوات وتستخدم الحسابات على التلفزيون؟

تجربة إنستجرام على الشاشة المنزلية ابدأ الاختبار بتوفير تطبيق إنستجرام...

في ظل البرودة الشديدة.. كيف تحمي نفسك من التهاب الجيوب الأنفية؟

خطوات أساسية لتقليل خطر التهاب الجيوب الأنفية وتخفيف الأعراض ابدأ...

السلمون من أقوى الأطعمة التي تحتوي على فيتامين د

أقوى الأطعمة التي تحتوي على فيتامين د يُعَد السلمون من...

بعد حلقة صاحبة السعادة .. عشر صور جمعت بين العوضي وياسمين عبد العزيز

استضافت الإعلامية إسعاد يونس الفنان أحمد العوضي في برنامج...

مولدات الصور بالذكاء الاصطناعى تفقدن أصالتها بسرعة، وهذا هو السبب

حدود الخيال في توليد الصور بالذكاء الاصطناعي من تجربة الهاتف المرئي

أظهر البحث الذي نُشر في Patterns أن توليدات الصور بالذكاء الاصطناعي تميل إلى الاستقرار عند عدد محدود من الأساليب البصرية المتكررة، حتى مع تنوع النصوص المدخلة.

اختبرت الدراسة نماذج شهيرة مثل Stable Diffusion XL وLLaVA، وأشارت النتائج إلى أنها تشبه موسيقى المصاعد البصرية: صور أنيقة ومصقولة لكنها تفتقد الروح الفنية وتبدو مناسبة أكثر لجدران الفنادق منها لقاعات المعارض.

جرّبت تجربة “الهاتف المرئي” لاختبار خيال الآلة، حيث بدأ الباحثون بمطالبة نصية شاعرية ثم حوّلت إلى صورة، ثم وصفت الصورة بنص بواسطة LLaVA، وأعيد الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر التبادل 100 مرة في غرفة صدى رقمية.

أظهرت النتائج أن المعنى الأصلي بدأ يتلاشى بسرعة، فبحلول الجولة العاشرة أو العشرين لم يعد هناك تشابه يذكر مع الفكرة الأصلية، لكن النتيجة كانت تقارب الوجهات البصرية المشتركة.

انتهت غالبية سلاسل الصور عبر أكثر من 1000 تجربة إلى أحد 12 نمطاً بصرياً مهيمنًا، بغض النظر عن مدى غرابة النص أو شاعرية الأسلوب.

أظهرت النتائج أن تبديل النماذج أو استخدام إصدارات مختلفة من أدوات التوليد والوصف لا يغيّر النتيجة: حتى مع التوسع إلى 1000 جولة تستقر السلسلة على نمط واحد من بين 12 نمطاً، وتبقى الاختلافات لاحقة هامشية.

تطرح النتائج أسئلة حول طبيعة الإبداع الاصطناعي، فبينما يدفع البشر عادةً إلى تفسير غير متوقع وانحراف شخصي عند نقل الفكرة، تميل النماذج إلى العودة إلى أساليب بصرية شائعة.

ترتكز بيانات التدريب على صور من صنع البشر، ومعظم المحتوى المتداول على الإنترنت ينتمي إلى فئات تقليدية مثل المناظر الطبيعية والشوارع والغرف الداخلية والغروب، وهذا يجعل النماذج تعيد تشغيل الألحان البصرية الأكثر شيوعًا.

تبيّن أن الإبداع الاصطناعي يظل مقيدًا بالتقاليد البصرية، وهو ما قد يخدم الاستخدامات التجارية أو الترفيهية لكنه يثير تساؤلات حول قدرة الآلة على منافسة الإبداع البشري القائم على المفاجأة والمجازفة.

spot_img
spot_imgspot_img

تابعونا على