ذات صلة

اخبار متفرقة

تحذير من الشاي بالحليب مع كحك العيد: الأضرار ونصائح لتناوله بشكل صحي

يزداد الإقبال في عيد الفطر على شرب الشاي باللبن...

طريقة إعداد سلطة الرنجة في العيد: وصفة سريعة بطعم مميز

ابدأ بتحضير سلطة الرنجة التي تعد من أطباق العيد...

مشروبات لترطيب جسمك بعد تناول الرنجة والفسيخ في العيد

يواجه كثيرون الشعور بالعطش والجفاف بعد تناول الرنجة والفسيخ...

الهند تستعد لإطلاق حقن رخيصة الثمن لإنقاص الوزن

تعلن الهند عن استعدادها لإطلاق دواء جديد يحاكي آلية...

صحتك بالدنيا.. تجنب أضرار سوء تنظيم الأكل في العيد وشروط تناول الرنجة للحوامل

تجنب مخاطر الرنجة والأسماك المملحة أثناء الحمل باتباع شروط...

مولدات الصور بالذكاء الاصطناعى تفقدن أصالتها بسرعة، وهذا هو السبب

حدود الخيال في توليد الصور بالذكاء الاصطناعي من تجربة الهاتف المرئي

أظهر البحث الذي نُشر في Patterns أن توليدات الصور بالذكاء الاصطناعي تميل إلى الاستقرار عند عدد محدود من الأساليب البصرية المتكررة، حتى مع تنوع النصوص المدخلة.

اختبرت الدراسة نماذج شهيرة مثل Stable Diffusion XL وLLaVA، وأشارت النتائج إلى أنها تشبه موسيقى المصاعد البصرية: صور أنيقة ومصقولة لكنها تفتقد الروح الفنية وتبدو مناسبة أكثر لجدران الفنادق منها لقاعات المعارض.

جرّبت تجربة “الهاتف المرئي” لاختبار خيال الآلة، حيث بدأ الباحثون بمطالبة نصية شاعرية ثم حوّلت إلى صورة، ثم وصفت الصورة بنص بواسطة LLaVA، وأعيد الوصف إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر التبادل 100 مرة في غرفة صدى رقمية.

أظهرت النتائج أن المعنى الأصلي بدأ يتلاشى بسرعة، فبحلول الجولة العاشرة أو العشرين لم يعد هناك تشابه يذكر مع الفكرة الأصلية، لكن النتيجة كانت تقارب الوجهات البصرية المشتركة.

انتهت غالبية سلاسل الصور عبر أكثر من 1000 تجربة إلى أحد 12 نمطاً بصرياً مهيمنًا، بغض النظر عن مدى غرابة النص أو شاعرية الأسلوب.

أظهرت النتائج أن تبديل النماذج أو استخدام إصدارات مختلفة من أدوات التوليد والوصف لا يغيّر النتيجة: حتى مع التوسع إلى 1000 جولة تستقر السلسلة على نمط واحد من بين 12 نمطاً، وتبقى الاختلافات لاحقة هامشية.

تطرح النتائج أسئلة حول طبيعة الإبداع الاصطناعي، فبينما يدفع البشر عادةً إلى تفسير غير متوقع وانحراف شخصي عند نقل الفكرة، تميل النماذج إلى العودة إلى أساليب بصرية شائعة.

ترتكز بيانات التدريب على صور من صنع البشر، ومعظم المحتوى المتداول على الإنترنت ينتمي إلى فئات تقليدية مثل المناظر الطبيعية والشوارع والغرف الداخلية والغروب، وهذا يجعل النماذج تعيد تشغيل الألحان البصرية الأكثر شيوعًا.

تبيّن أن الإبداع الاصطناعي يظل مقيدًا بالتقاليد البصرية، وهو ما قد يخدم الاستخدامات التجارية أو الترفيهية لكنه يثير تساؤلات حول قدرة الآلة على منافسة الإبداع البشري القائم على المفاجأة والمجازفة.

spot_img
spot_imgspot_img

تابعونا على