ذات صلة

اخبار متفرقة

ثلاثة أبراج في عام 2026.. ما الحظ لهم، وأنت منهم؟

برج الثور تدفعك الشمس في برج الجدي إلى إعادة تقييم...

عادة يومية لتخفيف التوتر وتحسين نومك

ابدأ بممارسة التأمل بانتظام لتحقيق فوائد صحية متعددة، منها...

إفطار اليوم.. طريقة تحضير العجة بخطوات سريعة

مكونات العجة ابدأ بخفق أربع بيضات في وعاء حتى تتجانس...

كيف تنظف جسمك من سمومه.. مشروبات وأكلات ونصائح

اعتمد الجسم بين الحين والآخر فترة راحة داخلية يعيد...

أربعة أسباب للرغبة في تناول الحلويات عند الإفطار، من بينها الحرمان من النوم.

يتوق جسمك في الصباح إلى السكر لأسباب عدة، وهذا...

مولدات الصور بالذكاء الاصطناعي تفقد أصالتها بسرعة بسبب هذا السبب

تكشف دراسة جديدة أن مولدات الصور المعتمدة على الذكاء الاصطناعي تواجه حدودًا واضحة في الخيال البصري، فعند إعادة تفسير الصور مرارًا، تميل إلى التخلي عن التفرد والاستقرار في عدد محدود من الأساليب البصرية المتكررة، لا يتجاوز 12 نمطًا.

اختبرت الدراسة نماذج شهيرة مثل Stable Diffusion XL وLLaVA، ووصفت النتائج بأنها أشبه بـ«موسيقى المصاعد البصرية»: صورًا أنيقة ومصقولة لكنها بلا روح فنية حقيقية، وتصلح أكثر لجدران الفنادق منها لقاعات المعارض.

تجربة الهاتف المرئي

لاختبار حدود الإبداع لدى الذكاء الاصطناعي، صممت التجربة ما أسمته لعبة الهاتف المرئي، مستوحاة من لعبة الأطفال حيث يتغير المعنى مع انتقال الرسالة بين الأشخاص.

بدأت التجربة بتوجيه نموذج Stable Diffusion XL نصًا شعريًا يقول: «بينما كنت أجلس وحيدًا وسط الطبيعة، عثرت على كتاب قديم من ثماني صفحات فقط، يحكي قصة بلغة منسية تنتظر من يقرأها ويفهمها».

حوّل النص إلى صورة، ثم وصفتها LLaVA بالكلمات، وأعيدت هذه الوصفية النصية إلى Stable Diffusion لإنتاج صورة جديدة، وتكرر التبادل بين الصورة والوصف 100 مرة متتالية في غرفة صدى رقمية مغلقة.

كما هو متوقع في لعبة الهاتف، بدأ المعنى الأصلي في التلاشي بسرعة، فبحلول الجولة العاشرة أو العشرين لم يعد هناك تشابه يُذكر بين الصورة الجديدة والفكرة الأولى، لكن المفاجأة كانت في التقارب. عبر أكثر من 1000 تجربة مختلفة، لاحظ الباحثون أن النماذج كانت تنتهي تقريبًا إلى نفس الوجهات البصرية: منارات، أفق مدن ليلية، عمارة ريفية، مشاهد داخلية عامة، وصور مألوفة تفتقر إلى الجرأة أو الغرابة.

12 نمطًا بصريًا تهيمن على الخيال الاصطناعي

تخلص الدراسة إلى أن جميع سلاسل الصور تقريبًا كانت «تنهار» في نهاية المطاف إلى واحد من 12 نمطًا بصريًا مهيمنًا، بغض النظر عن مدى غرابة أو شاعرية أو تجريد النص الأصلي، فإن النتيجة النهائية كانت دائمًا صورة تبدو مألوفة بشكل مقلق.

يحدث التحول عادة بشكل تدريجي، حيث تفقد الصور خصوصيتها جولة بعد أخرى، وأحيانًا يقع الانهيار فجأة لتتحول السلسلة إلى مشهد نمطي بلا ملامح فنية مميزة، لكن الوجهة النهائية كانت واحدة دائمًا.

تغيير النماذج لا يغيّر النتيجة

حتى عند استبدال النماذج المستخدمة، أو استخدام إصدارات مختلفة من أدوات التوليد والوصف، استمرت الظاهرة نفسها؛ فلمدى 1000 جولة، تستقر السلسلة على نمط واحد وتكون الاختلافات لاحقة مجرد فروقات طفيفة على الفكرة نفسها. وجاء في الدراسة أنه عبر 1000 تكرار للعبة الهاتف، انتهت معظم سلاسل الصور إلى واحد من 12 نمطًا بصريًا مهيمنًا.

ماذا يعني ذلك للإبداع الاصطناعي؟

يرى الباحثون أن هذه النتائج تفتح أسئلة حول طبيعة الإبداع لدى الذكاء الاصطناعي: بينما يدخل البشر عادةً تفسيرات غير متوقعة وانحرافات شخصية عند نقل الأفكار، تميل النماذج الذكية إلى تنعيم الاختلافات وإزالة الشذوذ. وتوضح الدراسة أن الذكاء الاصطناعي يتعلم من صور أنشأها البشر ومعظمها يندرج في فئات متشابهة، فتصبح «الألحان البصرية» الأكثر شيوعًا هي المسيطر في النتائج.

إدراك الإبداع الاصطناعي هنا يشير إلى أنه، بالرغم من إنتاجه صورًا جميلة تقنيًا، يبقى مقيدًا بإطار ضيق من التقاليد البصرية، ما يمنحَه أفخاخًا مشتركة وقدرة أقل على المفاجأة والمجازفة مقارنة بالإبداع البشري الذي يقوم على التفسير الشخصي والتجريب غير المبرمج.

إبداع بلا مفاجآت؟

إذ تبين أن الذكاء الاصطناعي، رغم قدرته التقنية العالية، يقع ضمن إطار تقاليدي بصري محدود. قد يكون ذلك كافيًا لأغراض تجارية أو ترفيهية، لكنه يطرح تساؤلات حول قدرته على منافسة الإبداع البشري الحقيقي القائم على المفاجأة وكسر المألوف.

spot_img
spot_imgspot_img

تابعونا على