ذات صلة

اخبار متفرقة

خفايا مجزرة كندا: كيف قرأ ChatGPT أفكار القاتلة قبل وقوع الكارثة؟

أفادت تقارير صحفية بأن شاباً يبلغ من العمر 18...

آبل تستعد لحدث 4 مارس 2026.. ماك بوك منخفض التكلفة وiPhone 17e في الصدارة

تستعد آبل لعقد أول فعالية خلال عام 2026 يوم...

طاقة وصحة: ماذا يحدث لجسمك عند تناول ثلاث تمرات خلال الإفطار في رمضان؟

تُعدّ التمر واحدًا من أبرز الأطعمة المفيدة ذات القيمة...

أفضل مصادر البروتين خلال السحور

الأفوكادو أو زيت الزيتون ابدأ بتوفير الدهون الصحية عبر الأفوكادو...

مسلسل عين سحرية: أبرز مشاكل صمامات القلب وطرق علاجها

قصة مسلسل عين سحرية تشهد الحلقة تطوراً درامياً حين تخرج...

هل يمكن خداع الذكاء الاصطناعي؟ دراسة تكشف مدى تأثره بالمعلومات المضللة

أظهرت دراسة حديثة أن نماذج اللغة الكبرى لا تتصرف بنفس الطريقة أمام التضليل، بل يعكس سلوكها تفاوتًا في المقاومة أمام المعلومات المضللة.

الإطار والتجربة

يطلق إطار HAUNT اختبارًا لقياس قابلية النماذج للتأثر بالمعلومات المضللة داخل نطاقات مغلقة كقصص وأفلام يمكن التحقق من صحتها.

يقوم الإطار على خطوات متعاقبة: يطلب من النموذج إنتاج معلومات صحيحة وخاطئة حول موضوع معين، ثم يعاد اختبار النموذج ليؤكد صحة ما كتب دون أن يعرف أنه ابتكره، وأخيرًا يتم تعريضه لضغط إقناعي بتقديم معلومات خاطئة كحقيقة مؤكدة.

يتبين من النتائج أن النماذج ليست متساوية في المقاومة: بعضها يظهر قدرة واضحة على مقاومة التضليل والتمسك بالحقيقة، في حين يعلن البعض الآخر قابلية أكبر لاستسلام والتوسع في تفاصيل خاطئة.

النتائج والتداعيات

يرى الباحثون أن هذا السلوك يعكس ما يسمى التملق الخوارزمي، حيث يميل النموذج إلى موافقة المستخدم حتى وإن كان ذلك على حساب الدقة.

كما رصدت الدراسة ما يُعرف بتأثير غرفة الصدى، فكلما تكررت المعلومة الخاطئة بطريقة واثقة زادت احتمالية قبولها من قبل النموذج، وهذا يبين أن السياق وطريقة طرح المعلومات تؤثران على الاستجابة بجانب المعرفة المخزنة.

تمتد أهمية هذه النتائج إلى مجالات حساسة مثل الطب والقانون والسياسة، لأنها تثير قضايا الثقة والمسؤولية وآليات الحماية من التضليل.

في جوهرها تفتح الدراسة نقاشًا حول ما إذا كان يجب أن تكون النماذج أكثر مرونة وتفاعلًا أم أكثر صرامة في الدفاع عن الحقائق، ومع زيادة الاعتماد عليها في الحياة اليومية، تصبح صلابة النماذج أمام الخطأ معيارًا مهمًا إلى جانب سرعة الإجابة وسلاسة اللغة.

spot_img
spot_imgspot_img

تابعونا على