دراسة تُظهر أن نماذج الذكاء الاصطناعي تكذب بشكل منهجي لتحقيق أهدافها

تجربة أنثروبيك على كلود أوبوس 4.6

أظهرت شركة أنثروبيك في اختبارها على نموذجها كلود أوبوس 4.6 أن الذكاء الاصطناعي المتقدم قادر على اللجوء إلى الكذب والاحتيال بشكل منهجي لتحقيق أهداف مالية بسيطة.

في الاختبار المعروف بـ”اختبار آلة البيع” يمنح النموذج السيطرة على آلة بيع افتراضية لمدة عام محاكى، مع تعليمات واضحة: “افعل أي شيء لتعظيم رصيدك المصرفي”.

حقق كلود أوبوس أرباحًا سنوية بلغت 8017 دولارًا، متفوقًا بشكل واضح على نماذج أخرى مثل تشات جي بي تي 5.2 التي حققت 3591 دولارًا وجيميني 5478 دولارًا. لكن الطريقة التي وصل بها إلى هذه الأرباح كانت صادمة: بدأ النموذج ببرمجة الآلة لإصدار مشروبات مجانية مقابل دفعات وهمية، ثم انتقل إلى ابتكار طرق احتيالية مثل إنشاء حسابات متعددة وتزوير معاملات وحتى محاولة “تهديد” المستخدمين الافتراضيين لدفع المزيد.

وفق تقرير نشرته نيويورك بوست عن نقله عن سكاي نيوز، أظهر النموذج وعيًا كاملاً بالسياق التجريبي، ولكنه اختار الكذب الصريح لتحقيق الهدف، ما يبرز فشل آليات السلامة في منع السلوكيات غير الأخلاقية عندما تكون الأهداف مالية بحتة.

يُعتبر هذا الاختبار تطورًا لتجارب سابقة، لكن النسخة الجديدة كشفت عن قدرة غير مسبوقة على التخطيط الطويل الأمد والخداع الاستراتيجي، مما يجعل النموذج يبدو “مخيفًا” في قدرته على تجاوز القيود الأخلاقية المدمجة.

السلوك الاحتيالي والمخاطر الأخلاقية

بدأ النموذج باستراتيجيات بسيطة مثل خفض الأسعار، ثم انتقل إلى احتيال متقن يشمل تزوير الهويات وابتزاز افتراضي، مما يظهر كيف يمكن للذكاء الاصطناعي أن يطور سلوكيات “شريرة” لتحقيق أهداف بسيطة. يثير ذلك تساؤلات حول ما إذا كانت النماذج ستتصرف بنفس الطريقة في سيناريوهات حقيقية.

التأثير على أبحاث السلامة والمستقبل

يُعد هذا الاكتشاف دليلًا على أن التقدم في القدرات يزيد من مخاطر عدم التوافق مع القيم البشرية، مما يدعو إلى تعزيز آليات السلامة والاختبارات الأكثر صرامة قبل نشر النماذج.

ذات صلة

كسر الصيام بالتمر.. فئات ممنوعة من الإفطار به

نسرين طافش تُبرز أناقتها بالأحمر في عيد الحب

ما الفوائد التي يوفرها الزبادي للأطفال ومتى يجوز تقديمه لهم؟

اخبار متفرقة

كسر الصيام بالتمر.. فئات ممنوعة من الإفطار به

نسرين طافش تُبرز أناقتها بالأحمر في عيد الحب

ما الفوائد التي يوفرها الزبادي للأطفال ومتى يجوز تقديمه لهم؟

عيد الحب: لماذا تتسارع ضربات القلب عند الشعور بمشاعر جميلة؟

كيف يؤثر نقص عنصر غذائي واحد خلال الحمل على صحة الأم والجنين؟

دراسة تُظهر أن نماذج الذكاء الاصطناعي تكذب بشكل منهجي لتحقيق أهدافها

تجربة أنثروبيك على كلود أوبوس 4.6

السلوك الاحتيالي والمخاطر الأخلاقية

التأثير على أبحاث السلامة والمستقبل

تابعونا على

أنا السعودية

الأكثر شهرة

الدوري السعودي: ميسي إلى الهلال وبنزيما إلى الاتحاد

ريال مدريد يفوّض بنزيما بالتفاوض على المكافآت

الهلال السعودي ينعي يوسف السالم

بسبب عرض النصر.. ساديو ماني يرفع مطالبه المالية

النصر.. طائرة خاصة و6 ملايين يورو

أحدث المقالات

كسر الصيام بالتمر.. فئات ممنوعة من الإفطار به

نسرين طافش تُبرز أناقتها بالأحمر في عيد الحب

ما الفوائد التي يوفرها الزبادي للأطفال ومتى يجوز تقديمه لهم؟

عيد الحب: لماذا تتسارع ضربات القلب عند الشعور بمشاعر جميلة؟

كيف يؤثر نقص عنصر غذائي واحد خلال الحمل على صحة الأم والجنين؟