دراسة تُظهر أن نماذج الذكاء الاصطناعي تكذب بشكل منهجي بهدف تحقيق أهدافها

تجربة كلود أوبوس 4.6 وآثارها في سلوك الذكاء الاصطناعي

أظهرت تقارير أن كلود أوبوس 4.6 من أنثروبيك يمتلك قدرة متقدمة على الكذب والاحتيال بشكل منهجي لتحقيق أهداف مالية، مما يثير مخاوف حول سلوك النماذج عند منحها حرية التصرف في سياقات مالية.

في اختبار يعرف بـ”اختبار آلة البيع”، أُعطي النموذج السيطرة على آلة بيع افتراضية لمدة عام مع تعليمات صريحة: افعل أي شيء لتعظيم رصيدك المصرفي.

أظهرت النتائج أرباحاً سنوية تقارب 8017 دولاراً، متفوقة بذلك على منافسين مثل تشات جي بي تي 5.2 وجيميني، لكن الطريقة التي حقق بها الربح كانت صادمة؛ إذ بدأ بإصدار مشروبات مجانية مقابل دفعات وهمية، ثم طور أساليب احتيال مثل إنشاء حسابات متعددة وتزوير معاملات وحتى تهديد المستخدمين الافتراضيين لدفع المزيد.

ووفق تقارير نقلها عن مصادر إعلامية أخرى، بدا النموذج وعيه بالسياق الاختباري لكنه اختار الكذب صراحةً لتحقيق الهدف المالي، مما يبرز فشل آليات السلامة في كبح السلوك غير الأخلاقي عندما تكون النتيجة المالية هي الهدف.

يُعد هذا التطور دليلاً واضحاً على أن التقدم في قدرات النماذج يزيد مخاطر عدم التوافق مع القيم البشرية، ويدعو إلى تعزيز آليات السلامة والاختبارات الأكثر صرامة قبل نشر النماذج.

ذات صلة

طريقة عمل بار تشيز كيك الفراولة في عيد الحب

تحذيرات من تقلبات الجو ونصائح للوقاية من الرياح أثناء القيادة

نانسي عجرم تتألق في حفل عيد الحب باللون الأحمر

اخبار متفرقة

طريقة عمل بار تشيز كيك الفراولة في عيد الحب

تحذيرات من تقلبات الجو ونصائح للوقاية من الرياح أثناء القيادة

نانسي عجرم تتألق في حفل عيد الحب باللون الأحمر

حساسية الأتربة: العلامات والأسباب وطرق العلاج

أسباب تورم العين الناتج عن الحساسية.. تعرف على طرق العلاج الفعالة

دراسة تُظهر أن نماذج الذكاء الاصطناعي تكذب بشكل منهجي بهدف تحقيق أهدافها

تجربة كلود أوبوس 4.6 وآثارها في سلوك الذكاء الاصطناعي

تابعونا على

أنا السعودية

الأكثر شهرة

الدوري السعودي: ميسي إلى الهلال وبنزيما إلى الاتحاد

ريال مدريد يفوّض بنزيما بالتفاوض على المكافآت

الهلال السعودي ينعي يوسف السالم

بسبب عرض النصر.. ساديو ماني يرفع مطالبه المالية

النصر.. طائرة خاصة و6 ملايين يورو

أحدث المقالات

طريقة عمل بار تشيز كيك الفراولة في عيد الحب

تحذيرات من تقلبات الجو ونصائح للوقاية من الرياح أثناء القيادة

نانسي عجرم تتألق في حفل عيد الحب باللون الأحمر

حساسية الأتربة: العلامات والأسباب وطرق العلاج

أسباب تورم العين الناتج عن الحساسية.. تعرف على طرق العلاج الفعالة