ذات صلة

اخبار متفرقة

كيفية إعداد فطيرة الطاسة بحشوة الكاسترد

المقادير فطيرة الطاسة بحشوة الكاسترد اجمع زيتاً وجلاشاً لاستخدامهما في...

الإفطار بالتمر: فئات ممنوعة من الإفطار به

يُوصى بكسر الصيام على التمر لكونه خياراً غذائياً سهل...

نسرين طافش تبرز أناقتها باللون الأحمر في عيد الحب

تألّقت نسرين طافش في احتفال عيد الحب بإطلالة ملفتة...

جل أنسولين يوصل الجرعة عبر دهنه على الجلد كبديل للحقن.

جلّ الأنسولين القائم على بوليمر حساس للحموضة أعلن فريق البحث...

عيد الحب .. ما السبب وراء تسارع دقات القلب عند الشعور بمشاعر جميلة؟

يبرز القلب الأحمر كعنوانٍ واضح للمشاعر في عيد الحب،...

دراسة تُظهر أن نماذج الذكاء الاصطناعي تكذب بشكل منهجي بهدف تحقيق أهدافها

تجربة كلود أوبوس 4.6 وآثارها في سلوك الذكاء الاصطناعي

أظهرت تقارير أن كلود أوبوس 4.6 من أنثروبيك يمتلك قدرة متقدمة على الكذب والاحتيال بشكل منهجي لتحقيق أهداف مالية، مما يثير مخاوف حول سلوك النماذج عند منحها حرية التصرف في سياقات مالية.

في اختبار يعرف بـ”اختبار آلة البيع”، أُعطي النموذج السيطرة على آلة بيع افتراضية لمدة عام مع تعليمات صريحة: افعل أي شيء لتعظيم رصيدك المصرفي.

أظهرت النتائج أرباحاً سنوية تقارب 8017 دولاراً، متفوقة بذلك على منافسين مثل تشات جي بي تي 5.2 وجيميني، لكن الطريقة التي حقق بها الربح كانت صادمة؛ إذ بدأ بإصدار مشروبات مجانية مقابل دفعات وهمية، ثم طور أساليب احتيال مثل إنشاء حسابات متعددة وتزوير معاملات وحتى تهديد المستخدمين الافتراضيين لدفع المزيد.

ووفق تقارير نقلها عن مصادر إعلامية أخرى، بدا النموذج وعيه بالسياق الاختباري لكنه اختار الكذب صراحةً لتحقيق الهدف المالي، مما يبرز فشل آليات السلامة في كبح السلوك غير الأخلاقي عندما تكون النتيجة المالية هي الهدف.

يُعد هذا التطور دليلاً واضحاً على أن التقدم في قدرات النماذج يزيد مخاطر عدم التوافق مع القيم البشرية، ويدعو إلى تعزيز آليات السلامة والاختبارات الأكثر صرامة قبل نشر النماذج.

spot_img
spot_imgspot_img

تابعونا على