إعادة النظر في اختبارات الأخلاق لدى أنظمة الذكاء الاصطاني
تدعوا دراسة علمية منشورة في نيتشر إلى مراجعة أساليب تقييم سلوك الأنظمة الأخلاقي، إذ تقيس الأساليب الحالية المظهر الخارجي للإجابة أكثر مما تقيس الفهم الحقيقي للمبادئ الأخلاقية.
تشير الدراسة إلى أن الاعتماد المتزايد على النماذج اللغوية في مجالات حساسة مثل الرعاية الصحية ودعم الصحة النفسية واتخاذ القرارات الشخصية يجعل من الضروري التأكد من أن هذه الأنظمة تفهم الاعتبارات الأخلاقية فعلًا، لأن أي خلل قد ينعكس مباشرة على حياة الأفراد.
الفهم الخاطئ للأداء والكفاءة الأخلاقية
تفصل الدراسة بين مفهومي الأداء الأخلاقي والكفاءة الأخلاقية، حيث يعبر الأداء عن قدرة النظام على إنتاج إجابات تبدو سليمة، بينما تعني الكفاءة فهم سبب اعتبار سلوك ما صحيحًا أو خاطئًا، ويرى الباحثون أن أغلب التقييمات تركز على الأداء لأنه أسهل للقياس.
وتشير الدراسة إلى أن النماذج اللغوية تعتمد بشكل أساسي على توقع الكلمات من بيانات تدريب ضخمة، ما يتيح لها إنتاج ردود مقنعة دون وجود منطق أخلاقي داخلي، وتواجه تحديات مثل تعدد القيم الأخلاقية وتباينها بين الثقافات، إضافة إلى تعقيد المواقف الواقعية التي تتطلب الموازنة بين قيم مثل العدالة والتكلفة أو الصدق واللطف.
اختبارات مضادة لكشف التقليد السطحي
اقترحت جوجل ديب مايند استخدام سيناريوهات اختبارية معقدة يصعب وجودها في بيانات التدريب، بهدف كشف ما إذا كان النظام يفكر أخلاقيًا أم يكرر أنماط سابقة، وتدعو الدراسة إلى اختبار قدرة النماذج على الانتقال بين أطر أخلاقية مختلفة، مثل أخلاقيات الطب الحيوي في موقف معين وقواعد عسكرية في موقف آخر، ويعكس نجاح النظام في تعديل منطقها وفقًا للسياق فهمًا أعمق للمبادئ.
ويؤكد الباحثون أن النماذج الحالية تعتمد على التنبؤ الإحصائي أكثر من الفهم الأخلاقي الحقيقي، وأن تطوير هذا الجانب يتطلب تحسين البنية التقنية وأساليب التدريب وآليات التقييم، مع اعتماد معيار علمي جديد يقيس الكفاءة الأخلاقية بشكل مباشر.



