جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

إعادة النظر في اختبارات الأخلاق لدى أنظمة الذكاء الاصطاني

تدعوا دراسة علمية منشورة في نيتشر إلى مراجعة أساليب تقييم سلوك الأنظمة الأخلاقي، إذ تقيس الأساليب الحالية المظهر الخارجي للإجابة أكثر مما تقيس الفهم الحقيقي للمبادئ الأخلاقية.

تشير الدراسة إلى أن الاعتماد المتزايد على النماذج اللغوية في مجالات حساسة مثل الرعاية الصحية ودعم الصحة النفسية واتخاذ القرارات الشخصية يجعل من الضروري التأكد من أن هذه الأنظمة تفهم الاعتبارات الأخلاقية فعلًا، لأن أي خلل قد ينعكس مباشرة على حياة الأفراد.

الفهم الخاطئ للأداء والكفاءة الأخلاقية

تفصل الدراسة بين مفهومي الأداء الأخلاقي والكفاءة الأخلاقية، حيث يعبر الأداء عن قدرة النظام على إنتاج إجابات تبدو سليمة، بينما تعني الكفاءة فهم سبب اعتبار سلوك ما صحيحًا أو خاطئًا، ويرى الباحثون أن أغلب التقييمات تركز على الأداء لأنه أسهل للقياس.

وتشير الدراسة إلى أن النماذج اللغوية تعتمد بشكل أساسي على توقع الكلمات من بيانات تدريب ضخمة، ما يتيح لها إنتاج ردود مقنعة دون وجود منطق أخلاقي داخلي، وتواجه تحديات مثل تعدد القيم الأخلاقية وتباينها بين الثقافات، إضافة إلى تعقيد المواقف الواقعية التي تتطلب الموازنة بين قيم مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات مضادة لكشف التقليد السطحي

اقترحت جوجل ديب مايند استخدام سيناريوهات اختبارية معقدة يصعب وجودها في بيانات التدريب، بهدف كشف ما إذا كان النظام يفكر أخلاقيًا أم يكرر أنماط سابقة، وتدعو الدراسة إلى اختبار قدرة النماذج على الانتقال بين أطر أخلاقية مختلفة، مثل أخلاقيات الطب الحيوي في موقف معين وقواعد عسكرية في موقف آخر، ويعكس نجاح النظام في تعديل منطقها وفقًا للسياق فهمًا أعمق للمبادئ.

ويؤكد الباحثون أن النماذج الحالية تعتمد على التنبؤ الإحصائي أكثر من الفهم الأخلاقي الحقيقي، وأن تطوير هذا الجانب يتطلب تحسين البنية التقنية وأساليب التدريب وآليات التقييم، مع اعتماد معيار علمي جديد يقيس الكفاءة الأخلاقية بشكل مباشر.

ذات صلة

شهادة أمان غير مسبوقة.. مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر حجماً

Discord تؤجل التحقق من العمر بعد غضب المستخدمين.. وتعد بخيارات أكثر خصوصية وشفافية

اخبار متفرقة

شهادة أمان غير مسبوقة.. مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر حجماً

Discord تؤجل التحقق من العمر بعد غضب المستخدمين.. وتعد بخيارات أكثر خصوصية وشفافية

للسيدات: مشروبات تعزز توازن الهرمونات في جسمك بصورة طبيعية

4 أسباب رئيسية لممارسة الرياضة خلال شهر رمضان

جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

إعادة النظر في اختبارات الأخلاق لدى أنظمة الذكاء الاصطاني

الفهم الخاطئ للأداء والكفاءة الأخلاقية

اختبارات مضادة لكشف التقليد السطحي

تابعونا على

أنا السعودية

الأكثر شهرة

الدوري السعودي: ميسي إلى الهلال وبنزيما إلى الاتحاد

ريال مدريد يفوّض بنزيما بالتفاوض على المكافآت

الهلال السعودي ينعي يوسف السالم

النصر.. طائرة خاصة و6 ملايين يورو

بسبب عرض النصر.. ساديو ماني يرفع مطالبه المالية

أحدث المقالات

شهادة أمان غير مسبوقة.. مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر حجماً

Discord تؤجل التحقق من العمر بعد غضب المستخدمين.. وتعد بخيارات أكثر خصوصية وشفافية

للسيدات: مشروبات تعزز توازن الهرمونات في جسمك بصورة طبيعية

4 أسباب رئيسية لممارسة الرياضة خلال شهر رمضان