جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

تدعو دراسة علمية إلى إعادة نظر في طريقة اختبار سلوك أنظمة الذكاء الاصطناعي أخلاقيًا، إذ تقيس الأساليب الحالية المظهر الخارجي للإجابات أكثر مما تقيس فهم المبادئ الأخلاقية الجوهرية.

وتوضح النتائج أن الاعتماد المتزايد على نماذج اللغة في مجالات حساسة مثل الرعاية الصحية والدعم النفسي واتخاذ القرارات الشخصية يجعل من الضروري التأكد من أن هذه النظم تفهم الاعتبارات الأخلاقية فعلاً، لأن أي خلل قد ينعكس مباشرة في حياة الأفراد.

وترى الدراسة أن الاعتماد المتزايد على النماذج اللغوية يعتمد بشكل أساسي على توقع الكلمات بناءً على كميات هائلة من بيانات التدريب، وهو ما يسمح لها بإنتاج ردود مقنعة دون وجود منطق أخلاقي داخلي. كما تشير إلى تحديات مثل تعدد القيم الأخلاقية وتفاوتها بين الثقافات، إضافة إلى تعقيد المواقف الواقعية التي تتطلب موازنة قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات الأخلاق الحالية لا تقيس الفهم الحقيقي

تفرّق الدراسة بين مفهومي الأداء الأخلاقي والكفاءة الأخلاقية: الأداء يعكس قدرة النظام على إنتاج إجابات تبدو سليمة، في حين تعني الكفاءة فهم سبب اعتبار سلوك ما صحيحًا أو خاطئًا. يرى الباحثون أن غالبية التقييمات تركّز على الأداء لسهولة القياس.

وتعتمد النماذج اللغوية على توقع الكلمات من بيانات تدريب ضخمة، وهو ما يمكّنها من تقديم ردود مقنعة دون وجود منطق أخلاقي داخلي. وتواجه التقييمات كذلك تحديات مثل تعدد القيم الأخلاقية واختلافها بين الثقافات، إضافة إلى مواقف واقعية تتطلب موازنة بين قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات مضادة لكشف التقليد السطحي

اقترحت دراسة Google DeepMind استخدام سيناريوهات اختبارية معقدة يصعب وجودها في بيانات التدريب لكشف ما إذا كان النظام يفكر أخلاقيًا أم يكرر أنماط سابقة. كما دعت إلى اختبار قدرة النماذج على الانتقال بين أطر أخلاقية مختلفة، مثل أخلاقيات الطب الحيوي في موقف ما وقواعد عسكرية في موقف آخر، ويعكس نجاح النظام في تعديل منطقه وفق السياق فهمًا أعمق للمبادئ.

وأكد الباحثون أن النماذج الحالية تعتمد على التنبؤ الإحصائي أكثر من الفهم الأخلاقي الحقيقي، وأن تطوير هذا الجانب يتطلب تحسين البنية التقنية وطرق التدريب وآليات التقييم، مع اعتماد معيار علمي جديد يقيس الكفاءة الأخلاقية بشكل مباشر.

ذات صلة

أبل تطلق النسخة التجريبية العامة الثانية من macOS Tahoe 26.4

شهادة أمان غير مسبوقة: مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر

اخبار متفرقة

أبل تطلق النسخة التجريبية العامة الثانية من macOS Tahoe 26.4

شهادة أمان غير مسبوقة: مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر

موناليزا من البلاستيك.. جدارية ضخمة فى السلفادور تعيد تعريف العلاقة بين الفن والبيئة

للسيدات: مشروبات تدعم توازن الهرمونات داخل جسمك بصورة طبيعية

جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

اختبارات الأخلاق الحالية لا تقيس الفهم الحقيقي

اختبارات مضادة لكشف التقليد السطحي

تابعونا على

أنا السعودية

الأكثر شهرة

الدوري السعودي: ميسي إلى الهلال وبنزيما إلى الاتحاد

ريال مدريد يفوّض بنزيما بالتفاوض على المكافآت

الهلال السعودي ينعي يوسف السالم

النصر.. طائرة خاصة و6 ملايين يورو

بسبب عرض النصر.. ساديو ماني يرفع مطالبه المالية

أحدث المقالات

أبل تطلق النسخة التجريبية العامة الثانية من macOS Tahoe 26.4

شهادة أمان غير مسبوقة: مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر

موناليزا من البلاستيك.. جدارية ضخمة فى السلفادور تعيد تعريف العلاقة بين الفن والبيئة

للسيدات: مشروبات تدعم توازن الهرمونات داخل جسمك بصورة طبيعية