ذات صلة

اخبار متفرقة

أبل تطلق النسخة التجريبية العامة الثانية من macOS Tahoe 26.4

مميزات تحديث macOS Tahoe 26.4 أعلنت آبل عن إتاحة النسخة...

شهادة أمان غير مسبوقة: مانتيس تطلق أول روبوت صناعي سريع يعمل دون حواجز

أحدثت شركة مانتيس روبوتيكس إنجازاً تاريخياً غير مسبوق في...

آيفون 18 برو وآيفون 18 برو ماكس يقدمان Dynamic Island أصغر

تصغير الجزيرة الديناميكية في آيفون 18 برو وماكس تؤكد تقارير...

موناليزا من البلاستيك.. جدارية ضخمة فى السلفادور تعيد تعريف العلاقة بين الفن والبيئة

أطلق الفنان الفنزويلي أوسكار أوليفاريس مشروعاً فنياً ضخماً في...

للسيدات: مشروبات تدعم توازن الهرمونات داخل جسمك بصورة طبيعية

يؤثر توازن الهرمونات لدى النساء في عدد من الأعراض...

جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

تدعو دراسة علمية إلى إعادة نظر في طريقة اختبار سلوك أنظمة الذكاء الاصطناعي أخلاقيًا، إذ تقيس الأساليب الحالية المظهر الخارجي للإجابات أكثر مما تقيس فهم المبادئ الأخلاقية الجوهرية.

وتوضح النتائج أن الاعتماد المتزايد على نماذج اللغة في مجالات حساسة مثل الرعاية الصحية والدعم النفسي واتخاذ القرارات الشخصية يجعل من الضروري التأكد من أن هذه النظم تفهم الاعتبارات الأخلاقية فعلاً، لأن أي خلل قد ينعكس مباشرة في حياة الأفراد.

وترى الدراسة أن الاعتماد المتزايد على النماذج اللغوية يعتمد بشكل أساسي على توقع الكلمات بناءً على كميات هائلة من بيانات التدريب، وهو ما يسمح لها بإنتاج ردود مقنعة دون وجود منطق أخلاقي داخلي. كما تشير إلى تحديات مثل تعدد القيم الأخلاقية وتفاوتها بين الثقافات، إضافة إلى تعقيد المواقف الواقعية التي تتطلب موازنة قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات الأخلاق الحالية لا تقيس الفهم الحقيقي

تفرّق الدراسة بين مفهومي الأداء الأخلاقي والكفاءة الأخلاقية: الأداء يعكس قدرة النظام على إنتاج إجابات تبدو سليمة، في حين تعني الكفاءة فهم سبب اعتبار سلوك ما صحيحًا أو خاطئًا. يرى الباحثون أن غالبية التقييمات تركّز على الأداء لسهولة القياس.

وتعتمد النماذج اللغوية على توقع الكلمات من بيانات تدريب ضخمة، وهو ما يمكّنها من تقديم ردود مقنعة دون وجود منطق أخلاقي داخلي. وتواجه التقييمات كذلك تحديات مثل تعدد القيم الأخلاقية واختلافها بين الثقافات، إضافة إلى مواقف واقعية تتطلب موازنة بين قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات مضادة لكشف التقليد السطحي

اقترحت دراسة Google DeepMind استخدام سيناريوهات اختبارية معقدة يصعب وجودها في بيانات التدريب لكشف ما إذا كان النظام يفكر أخلاقيًا أم يكرر أنماط سابقة. كما دعت إلى اختبار قدرة النماذج على الانتقال بين أطر أخلاقية مختلفة، مثل أخلاقيات الطب الحيوي في موقف ما وقواعد عسكرية في موقف آخر، ويعكس نجاح النظام في تعديل منطقه وفق السياق فهمًا أعمق للمبادئ.

وأكد الباحثون أن النماذج الحالية تعتمد على التنبؤ الإحصائي أكثر من الفهم الأخلاقي الحقيقي، وأن تطوير هذا الجانب يتطلب تحسين البنية التقنية وطرق التدريب وآليات التقييم، مع اعتماد معيار علمي جديد يقيس الكفاءة الأخلاقية بشكل مباشر.

spot_img
spot_imgspot_img

تابعونا على