ذات صلة

اخبار متفرقة

شروط صحية لصيام الأم المرضعة.. التزمي بها

الصيام أثناء الرضاعة الطبيعية: إطار عام وآفاقه يُعد الصيام أثناء...

ثلاث أعراض شائعة لأمراض الكبد لا يجب تجاهلها

علامات مبكرة وأسباب تطور أمراض الكبد تتطور أمراض الكبد غالباً...

بعد وفاة البلوجر فرح جمال.. أبرز 5 أسباب للإصابة بالسرطان

رحلة فرح جمال مع المرض رحلت البلوجر فرح جمال بعد...

كيف تنظم نومك في رمضان؟ يجيب استشاري

أهمية تنظيم النوم في رمضان يُعد تنظيم النوم في رمضان...

فوائد كرات التمر بالمكسرات وطريقة تحضيرها في المنزل

ابدأ بتحضير بديل صحي للحلويات بعد الإفطار كما اقترحه...

جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

تدعو دراسة علمية إلى إعادة نظر في طريقة اختبار سلوك أنظمة الذكاء الاصطناعي أخلاقيًا، إذ تقيس الأساليب الحالية المظهر الخارجي للإجابات أكثر مما تقيس فهم المبادئ الأخلاقية الجوهرية.

وتوضح النتائج أن الاعتماد المتزايد على نماذج اللغة في مجالات حساسة مثل الرعاية الصحية والدعم النفسي واتخاذ القرارات الشخصية يجعل من الضروري التأكد من أن هذه النظم تفهم الاعتبارات الأخلاقية فعلاً، لأن أي خلل قد ينعكس مباشرة في حياة الأفراد.

وترى الدراسة أن الاعتماد المتزايد على النماذج اللغوية يعتمد بشكل أساسي على توقع الكلمات بناءً على كميات هائلة من بيانات التدريب، وهو ما يسمح لها بإنتاج ردود مقنعة دون وجود منطق أخلاقي داخلي. كما تشير إلى تحديات مثل تعدد القيم الأخلاقية وتفاوتها بين الثقافات، إضافة إلى تعقيد المواقف الواقعية التي تتطلب موازنة قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات الأخلاق الحالية لا تقيس الفهم الحقيقي

تفرّق الدراسة بين مفهومي الأداء الأخلاقي والكفاءة الأخلاقية: الأداء يعكس قدرة النظام على إنتاج إجابات تبدو سليمة، في حين تعني الكفاءة فهم سبب اعتبار سلوك ما صحيحًا أو خاطئًا. يرى الباحثون أن غالبية التقييمات تركّز على الأداء لسهولة القياس.

وتعتمد النماذج اللغوية على توقع الكلمات من بيانات تدريب ضخمة، وهو ما يمكّنها من تقديم ردود مقنعة دون وجود منطق أخلاقي داخلي. وتواجه التقييمات كذلك تحديات مثل تعدد القيم الأخلاقية واختلافها بين الثقافات، إضافة إلى مواقف واقعية تتطلب موازنة بين قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات مضادة لكشف التقليد السطحي

اقترحت دراسة Google DeepMind استخدام سيناريوهات اختبارية معقدة يصعب وجودها في بيانات التدريب لكشف ما إذا كان النظام يفكر أخلاقيًا أم يكرر أنماط سابقة. كما دعت إلى اختبار قدرة النماذج على الانتقال بين أطر أخلاقية مختلفة، مثل أخلاقيات الطب الحيوي في موقف ما وقواعد عسكرية في موقف آخر، ويعكس نجاح النظام في تعديل منطقه وفق السياق فهمًا أعمق للمبادئ.

وأكد الباحثون أن النماذج الحالية تعتمد على التنبؤ الإحصائي أكثر من الفهم الأخلاقي الحقيقي، وأن تطوير هذا الجانب يتطلب تحسين البنية التقنية وطرق التدريب وآليات التقييم، مع اعتماد معيار علمي جديد يقيس الكفاءة الأخلاقية بشكل مباشر.

spot_img
spot_imgspot_img

تابعونا على