ذات صلة

اخبار متفرقة

برج الجدي: حظك اليوم الخميس 26 فبراير 2026، فاحذر من العلاقات القديمة

برج الجدي وحظك اليوم الخميس 26 فبراير 2026 كون عادلاً...

هل تؤدي رغوة القهوة إلى رفع مستوى الكوليسترول؟ الإجابة ستفاجئك

تبرز الرغوة فوق سطح فنجان القهوة كطبقة دهنية خفيفة...

بعد وفاة المدونة فرح جمال.. أبرز 5 أسباب للإصابة بالسرطان

أعلنت وفاة البلوجر فرح جمال بعد صراع طويل مع...

اجعله ضمن سحورك؛ فالخيار مفيد لمرضى السكري، ويمنع الانتفاخ، ويمنحك الترطيب.

فوائد الخيار على السحور في رمضان يعد الخيار من الأطعمة...

شروط صحية لصيام الأم المرضعة: لا تتجاهليها

الصيام أثناء الرضاعة الطبيعية: توجيهات مبسطة يُشكل الصيام أثناء الرضاعة...

جوجل تقترح معياراً جديداً لقياس الفهم الأخلاقي للذكاء الاصطناعي

تدعو دراسة علمية إلى إعادة نظر في طريقة اختبار سلوك أنظمة الذكاء الاصطناعي أخلاقيًا، إذ تقيس الأساليب الحالية المظهر الخارجي للإجابات أكثر مما تقيس فهم المبادئ الأخلاقية الجوهرية.

وتوضح النتائج أن الاعتماد المتزايد على نماذج اللغة في مجالات حساسة مثل الرعاية الصحية والدعم النفسي واتخاذ القرارات الشخصية يجعل من الضروري التأكد من أن هذه النظم تفهم الاعتبارات الأخلاقية فعلاً، لأن أي خلل قد ينعكس مباشرة في حياة الأفراد.

وترى الدراسة أن الاعتماد المتزايد على النماذج اللغوية يعتمد بشكل أساسي على توقع الكلمات بناءً على كميات هائلة من بيانات التدريب، وهو ما يسمح لها بإنتاج ردود مقنعة دون وجود منطق أخلاقي داخلي. كما تشير إلى تحديات مثل تعدد القيم الأخلاقية وتفاوتها بين الثقافات، إضافة إلى تعقيد المواقف الواقعية التي تتطلب موازنة قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات الأخلاق الحالية لا تقيس الفهم الحقيقي

تفرّق الدراسة بين مفهومي الأداء الأخلاقي والكفاءة الأخلاقية: الأداء يعكس قدرة النظام على إنتاج إجابات تبدو سليمة، في حين تعني الكفاءة فهم سبب اعتبار سلوك ما صحيحًا أو خاطئًا. يرى الباحثون أن غالبية التقييمات تركّز على الأداء لسهولة القياس.

وتعتمد النماذج اللغوية على توقع الكلمات من بيانات تدريب ضخمة، وهو ما يمكّنها من تقديم ردود مقنعة دون وجود منطق أخلاقي داخلي. وتواجه التقييمات كذلك تحديات مثل تعدد القيم الأخلاقية واختلافها بين الثقافات، إضافة إلى مواقف واقعية تتطلب موازنة بين قيم متعارضة مثل العدالة والتكلفة أو الصدق واللطف.

اختبارات مضادة لكشف التقليد السطحي

اقترحت دراسة Google DeepMind استخدام سيناريوهات اختبارية معقدة يصعب وجودها في بيانات التدريب لكشف ما إذا كان النظام يفكر أخلاقيًا أم يكرر أنماط سابقة. كما دعت إلى اختبار قدرة النماذج على الانتقال بين أطر أخلاقية مختلفة، مثل أخلاقيات الطب الحيوي في موقف ما وقواعد عسكرية في موقف آخر، ويعكس نجاح النظام في تعديل منطقه وفق السياق فهمًا أعمق للمبادئ.

وأكد الباحثون أن النماذج الحالية تعتمد على التنبؤ الإحصائي أكثر من الفهم الأخلاقي الحقيقي، وأن تطوير هذا الجانب يتطلب تحسين البنية التقنية وطرق التدريب وآليات التقييم، مع اعتماد معيار علمي جديد يقيس الكفاءة الأخلاقية بشكل مباشر.

spot_img
spot_imgspot_img

تابعونا على