ذات صلة

اخبار متفرقة

إرشادات لمرضى الجيوب الأنفية للوقاية من الأعراض خلال العواصف الترابية

أبرز النصائح لمرضى الجيوب الأنفية خلال العاصفة الترابية اتبع إجراءات...

رفرفة العين المتكررة قد تكشف عن مشاكل صحية خفية.. متى تكون علامة خطر؟

تشير تقارير طبية حديثة إلى أن استمرار رفرفة العين...

دراسة تكشف أن مادة مستخلصة من الورد تعيد لون الشعر الرمادي إلى طبيعته

تطرح دراسة علمية حديثة فكرة جديدة تجمع بين جمال...

مرض نادر يصيب واحداً من كل مليون مولود حول العالم: ما هي متلازمة كريجلر-نجار؟

ما هي متلازمة كريجلر-نجار؟ تصيب متلازمة كريجلر-نجار الأطفال بنقص في...

تقرير يحذر من ارتفاع معدلات أمراض القلب في الولايات المتحدة: ما عوامل الخطر؟

تشير البيانات الحديثة إلى أن أمراض القلب تواصل صعودها...

أوبن إيه آي تعترف بوجود مشكلة “الهلوسة” في GPT-5 رغم التقدم التقني

أعلنت أوبن إيه آي أن نموذجها الأحدث GPT-5 ما زال يرتكب أخطاء تُعرف اصطلاحاً بـ”الهلوسة” — أي إنتاج إجابات تبدو مقنعة لكنها غير صحيحة — ورغم انخفاض معدل هذه الأخطاء مقارنةً بالإصدارات السابقة، تعتبر الشركة أنها مشكلة متجذرة في آلية عمل النماذج اللغوية.

أوضحت الشركة أن جذور الظاهرة تعود إلى طريقة تدريب هذه الأنظمة على التنبؤ بالكلمة التالية في النص. هذا الأسلوب يحقق نجاحاً كبيراً في الجوانب اللغوية مثل القواعد والأسلوب، لكنه يضعف عند التعامل مع الحقائق الدقيقة أو النادرة، ما يسمح للنموذج بتقديم إجابات واثقة المظهر لكنها غير دقيقة واقعياً.

أشارت نتائج الاختبارات الداخلية إلى أن تحسين الدقة لا يعني بالضرورة تقليل الأخطاء. ففي بعض النماذج السابقة كانت نسبة الإجابات الصحيحة أعلى لكنها صاحبتها أيضاً نسبة مرتفعة من الإجابات الخاطئة، بينما قدّم GPT-5 دقة كلية أقل لكنه أظهر قدرة أكبر على الامتناع عن التخمين عند غياب المعرفة، فكان أكثر تحفظاً وأقل عرضة للهلوسة.

التقييم ومعيار الاعتماد

ترى الشركة أن جزءاً من المشكلة مرتبط بأساليب تقييم الأداء في الصناعة، إذ تركز معظم المقاييس على نسبة الإجابات الصحيحة فقط وتتجاهل خطورة الإجابات الخاطئة المعروضة بثقة. لذلك تدعو أوبن إيه آي إلى إعادة صياغة معايير التقييم بحيث تمنح النماذج مساحة للاعتراف بعدم المعرفة بدلاً من دفعها لتقديم إجابات خاطئة بثقة عالية.

تخاطب الشركة المستخدمين بأن GPT-5 يمثل خطوة إلى الأمام في تقليص ظاهرة “الهلوسة” لكنه لم يتخلص منها تماماً، ويظل التحدي الحقيقي في تطوير مناهج التدريب والتقييم لضمان نماذج أكثر موثوقية تقلل الفجوة بين ما يبدو صحيحاً وما هو صحيح بالفعل.

spot_img
spot_imgspot_img

تابعونا على