ذات صلة

اخبار متفرقة

كيف تؤثر مسكنات الألم على الكلى.. 7 نصائح لتناولها بأمان

خطر مسكنات الألم على الكلى تزداد عادة استخدام مسكنات الألم...

مرض نادر يصيب واحدا من كل مليون مولود حول العالم: ما هي متلازمة كريجلر نجار؟

ما هي المتلازمة؟ تُعرَف متلازمة كريجلر-نجار بأنها حالة وراثية نادرة...

تقرير يحذر من ارتفاع نسبة أمراض القلب في أمريكا.. ما هي عوامل الخطر؟

وضع أمراض القلب في الولايات المتحدة وفق أحدث البيانات تشير...

5 خطوات تساعد ابنك على الموازنة بين وقت الشاشة والأنشطة.. لعبة تحولت إلى جد

يتناول مسلسل لعبة وقلبت بجد على شاشة DMC وببطولة...

طريقة عمل تبيتة السبوع: أبرز طقوس الاحتفال بالمولود الجديد.. قلة ولا إبريق؟

تبيتة السبوع: المفهوم والتقاليد يبدأ الاحتفال بتبيتة السبوع من التحضيرات...

أوبن إيه آي تعترف بوجود مشكلة “الهلوسة” في GPT-5 رغم التقدم التقني

أعلنت أوبن إيه آي أن نموذجها الأحدث GPT-5 ما زال يرتكب أخطاء تُعرف اصطلاحاً بـ”الهلوسة” — أي إنتاج إجابات تبدو مقنعة لكنها غير صحيحة — ورغم انخفاض معدل هذه الأخطاء مقارنةً بالإصدارات السابقة، تعتبر الشركة أنها مشكلة متجذرة في آلية عمل النماذج اللغوية.

أوضحت الشركة أن جذور الظاهرة تعود إلى طريقة تدريب هذه الأنظمة على التنبؤ بالكلمة التالية في النص. هذا الأسلوب يحقق نجاحاً كبيراً في الجوانب اللغوية مثل القواعد والأسلوب، لكنه يضعف عند التعامل مع الحقائق الدقيقة أو النادرة، ما يسمح للنموذج بتقديم إجابات واثقة المظهر لكنها غير دقيقة واقعياً.

أشارت نتائج الاختبارات الداخلية إلى أن تحسين الدقة لا يعني بالضرورة تقليل الأخطاء. ففي بعض النماذج السابقة كانت نسبة الإجابات الصحيحة أعلى لكنها صاحبتها أيضاً نسبة مرتفعة من الإجابات الخاطئة، بينما قدّم GPT-5 دقة كلية أقل لكنه أظهر قدرة أكبر على الامتناع عن التخمين عند غياب المعرفة، فكان أكثر تحفظاً وأقل عرضة للهلوسة.

التقييم ومعيار الاعتماد

ترى الشركة أن جزءاً من المشكلة مرتبط بأساليب تقييم الأداء في الصناعة، إذ تركز معظم المقاييس على نسبة الإجابات الصحيحة فقط وتتجاهل خطورة الإجابات الخاطئة المعروضة بثقة. لذلك تدعو أوبن إيه آي إلى إعادة صياغة معايير التقييم بحيث تمنح النماذج مساحة للاعتراف بعدم المعرفة بدلاً من دفعها لتقديم إجابات خاطئة بثقة عالية.

تخاطب الشركة المستخدمين بأن GPT-5 يمثل خطوة إلى الأمام في تقليص ظاهرة “الهلوسة” لكنه لم يتخلص منها تماماً، ويظل التحدي الحقيقي في تطوير مناهج التدريب والتقييم لضمان نماذج أكثر موثوقية تقلل الفجوة بين ما يبدو صحيحاً وما هو صحيح بالفعل.

spot_img
spot_imgspot_img

تابعونا على