ذات صلة

اخبار متفرقة

طريقة تحضير كيكة البرتقال بمذاق لا يقاوم

تُحب الكبار والصغار كيكة البرتقال في الشتاء لأنها من...

هل السوشي صحي أم خدعة غذائية، فاحذر طريقة تناوله

يُعد السوشي خيارًا غذائيًا صحيًا وخفيفًا، وهو واحد من...

زوجة حمدي الميرغني تسحر المتابعين بجمالها وأناقتها.. شاهد

أحدث ظهور لـ زوجة حمدي الميرغني خطفت إسراء عبد الفتاح...

أضرار نفسية للإفراط بالألعاب الإلكترونية، وأهمها الاكتئاب

تعود الطفلة لينا "منى أحمد زاهر" إلى لعبة روبلوكس...

ست علامات تحذيرية لانسداد الأمعاء والأشخاص الأكثر عرضة للخطر

ما هو انسداد الأمعاء؟ يحدث انسداد الأمعاء عندما تتعطل حركة...

صدمة تقنية: فشل وكلاء الذكاء الاصطناعي في تنفيذ مهام العمل بنسبة 76%

تقييم Apex-Agents ونتائجه الصادمة

أظهرت النتائج الأخيرة لاختبار Apex-Agents أن أفضل النماذج الحالية، بما فيها Gemini Flash من Google، لم تتجاوز نسبة النجاح 24% في تنفيذ المهام المطلوبة ضمن وظائف الياقات البيضاء في مجالات البنوك والاستشارات والقانون، وهو ما يجعل وعود الأتمتة الشاملة للشركات تخضع للنقد العلمي والتقني.

يهدف الاختبار إلى تقييم قدرة وكلاء الذكاء الاصطناعي على أداء وظائف مهنية عالية المستوى في قطاعات الاستشارات والبنوك والقانون، وتبين أن الأداء رغم التقدم لا يفي بالتوقعات في بيئات العمل الحقيقية، مما يعزز الحاجة إلى معايرة أكثر دقة للقدرات من حيث التوثيق والامتثال.

أسباب ضعف الوكلاء

تشير النتائج إلى أن المشكلة الأساسية تكمن في عدم قدرة الوكلاء الأذكياء على التعامل مع المعلومات المبعثرة عبر منصات متعددة مثل Slack وGoogle Drive، مما يفقدهم السياق أثناء الانتقال بين الأدوات ويؤدي إلى أخطاء في اتخاذ القرار أو تنفيذ الأوامر الإدارية.

تحديات الموثوقية في بيئات العمل المعقدة

أثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة بالغة في التنسيق بين مهام متعددة تتطلب فهماً دلالياً متغيراً، ما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية والتحليلات البنكية مخاطرة تقنية غير محسوبة النتائج حالياً.

أولوية الحوكمة على القدرات الخام

يتفق خبراء الأمن على أن الموثوقية والحوكمة تظلّان أكثر أهمية من القدرات الحسابية الخام، وبالتالي فإن بناء وكلاء ناجحين يتطلب إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة لضمان أعلى مستويات الدقة والأمان الرقمي.

تشير التحديثات إلى أن التحول نحو “القوة العاملة السيليكونية” قد يستغرق وقتاً أطول مما توقعته شركات التقنية الكبرى، حيث يرى 52% من قادة الشركات أن المخاوف الأمنية والامتثال تشكل العائق الأكبر أمام نشر هؤلاء الوكلاء، مع اشتراط وجود إشراف بشري كامل على قرارات الذكاء الاصطناعي لضمان سلامة العمليات.

spot_img
spot_imgspot_img

تابعونا على