ذات صلة

اخبار متفرقة

في شهر التوعية: كل ما تود معرفته عن سرطان عنق الرحم

يُعْتَبَر شهر يناير شهر التوعية بسرطان عنق الرحم، وهو...

إليسا تتألّق بإطلالة كاجوال في أحدث ظهور لها.. شاهد

أطلت إليسا في صور جديدة من أحدث ظهور لها...

جمال شعبان يكشف كل ما ترغب في معرفته عن كهرباء القلب.. التفاصيل

مفهوم كهرباء القلب توضح كهرباء القلب أنها النظام الكهربي الذي...

سبعة مشروبات طبيعية تعزز التركيز والذاكرة وتدعم صحة الدماغ

الشاي الأخضر يحتوي الشاي الأخضر على مركبات مضادة للأكسدة والالتهابات...

لا تعتمد على مسكنات الألم.. هناك إشارات بأن صداعك يستلزم تقييمًا طبيًا

يتصدر الصداع قائمة الشكاوى الصحية الشائعة، فبين ضغوط العمل...

صدمة تقنية: فشل وكلاء الذكاء الاصطناعي في تنفيذ مهام العمل بنسبة 76%

تقييم Apex-Agents ونتائجه الصادمة

أظهرت النتائج الأخيرة لاختبار Apex-Agents أن أفضل النماذج الحالية، بما فيها Gemini Flash من Google، لم تتجاوز نسبة النجاح 24% في تنفيذ المهام المطلوبة ضمن وظائف الياقات البيضاء في مجالات البنوك والاستشارات والقانون، وهو ما يجعل وعود الأتمتة الشاملة للشركات تخضع للنقد العلمي والتقني.

يهدف الاختبار إلى تقييم قدرة وكلاء الذكاء الاصطناعي على أداء وظائف مهنية عالية المستوى في قطاعات الاستشارات والبنوك والقانون، وتبين أن الأداء رغم التقدم لا يفي بالتوقعات في بيئات العمل الحقيقية، مما يعزز الحاجة إلى معايرة أكثر دقة للقدرات من حيث التوثيق والامتثال.

أسباب ضعف الوكلاء

تشير النتائج إلى أن المشكلة الأساسية تكمن في عدم قدرة الوكلاء الأذكياء على التعامل مع المعلومات المبعثرة عبر منصات متعددة مثل Slack وGoogle Drive، مما يفقدهم السياق أثناء الانتقال بين الأدوات ويؤدي إلى أخطاء في اتخاذ القرار أو تنفيذ الأوامر الإدارية.

تحديات الموثوقية في بيئات العمل المعقدة

أثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة بالغة في التنسيق بين مهام متعددة تتطلب فهماً دلالياً متغيراً، ما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية والتحليلات البنكية مخاطرة تقنية غير محسوبة النتائج حالياً.

أولوية الحوكمة على القدرات الخام

يتفق خبراء الأمن على أن الموثوقية والحوكمة تظلّان أكثر أهمية من القدرات الحسابية الخام، وبالتالي فإن بناء وكلاء ناجحين يتطلب إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة لضمان أعلى مستويات الدقة والأمان الرقمي.

تشير التحديثات إلى أن التحول نحو “القوة العاملة السيليكونية” قد يستغرق وقتاً أطول مما توقعته شركات التقنية الكبرى، حيث يرى 52% من قادة الشركات أن المخاوف الأمنية والامتثال تشكل العائق الأكبر أمام نشر هؤلاء الوكلاء، مع اشتراط وجود إشراف بشري كامل على قرارات الذكاء الاصطناعي لضمان سلامة العمليات.

spot_img
spot_imgspot_img

تابعونا على