أظهرت نتائج اختبار Apex-Agents صدمة كبيرة، حيث لم تتجاوز أفضل النماذج الحالية، بما فيها Gemini من جوجل، نسبة نجاح 24% في إنجاز المهام المطلوبة في وظائف الياقات البيضاء في قطاعات البنوك والاستشارات والقانون.
أداء محدود في مهام الياقات البيضاء
أبرزت النتائج أن مستوى الأداء لا يقترب من طموحات الأتمتة الشاملة للشركات، وهو ما يجعل الصورة العامة لأعمال الوكلاء الذكيين أقرب إلى بداية طور اختباري من تنفيذ فعلي مستدام، الأمر الذي يضع خطط التحول الرقمي تحت مجهر النقد العلمي والتقني.
أسباب ضعف الوكلاء
أشار الباحثون إلى أن المشكلة الجوهرية تكمن في عدم القدرة على التعامل مع معلومات مشتتة عبر أدوات متعددة مثل Slack وGoogle Drive، إذ يفقد الوكلاء السياق أثناء الانتقال بين المنصات، ما أدى إلى أخطاء فادحة في اتخاذ القرار وتنفيذ الأوامر الإدارية، مما يعني أن فكرة العمل الآلي الشامل لا تزال بعيدة المنال.
تحديات الموثوقية في بيئات العمل المعقدة
وثبت أن الذكاء الاصطناعي يواجه صعوبة كبيرة في التنسيق بين مهام متعددة تتطلب فهماً دلالياً متغيراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية خطوة غير محسوبة المخاطر حالياً.
الحوكمة قبل القدرات الخام
يتفق خبراء الأمن على أن الموثوقية والحوكمة تبقيان الأهم من القدرات الحسابية الخام، وتستدعي بناء وكلاء ناجحين إعادة تصميم عمليات التشغيل في المؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة، لضمان أعلى مستويات الدقة والأمان الرقمي، مع الإشارة إلى أن التحول نحو القوة العاملة السيليكونية قد يستغرق وقتاً أطول مما توقعته الشركات الكبرى.



