أظهرت النتائج الصادمة لاختبار قياسي عالمي يُدعى Apex-Agents قدرة وكلاء الذكاء الاصطناعي على أداء مهام وظائف الياقات البيضاء في قطاعات البنوك والاستشارات والقانون، وتبين أن أفضل النماذج الحالية، بما فيها Gemini وFlash من جوجل، لم تتجاوز نسبة نجاح تصل إلى 24% في إنجاز المهام المطلوبة.
أسباب ضعف الوكلاء
يُظهر تقرير AI Agent Store وتقارير تقنية أن المشكلة الأساسية تكمن في عدم قدرة الوكلاء على إدارة المعلومات المشتتة عبر أدوات متعددة مثل Slack وGoogle Drive كما يفعل البشر.
أوضح الباحثون أن الوكلاء يعانون من فقدان السياق عند الانتقال بين المنصات المختلفة، مما يؤدي إلى أخطاء فادحة في اتخاذ القرارات أو تنفيذ الأوامر الإدارية، وهو ما يعني أن مكان العمل الآلي لا يزال بعيداً عن الواقع.
تشير هذه النتائج إلى أن التحول نحو القوة العاملة السيليكونية قد يستغرق وقتاً أطول بكثير مما توقعته شركات التكنولوجيا الكبرى.
تحديات الموثوقية والحوكمة
أكّدت التقارير أن 52% من قادة الشركات يعتبرون المخاوف الأمنية والامتثال هي العائق الأكبر أمام نشر هؤلاء الوكلاء، حيث لا تزال الأغلبية تشترط وجود رقابة بشرية كاملة على كل قرار يتخذه الذكاء الاصطناعي لضمان سلامة العمليات التجارية والمالية من الأخطاء العشوائية تماماً.
تثبت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة بالغة في التنسيق بين المهام المتعددة التي تتطلب فهماً دلالياً متغيّراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مغامرة تقنية غير محسوبة النتائج حالياً.
يتفق خبراء الأمن على أن الموثوقية والحوكمة تظلان أهم من القدرات الحسابية الخام، حيث يتطلب بناء وكلاء ناجحين إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة، لضمان أعلى مستويات الدقة والأمان الرقمي.



