أظهر كشف بحثي جديد نتائج صادمة لأداء اختبار Apex-Agents العالمي، المصمم لتقييم قدرة وكلاء الذكاء الاصطناعي على أداء مهام وظائف “الياقات البيضاء” في قطاعات البنوك والاستشارات والقانون. وأظهرت النتائج أن أفضل النماذج الراهنة، بما فيها إصدار “Gemini Flash” من جوجل، لم تتجاوز نسبة نجاح 24% في تنفيذ المهام المطلوبة، مما يضع وعود الأتمتة الشاملة للشركات تحت مجهر النقد العلمي والتقني.
أسباب ضعف الوكلاء
تشير التقارير التقنية إلى أن المشكلة الجوهرية تكمن في عدم قدرة الوكلاء الأذكياء على التعامل مع المعلومات المشتتة عبر أدوات متعددة مثل Slack وGoogle Drive، مع فقدان للسياق عند الانتقال بين المنصات المختلفة، ما يؤدي إلى أخطاء فادحة في اتخاذ القرار أو تنفيذ الأوامر الإدارية. وهذا يعزز الاعتقاد بأن مكان العمل الآلي ما زال بعيداً عن التحقق الكامل من الكفاءة في بيئات العمل المتداخلة.
تحديات الحوكمة والامتثال
وتؤكد التقارير أن 52% من قادة الشركات يعتبرون المخاوف الأمنية والامتثال هي العائق الأكبر أمام نشر هؤلاء الوكلاء، إذ لا تزال الأغلبية تشترط وجود رقابة بشرية كاملة على كل قرار يتخذه الذكاء الاصطناعي لضمان سلامة العمليات التجارية والمالية من الأخطاء العشوائية.
تحديات الموثوقية في بيئات العمل المعقدة
أثبتت الاختبارات أن الذكاء الاصطناعي يواجه صعوبة كبيرة في التنسيق بين المهام المتعددة التي تتطلب فهماً دلالياً متغيراً، مما يجعل الاعتماد عليه في مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مغامرة تقنية غير محسوبة النتائج في الوضع الراهن.
أولوية الحوكمة على القدرات الخام
يتفق خبراء الأمن على أن الموثوقية والحوكمة تظلان أهم من القدرات الحسابية الخام، حيث يتطلب بناء وكلاء ناجحين إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من مجرد أتمتة الإجراءات القائمة، لضمان أعلى مستويات الدقة والأمان الرقمي.



