أعلنت OpenAI عن ترقية كبرى لسلسلة نماذجها بإطلاق GPT-5.2، وهو النموذج الذي وصفته الشركة بأنه الأول الذي يضاهي أو يتفوّق على الخبراء البشريين في المهام المعرفية المعقدة.
ووفق تقرير تقني، سجل GPT-5.2 Thinking نتائج مذهلة في اختبارات GDPval القياسية، حيث تفوق على المحترفين البشريين بنسبة 70.9% في مهام متخصصة تشمل البرمجة والتحليل المالي والاستراتيجيات.
يعتمد GPT-5.2 على معمارية استدلال ثورية تتيح له التوقّف و«التفكير» قبل إصدار الإجابة، مما يقضي تماماً على مشكلة الهلوسة في الحسابات الرياضية والمنطقية. النظام الجديد لا يكتفي بالتنبؤ بالكلمة التالية، بل يبني شجرة من الاحتمالات والحلول قبل اختيار المسار الأكثر دقة وموثوقية، مما يجعله مثالياً للاستخدام في الأبحاث العلمية والهندسة.
تطور في معالجة الأكواد عبر CODEX 2
كشف التقرير أن النسخة المتخصصة بالبرمجة GPT-5.2-Codex حققت رقماً قياسياً جديداً في معيار SWE-Bench Pro، متفوقة على النماذج المفتوحة المصدر بنسبة 55%. النموذج أصبح قادراً على إدارة مشاريع برمجية كاملة بشكل مستقل، بما في ذلك كتابة الاختبارات، تصحيح الأخطاء، وإعادة هيكلة الأكواد في لغات برمجية متعددة في آن واحد.
تحويل البيانات إلى أفعال عبر الوكلاء المدمجين
الميزة الأكثر أهمية في التحديث هي قدرة النموذج على استخدام الأدوات بشكل مستقل (Agentic Tool-calling). بدلاً من مجرد كتابة الردود، يمكن لـ GPT-5.2 الآن الاتصال ببرامج خارجية، مثل جداول البيانات وبرامج العروض التقديمية، لإنشاء ملفات كاملة وتحريرها نيابة عن المستخدم، مما يحوله من مساعد رقمي إلى موظف افتراضي خبير.



