تحديث Gemini 3 Deep Think
أعلنت جوجل عن تحديث رئيسي لنموذج Gemini 3 Deep Think ليعزز قدرته على حل التحديات الحديثة في مجالات العلوم والبحث والهندسة، وهو ما يؤكد تطوره لدعم العلماء في العثور على حلول لمشاكل معقدة في الواقع العلمي.
يؤكد التحديث تحسين أداء النموذج في المعايير الرئيسية، مع ادعاء بأن Gemini 3 Deep Think يحقق أرقامًا قياسية في الاختبارات ARC-AGI-2 و Humanity’s Last Exam، ويتفوق بذلك على نماذج منافسة مثل GPT-5.2 من OpenAI وClaude Opus 4.6 من Anthropic.
ظل النموذج متاحًا لمشتركي Google AI Ultra، لكن الشركة أشارت إلى أن مجموعة مختارة من الباحثين والشركات يمكنهم الوصول إليه أيضًا عبر واجهة برمجة التطبيقات الخاصة بالشركة.
قال Sundar Pichai، الرئيس التنفيذي لجوجل، إن Gemini 3 Deep Think حصل على ترقية كبيرة نتيجة التعاون الوثيق مع العلماء والباحثين لمواجهة تحديات الحياة الواقعية، وردّ إيلون ماسك على ذلك بأنه أمر مدهش.
زعمَت جوجل أن النموذج بلغ 84.6% في معيار ARC-AGI-2 الذي يقيس قدرة النماذج الرائدة على الاستدلال، وتأكدت نتيجة ARC Prize Foundation من هذه النسبة، كما سجل Humanity’s Last Exam 48.4% بدون أدوات، وهو أحد أصعب الاختبارات القياسية المتاحة.
وفي تقارير الأداء ذكرت جوجل أن Gemini 3 Deep Think حقق Elo بمقدار 3455 على منصة Codeforces، ووفقًا للشركة، تفوق في هذه الاختبارات على نماذج رائدة من OpenAI وAnthropic.
تُبرز الشركة أمثلة استخدام الباحثين للنموذج في حل مسائل علمية واقعية، إذ استخدمت ليزا كاربون، عالمة الرياضيات في جامعة روتجرز، Gemini 3 Deep Think لمراجعة ورقة بحثية رياضية متخصصة وكشفت وجود خللٍ منطقي دقيق لم يُكتشف خلال مراجعات الأقران البشرية.



