ذات صلة

اخبار متفرقة

رحمة محسن تتألق في أحدث ظهور بملابس كاجوال

تفاصيل الإطلالة الجديدة لرحمة محسن أظهرت رحمة محسن الصورة الجديدة...

نجمات الفن يتألقن في عيد الحب بإطلالات مبهرة

برزت النجمات بخيارات تجمع بين الجرأة والرومانسية في عيد...

جومانا مراد تجذب الأنظار بجمالها الخلاب في عيد الحب

إطلالة جومانا مراد في عيد الحب احتفلت جومانا مراد بعيد...

ومنها الكمون، توابل غنية بالحديد تدعم الطاقة والمناعة

يزود الحديد جسم الإنسان بالهيموجلوبين داخل خلايا الدم الحمراء،...

الكافيين من بين هذه المشروبات التي قد تضعف مفعول أدوية ضغط الدم

تأثير العصائر الحمضية وبعض الفاكهة على أدوية ضغط الدم يؤدي...

جوجل تُحسّن أداء نموذجها المُحدَّث Gemini 3 Deep Think وتتفوّق على GPT-5.2

تحديث Gemini 3 Deep Think

أعلنت جوجل عن تحديث رئيسي لنموذج Gemini 3 Deep Think ليعزز قدرته على حل التحديات الحديثة في مجالات العلوم والبحث والهندسة، وهو ما يؤكد تطوره لدعم العلماء في العثور على حلول لمشاكل معقدة في الواقع العلمي.

يؤكد التحديث تحسين أداء النموذج في المعايير الرئيسية، مع ادعاء بأن Gemini 3 Deep Think يحقق أرقامًا قياسية في الاختبارات ARC-AGI-2 و Humanity’s Last Exam، ويتفوق بذلك على نماذج منافسة مثل GPT-5.2 من OpenAI وClaude Opus 4.6 من Anthropic.

ظل النموذج متاحًا لمشتركي Google AI Ultra، لكن الشركة أشارت إلى أن مجموعة مختارة من الباحثين والشركات يمكنهم الوصول إليه أيضًا عبر واجهة برمجة التطبيقات الخاصة بالشركة.

قال Sundar Pichai، الرئيس التنفيذي لجوجل، إن Gemini 3 Deep Think حصل على ترقية كبيرة نتيجة التعاون الوثيق مع العلماء والباحثين لمواجهة تحديات الحياة الواقعية، وردّ إيلون ماسك على ذلك بأنه أمر مدهش.

زعمَت جوجل أن النموذج بلغ 84.6% في معيار ARC-AGI-2 الذي يقيس قدرة النماذج الرائدة على الاستدلال، وتأكدت نتيجة ARC Prize Foundation من هذه النسبة، كما سجل Humanity’s Last Exam 48.4% بدون أدوات، وهو أحد أصعب الاختبارات القياسية المتاحة.

وفي تقارير الأداء ذكرت جوجل أن Gemini 3 Deep Think حقق Elo بمقدار 3455 على منصة Codeforces، ووفقًا للشركة، تفوق في هذه الاختبارات على نماذج رائدة من OpenAI وAnthropic.

تُبرز الشركة أمثلة استخدام الباحثين للنموذج في حل مسائل علمية واقعية، إذ استخدمت ليزا كاربون، عالمة الرياضيات في جامعة روتجرز، Gemini 3 Deep Think لمراجعة ورقة بحثية رياضية متخصصة وكشفت وجود خللٍ منطقي دقيق لم يُكتشف خلال مراجعات الأقران البشرية.

spot_img
spot_imgspot_img

تابعونا على