ذات صلة

اخبار متفرقة

مشروب رمضاني يدمر آثار الحلويات والدهون ومدمر للسكري والكوليسترول

يرتفع مستوى الكوليسترول والسكريات في الدم نتيجة الإفراط في...

ماذا يحدث لجسمك عند تناول التين المجفف في السحور والإفطار؟

فوائد التين المجفف في فطور رمضان ابدأ بتناول التين المجفف...

هيفاء وهبي تظهر في أحدث إطلالاتها بالقفطان والطرحة احتفالاً بقدوم شهر رمضان | شاهد

إطلالة هيفاء وهبي في رمضان خطفت هيفاء وهبي الأنظار بإطلالة...

الإضرار بالشبكية والنظر: ماذا يفعل الاستخدام المطول للهاتف المحمول في عينيك؟

يتسبب الاستخدام المستمر للهاتف في إجهاد العين الرقمي، وهو...

صحتك بالدنيا.. أخطاء في السحور تسبّب العطش ونصائح لتجنب الشعور بالنعاس خلال الصيام

أخطاء في السحور تسبب العطش وتجنب المشروبات تجنب الإفراط في...

أنثروبيك تطلق Claude Sonnet 4.6 وتصفه بأنه الأقوى في البرمجة والاستدلال

أعلنت Anthropic عن طرح نموذج Claude Sonnet 4.6 كأقوى إصدار في سلسلة Sonnet حتى الآن، مع تحسينات بارزة في البرمجة والاستدلال والمنجزات المعرفية، وأصبح هذا النموذج الافتراضي ضمن روبوت Claude للمستخدمين المجانيين والمشتركين في الخطة Pro.

تتوافر Sonnet 4.6 عبر منصة الشركة لروبوت الدردشة مع وصول محدود للمستخدمين المجانيين يتجدد كل خمس ساعات، فيما يظل اشتراك Pro وفق هيكلة الأسعار المعمول بها. ولا يقتصر الأمر على واجهة المحادثة فحسب، بل تتوفر أيضًا واجهة برمجة التطبيقات API، إضافة إلى توافره عبر منصات الحوسبة السحابية الكبرى، ليتيح للمطورين والشركات دمجه في أدوات وتطبيقات تعتمد على الذكاء الاصطناعي.

أبرز القدرات والتحسينات

أوضحت Anthropic أن Sonnet 4.6 يمثل ترقية شاملة إلى مهاراته في البرمجة واستخدام الحاسوب والاستدلال طويل السياق وتخطيط الوكلاء الذكيين وأعمال المعرفة والتصميم. كما يتسم بالقدرات الأكثر اتساقًا في الالتزام بتعليمات البرمجة وتوليد أكواد قابلة للاستخدام دون الانحراف عن المطلوب، وهي نقطة كانت تحديًا في أنظمة الذكاء الاصطناعي السابقة.

وتؤكد الشركة أن Sonnet 4.6 يُظهر موثوقية أعلى عند كتابة الأكواد وتحريرها وتصحيح أخطائها، وأن مختبرين مبكرين فضّلوا أداؤه مقارنة بالإصدارات السابقة، وبحسب اختبارات داخلية تفوق في مهام معينة تتعلق بالوكلاء الذكيين حتى على نموذج Claude Opus 4.6.

نافذة سياق موسّعة ومعالجة البيانات الضخمة

تتيح الشركة للنموذج نافذة سياق تصل إلى مليون رمز، وهي ميزة تعمل حاليًا في إصدار تجريبي، ما يتيحي للنموذج بقدر أكبر من التذكر وتحليل معلومات جلسة واحدة، وهو ما يفيد المستندات القانونية والسجلات المالية وقواعد الأكواد الكبيرة.

ومن أبرز التحسينات الأخرى قدرته على التعامل بكفاءة مع كميات ضخمة من البيانات ومعالجة المستندات الطويلة، وهو ما يفتح آفاق في تحليل المستندات والسجلات الكبيرة في بيئات الأعمال والتشريعات.

أداء في الاختبارات القياسية وعيوب السلامة

في الاختبارات القياسية، حقق Sonnet 4.6 نتائج قوية في مقاييس Humanity’s Last Exam وGPQA Diamond وSWE-bench Verified، وهي اختبارات تقيس عمق الاستدلال ودقة البرمجة، مع تحسن في استخدامات التأمين وأتمتة المؤسسات مقارنة بنماذج Claude السابقة.

وفي جانب السلامة، تبرز تحسينات في المعايير، مع انخفاض معدلات الهلوسة وتراجع في ظاهرة الميل للموافقة على افتراضات المستخدم حتى عند عدم صحتها.

spot_img
spot_imgspot_img

تابعونا على