ذات صلة

اخبار متفرقة

أبل تستحوذ على MotionVFX وتعمل على تعزيز أدوات تحرير الفيديو للمحترفين

تعلن Apple عن استحواذها على MotionVFX المتخصصة في تطوير...

Nvidia تطلق NemoClaw لتعزيز أمان الذكاء الاصطناعي في بيئات الشركات

يؤكد جين-سون هوانج، الرئيس التنفيذي لشركة Nvidia، أن كل...

قصة الإطلاق الأميركي لأول قمر صناعي يعمل بالطاقة الشمسية

أطلقته الولايات المتحدة في 17 مارس 1958، فكان فانغارد...

تجهيزات العيد.. 7 حيل لتسهيل تنظيف السجاد في البيت

ابدأ بتنظيف السجاد قبل العيد لإعادة دفئه وجماله إلى...

أوبرا وينفرى تشرح سبب السير ببطء إلى جانب غايل كينج خلال عرض أزياء Chloé

سبب المشي البطيء توضح أوبرا وينفري أن السبب بسيط جدًا:...

الذكاء الاصطناعي يرى النصوص بنظرة جديدة.. DeepSeek تطلق نموذجها OCR

أطلق DeepSeek نموذجًا مفتوح المصدر للذكاء الاصطناعي يعيد تعريف طريقة تحليل ومعالجة النصوص العادية، ويحمل النموذج اسم DeepSeek-OCR، وهو مصمم لتحويل النص إلى بُعد بصري باستخدام رسم الخرائط ثنائية الأبعاد، مما يسمح بضغط السياق الطويل في شكل يسهل على الآلة استيعابه.

توضح الشركة أن نماذج اللغة الكبيرة تكون أكثر كفاءة في معالجة البكسلات مقارنة بالنصوص التقليدية، إذ يسمح هذا الأسلوب للنموذج باستخلاص المعلومات الأكثر صلة لتوليد استجابات أدق وأسرع، ووفقًا لبيانات DeepSeek، فإن النهج الجديد يحقق دقة أعلى مقارنة بالطرق التقليدية في فهم وتحليل النصوص.

تقنية جديدة مبنية على OCR

يعتمد DeepSeek-OCR على تقنية التعرّف الضوئي على الحروف (OCR)، لكنه يذهب خطوة أبعد من ذلك، فهو يحوّل النصوص إلى صور قبل تحليلها، وهو ما يمكّنه من تخزين وفهم كميات كبيرة من المعلومات بطريقة أكثر كفاءة.

ويعرف هذا المفهوم بـ “الضغط البصري للسياق”، حيث يحوّل النموذج صفحات نصية طويلة إلى صور، ثم يُترجمها إلى رموز بصرية مكثّفة أصغر حجمًا بكثير من الرموز النصية المعتادة.

على سبيل المثال، يمكن للنموذج معالجة مقال من 1000 كلمة باستخدام نحو 100 رمز بصري فقط، وهو إنجاز كبير في تقليص حجم البيانات دون فقدان المعنى.

إتاحة مفتوحة ومجتمع متفاعل

النموذج متاح حاليًا عبر GitHub بموجب رخصة MIT، ما يتيح استخدامه للأغراض الأكاديمية والتجارية.

وقد حظي DeepSeek-OCR بإقبال واسع، حيث تجاوز 6700 إعجاب خلال 24 ساعة من إطلاقه، وهو يعكس الاهتمام الكبير بالنهج الجديد في معالجة النصوص بصريًا.

spot_img
spot_imgspot_img

تابعونا على