ذات صلة

اخبار متفرقة

أبل تطلق آيفون 20 وآيفون 18e خلال النصف الأول من عام 2027

تشير الشائعات إلى وجود طرازات جديدة من آيفون من...

كيف تعزّزين مناعة طفلك بشكلٍ طبيعي خلال تقلبات الطقس

طرق تعزيز مناعة الأطفال بشكل مبسط اعلم أن الأمراض العرضية...

مصمم فستان سارة عبد الرحمن: النقشة تشبه المخ خلال لحظات السعادة

ابتكر المصمم أحمد الصاعدي خريطة ذهنية تعكس ما يدور...

دراسة تبين أن الذكاء الاصطناعي يزداد غباءً كلما تغذّى على منشورات تافهة.

أظهرت دراسة مشتركة بين جامعات تكساس إيه آند إم...

متى تكون آلام الجسم علامة على وجود معاناة نفسية؟

يؤثر التوتر على العقل والجسم بشكل متفاوت، فقد تكون...

الذكاء الاصطناعي يرى النصوص بعين جديدة، وتطلق DeepSeek نموذجها OCR

أطلقت DeepSeek نموذجًا مفتوح المصدر للذكاء الاصطناعي يحمل اسم DeepSeek-OCR يعيد تعريف تحليل ومعالجة النصوص العادية، فهو يحوّله إلى بُعد بصري باستخدام تمثيل ثنائي الأبعاد يتيح ضغط السياق الطويل في شكل يسهل على الآلة استيعابه.

توضح الشركة أن نماذج اللغة الكبيرة تكون أكثر كفاءة في معالجة البكسلات مقارنة بالنصوص التقليدية، إذ يسمح هذا الأسلوب للنموذج باقتناص المعلومات الأكثر صلة لتوليد استجابات أدق وأسرع، ووفقًا لبيانات DeepSeek فإن النهج الجديد يحقق دقة أعلى مقارنة بالطرق التقليدية في فهم وتحليل النصوص.

تقنية جديدة مبنية على OCR

يعتمد DeepSeek-OCR على تقنية التعرّف الضوئي على الحروف (OCR)، لكنه يذهب خطوة أبعد من ذلك، فهو يحوّل النصوص إلى صور قبل تحليلها، مما يمكّنه من تخزين وفهم كميات كبيرة من المعلومات بطريقة أكثر كفاءة.

ويُعرف هذا المفهوم باسم “الضغط البصري للسياق”، حيث يحوّل النموذج صفحات نصية طويلة إلى صور، ثم يُترجمها إلى رموز بصرية مكثّفة أصغر حجمًا بكثير من الرموز النصية المعتادة.

على سبيل المثال، يمكن للنموذج معالجة مقال من 1000 كلمة باستخدام نحو 100 رمز بصري فقط، وهو إنجاز كبير في تقليص حجم البيانات دون فقدان المعنى.

إتاحة مفتوحة ومجتمع متفاعل

النموذج متاح حاليًا عبر GitHub تحت رخصة MIT، ما يتيح استخدامه للأغراض الأكاديمية والتجارية، وقد حظي DeepSeek-OCR بإقبال واسع، إذ تجاوز 6700 إعجاب خلال 24 ساعة من الإطلاق، ما يعكس الاهتمام الكبير بالنهج الجديد في معالجة النصوص بصريًا.

spot_img
spot_imgspot_img

تابعونا على