ذات صلة

اخبار متفرقة

اختراق مليارات السجلات السرية ينبئ بحدوث كارثة عالمية محققة في أمن المعلومات

تصاعد وتيرة الهجمات السيبرانية على مستوى العالم تشهد الساحة الرقمية...

جوجل تعزز قدرات البحث الطبي المتقدم من خلال خوارزميات الذكاء الاصطناعي

أعلنت جوجل عن تحديثات جوهرية ومبتكرة في حزمة الخدمات...

آبل تقوّي منظومتها الإخبارية عبر شراكة استراتيجية حصرية مع وكالة بلومبرج

تعلن آبل عن دمج محتوى مالي واقتصادي متخصص ضمن...

اختراق يطال مليارات السجلات السرية ينذر بحدوث كارثة عالمية محققة في أمن المعلومات

تتصاعد الهجمات الإلكترونية الخبيثة بشكل يومي وبوتيرة متسارعة تهدد...

جوجل تُعزز قدرات البحث الطبي المتقدم من خلال خوارزميات الذكاء الاصطناعي

أعلنت جوجل عن سلسلة تحديثات جوهرية ومبتكرة في حزمة...

كيف يرى الذكاء الاصطناعي العالم عبر تقنية الرؤية الحاسوبية؟

تشهد البشرية اليوم ثورة تكنولوجية غير مسبوقة بسبب التطور المتسارع في أنظمة الذكاء الاصطناعي، حيث لم تعد هذه الأنظمة مجرد برمجيات تقرأ النصوص وتكتبها بل تمتلك حاسة الرؤية وتفهم المشاهد البصرية.

تُعرّف الرؤية الحاسوبية بأنها فرع من الذكاء الاصطناعي يهدف إلى تمكين الآلات من فهم المحتوى المرئي مثل الصور ومقاطع الفيديو وتفسيره في سياقه.

تفتح هذه التطورات آفاق هائلة لتطبيقات جديدة إذ تصبح الآلة قادرة على تمييز الأشياء، قراءة النصوص من الصور، وفهم السياق العاطفي والمنطقي للمشهد.

النماذج متعددة الوسائط وتكامل النص والصورة

تؤكد التطورات أن النماذج اللغوية الكبيرة الحديثة صارت متعددة الوسائط وتستطيع معالجة النصوص والصور معاً في وقت واحد، فيتيح ذلك أن يقوم المستخدم بتحميل صورة لمخطط بياني وتحليلها واستخراج الأرقام ثم تلخيص النتائج كتابة.

تعتمد هذه التقنية على تدريب النماذج باستخدام مليارات الصور المصاحبة لأوصاف نصية، ما يخلق ارتباطاً ذكياً بين الشكل المرئي والكلمة التي تعبر عنه.

آلية عمل الرؤية الحاسوبية

تعمل الرؤية الحاسوبية عبر تقسيم الصورة إلى آلاف أو ملايين النقاط الصغيرة المعروفة بالبكسلات، ثم تفحص الشبكات العصبية الاصطناعية هذه البكسلات لاكتشاف الحواف والألوان والظلال.

تتعمق الطبقات الأعمق في الشبكات لاستخلاص أنماط مركّبة، فتعرف الآلة على أشخاص وأشياء وتفهم العلاقات بينها، مثل أن تكون السماء ممطرة عندما يحمل شخص مظلة.

يمكن تطبيق هذه التقنية في الحياة اليومية بطرق عملية، فالتقاط صورة للمكونات في الثلاجة يتيح اقتراح وصفات، وتصوير مستند مكتوب بخط اليد يمكن النظام من تحويله إلى نص قابل للتحرير، كما يمكن التقاط مسألة رياضية أو جهاز معطل وشرح الحل خطوة بخطوة.

مع استمرار التطوير وتوفير كميات ضخمة من البيانات المصاغة وصفياً، ستزداد قدرات الآلة في الفهم والتفاعل مع البشر بشكل أكثر دقة وذكاء.

spot_img
spot_imgspot_img

تابعونا على