ذات صلة

اخبار متفرقة

الأوراق المالية تشكل بيئة لتكاثر الجراثيم؛ ماذا قالت الدراسات؟

المال يحمل البكتيريا ويشكل خطراً صحياً تشير الدراسات إلى أن...

أيهما أكثر صحة: الشاي الأسود أم الشاي الأخضر؟

يُعَد الشاي الأسود والأخضر من أكثر المشروبات شعبية في...

دعوة تقويم واحدة قد تكشف أسرار شركتك.. ثغرة GeminiJack تضرب Gemini

تنبه الباحثون إلى ثغرة أُطلق عليها GeminiJack تستهدف نظام...

سبوتيفاى تختبر ميزة ستتيح قريبًا مزامنة الكتب الصوتية مع الكتب الورقية

ميزة Page Match الجديدة تتيح Page Match للمستخدمين مزامنة مكانهم...

موظف في OpenAI: سيقضي الذكاء الاصطناعي على وظائف الباحثين قبل أن يمس وظائف المهندسين والمبيعات

تصريح مثير حول مستقبل الوظائف في شركات الذكاء الاصطناعي نقل...

مشروع جديد يتيح الوصول إلى بيانات ويكيبيديا للذكاء الاصطناعي

أعلنت مؤسسة ويكيبيديا عن مشروع جديد باسم “مشروع تضمين بيانات ويكي”، بالتعاون مع شركتي DataStax وجينا، يهدف إلى جعل البيانات الضخمة الموجودة على ويكيبيديا ومواقعها الشقيقة، والتي تبلغ نحو 120 مليون إدخال، أكثر سهولة في الوصول إليها واستخدامها من قبل أنظمة الذكاء الاصطناعي.

التقنية والبيانات

يعتمد المشروع على تقنية البحث الدلالي القائم على المتجهات، مما يمكّن نماذج الذكاء الاصطناعي من فهم المعنى والعلاقات بين الكلمات بشكل أفضل، وليست مجرد البحث عن كلمات مفتاحية.

هذا يسهل استخدام اللغة الطبيعية في الاستعلام عن البيانات، مما يلغي الحاجة إلى لغات استعلام متخصصة مثل SPARQL التي كانت مستخدمة سابقاً.

الجودة والتطبيقات

وتساهم المبادرة في توفير بيانات عالية الجودة وموثوقة لتدريب نماذج الذكاء الاصطناعي، فبدلاً من الاعتماد على مجموعات بيانات عشوائية ومحدودة الدقة مثل Common Crawl، يمكن للمطورين الاعتماد على معرفة تم التحقق منها من قبل محرري ويكيبيديا.

السياق الدلالي والاستخدام المفتوح

كما أن البيانات مُهيكلة لتوفير سياق دلالي غني، مثل ربط كلمة “عالم” بمعلومات عن علماء بارزين أو مفاهيم مشابهة.

يؤكد فيليب سعدي، مدير مشروع الذكاء الاصطناعي في ويكيبيديا، أن المبادرة تهدف إلى إظهار أن الذكاء الاصطناعي يمكن أن يكون مفتوحاً وتعاونيًا، وليس حكرًا على عدد قليل من الشركات الكبرى. المشروع متاح للعامة على Toolforge، مما يجعله مورداً يمكن لأي مطور استخدامه بحرية.

spot_img
spot_imgspot_img

تابعونا على