ذكاء اصطناعي

مشروع جديد يجعل بيانات ويكيبيديا متاحة للذكاء الاصطناعى

​أعلنت مؤسسة ويكيبيديا ألمانيا عن مشروع جديد باسم “مشروع تضمين بيانات ويكي”، بالتعاون مع شركتي داتا ستاكس وجينا، يهدف هذا المشروع إلى جعل البيانات الهائلة الموجودة على ويكيبيديا ومواقعها الشقيقة، والتي تبلغ حوالي 120 مليون إدخال، أكثر سهولة في الوصول إليها واستخدامها من قبل نماذج الذكاء الاصطناعي.

​يعتمد المشروع على تقنية البحث الدلالي القائم على المتجهات، مما يمكّن أنظمة الذكاء الاصطناعي من فهم المعنى والعلاقات بين الكلمات بشكل أفضل، وليس مجرد البحث عن كلمات مفتاحية بسيطة.

وهذا يسهّل استخدام اللغة الطبيعية في الاستعلام عن البيانات، مما يلغي الحاجة إلى لغات استعلام متخصصة مثل SPARQL التي كانت تستخدم سابقًا.

اقرا ايضا: ابتكارات الذكاء الاصطناعي في معرض ليب

​وتساهم هذه المبادرة في توفير بيانات عالية الجودة وموثوقة لتدريب نماذج الذكاء الاصطناعي، فبدلاً من الاعتماد على مجموعات بيانات عشوائية ومحدودة الدقة مثل “Common Crawl”، يمكن للمطورين الآن بناء نماذجهم على معرفة تم التحقق منها من قبل محرري ويكيبيديا.

كما أن البيانات مُهيكلة لتوفير سياق دلالى غنى، مثل ربط كلمة “عالم” بمعلومات عن علماء بارزين أو مفاهيم مشابهة.

​يؤكد فيليب سعدي، مدير مشروع الذكاء الاصطناعي في ويكيبيديا، أن هذه المبادرة تهدف إلى إظهار أن الذكاء الاصطناعي يمكن أن يكون مفتوحًا وتعاونيًا، وليس حكرًا على عدد قليل من الشركات الكبرى. المشروع متاح للعامة على Toolforge، مما يجعله موردًا يمكن لأي مطور استخدامه بحرية.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى