ويكيبيديا توفر بياناتها للمطورين وتواجه سحب البوتات الذكيّة
للتقليل من استهلاك البوتات الذكية لسيرفراتها، أطلقت مؤسسة ويكيبيديا مجموعة بيانات منظمة خصيصًا لتدريب الذكاء الاصطناعي عبر منصة Kaggle.

تفاصيل الخبر: ويكيبيديا تختار التعاون بدلًا من المقاومة
بدأت مؤسسة ويكيبيديا باتباع نهج جديد لمواجهة مشكلة متزايدة تواجهها يوميًا:
- تعاني ويكيبيديا من استنزاف في الخوادم نتيجة سحب البيانات الآلي عبر بوتات الذكاء الاصطناعي.
- بدلاً من الحظر أو تقييد الوصول، قدمت المؤسسة حلاً إيجابيًا عبر التعاون مع منصة Kaggle.
- Kaggle، وهي منصة تابعة لشركة Google، تستضيف الآن مجموعة بيانات تجريبية منظمة من ويكيبيديا باللغتين الإنجليزية والفرنسية.
- تحتوي هذه البيانات على عناصر مُهيكلة مخصصة لتناسب تطبيقات الذكاء الاصطناعي في التعليم والتحليل، مثل:
- ملخصات بحثية
- أوصاف قصيرة
- روابط للصور
- بيانات infobox
- تقسيمات المقالات
- لا تشمل البيانات المراجع أو الملفات غير النصية مثل الصوتيات، لتقليل الحمل غير الضروري.
- تأتي البيانات في صيغة JSON منظمة وسهلة الدمج في نماذج التعلم الآلي، مما يُغني عن الحاجة إلى سحب النصوص الخام.
- تتمتع هذه البيانات برخصة مفتوحة، ما يسمح باستخدامها بحرية، بما في ذلك من قِبل الشركات الناشئة والمطورين المستقلين.
- التعاون مع Kaggle يهدف إلى توفير بديل شرعي وفعّال للباحثين ومطوري النماذج.
لماذا هذا مهم وما الخطوة التالية؟
هذه المبادرة تقدم نموذجًا ذكيًا لكيفية تعاون المنصات المفتوحة مع مطوري الذكاء الاصطناعي بدلًا من مواجهتهم.
- تمكين أدوات الذكاء الاصطناعي في التعليم من الوصول لمصادر منظمة وقانونية
- تشجيع المطورين على استخدام بيانات نظيفة ومعدة مسبقًا بدلًا من سحب عشوائي للصفحات
- تحسين تطبيقات الذكاء الاصطناعي في التعليم عن بعد بفضل البيانات المنظمة
- فتح آفاق جديدة لـ”اسأل الذكاء الاصطناعي” بالاعتماد على مصادر مرخصة وموثوقة
- التقليل من الأثر البيئي والتقني الناتج عن أنشطة السحب غير المنظمة
خاتمة قصيرة:
في خطوة ذكية، اختارت ويكيبيديا التعاون بدلًا من المقاومة، فاتحةً بذلك بابًا جديدًا لتكامل الذكاء الاصطناعي مع المعرفة المفتوحة.