جوجل تستخدم محتوى المواقع لتدريب AI بالبحث رغم طلبات الانسحاب

في تطور مثير للجدل، كشفت شهادة قضائية أن جوجل تواصل استخدام محتوى الويب لتدريب نماذج الذكاء الاصطناعي للبحث حتى بعد طلب بعض الناشرين الانسحاب.

تفاصيل الخبر

في خضم محاكمة اتحادية بشأن هيمنة جوجل على سوق البحث الإلكتروني، شهد نائب رئيس شركة DeepMind – التابعة لجوجل – أن الشركة تقوم بتدريب نماذجها الخاصة بالبحث، مثل Gemini وAI Overviews، باستخدام محتوى من الإنترنت حتى لو اختار الناشرون الانسحاب من عمليات التدريب الخاصة بالذكاء الاصطناعي.

أبرز النقاط:

  • تسمح فقط بالانسحاب من تدريب DeepMind، وليس من وحدات البحث الأخرى داخل الشركة.
  • يستخدم محرك البحث محتوى المواقع – حتى المحمية بـ robots.txt – لعرض إجابات مدعومة بالذكاء الاصطناعي، مما يقلل من نقرات المستخدمين على تلك المواقع.
  • النماذج مثل Gemini يتم تعزيزها ببيانات من جلسات البحث ومقاطع يوتيوب، إلى جانب محتوى الويب.
  • الوثائق أظهرت إزالة 80 مليار “رمز” من أصل 160 مليار، استجابةً لطلبات الانسحاب من الناشرين.
  • وزارة العدل الأمريكية تضغط لمنعها من استخدام هيمنتها لتحسين نماذج AI، وتقترح تفكيك بعض أصولها مثل متصفح Chrome.

الأهداف المستقبلية

تهدف وزارة العدل إلى فرض قيود صارمة على جوجل لحماية المنافسة:

  • منع جوجل من الدفع لتكون محرك البحث الافتراضي على التطبيقات والأجهزة.
  • إلزام الشركة بمشاركة بيانات نتائج البحث التي تُستخدم لتدريب نماذجها.
  • توسيع نطاق ضوابط الانسحاب لتشمل جميع وحدات جوجل وليس DeepMind فقط.
  • تقييم تأثير البيانات من محرك البحث على تحسين جودة نماذج الذكاء الاصطناعي مثل Gemini.

تكشف هذه القضية عن صراع جوهري بين شركات التكنولوجيا العملاقة والناشرين حول ملكية البيانات ودورها في تشكيل مستقبل الذكاء الاصطناعي. والنتائج ستحدد ملامح المنافسة الرقمية القادمة.

مقالات مشابهة