Microsoft تطلق Harrier نموذج مفتوح للبحث متعدد اللغات

تواصل شركات التقنية الكبرى تعزيز أدوات البحث بالذكاء الاصطناعي، وهذه المرة تكشف Microsoft عن نموذج Harrier مفتوح المصدر يركز على فهم النصوص وتحسين نتائج البحث عبر لغات متعددة بكفاءة عالية.

تفاصيل الخبر

أعلن فريق Bing في Microsoft عن إطلاق Harrier، وهو نموذج embedding متطور ومفتوح المصدر مصمم لتحسين البحث والاسترجاع الدلالي.

  • يدعم النموذج أكثر من 100 لغة، ما يجعله مناسبًا للتطبيقات العالمية ومتعددة اللغات.
  • يعتمد على بنية decoder-only مع تقنية last-token pooling وL2 normalization لإنتاج تمثيلات نصية دقيقة.
  • يحقق أداءً رائدًا (SOTA) على معيار Multilingual MTEB v2، متفوقًا في مهام مثل الاسترجاع، التشابه الدلالي، والتصنيف.
  • يتوفر بثلاثة أحجام رئيسية:
    • 270M بمعاملات 640 بعدًا ونتيجة 66.5
    • 0.6B بأبعاد 1024 ونتيجة 69.0
    • 27B بأبعاد 5376 ونتيجة 74.3
  • تم تدريبه باستخدام التعلم التبايني (Contrastive Learning) على بيانات متعددة اللغات ومهام متنوعة.
  • يمكن استخدامه في تطبيقات مثل البحث، التجميع (Clustering)، إعادة الترتيب (Reranking)، واستخراج العلاقات بين النصوص.
  • يدعم التخصيص عبر التعليمات النصية (Instruction-based embeddings)، ما يسمح بتحسين الأداء حسب المهمة.

الأهداف المستقبلية

تسعى Microsoft من خلال Harrier إلى تطوير الجيل القادم من أنظمة البحث الذكية وتعزيز قدرات وكلاء الذكاء الاصطناعي.

  • تحسين دقة نتائج البحث عبر الفهم العميق للسياق والمعنى.
  • دعم تطبيقات الذكاء الاصطناعي التفاعلية مثل الوكلاء (AI Agents).
  • تمكين المطورين من بناء أنظمة بحث متقدمة باستخدام نموذج مفتوح المصدر.
  • تعزيز التكامل بين البحث والذكاء الاصطناعي في المنتجات المستقبلية.

في النهاية، يمثل Harrier خطوة مهمة نحو جعل البحث أكثر ذكاءً ومرونة، خاصة مع دعمه الواسع للغات وقدرته على فهم المعاني بدقة، ما يعكس تسارع الابتكار في هذا المجال الحيوي.

مقالات مشابهة