Perplexity تطلق نماذج تضمين جديدة لمنافسة جوجل

أعلنت شركة Perplexity إطلاق نموذجين مفتوحي المصدر لتضمين النصوص هما pplx-embed-v1 وpplx-embed-context-v1، بهدف تحسين المرحلة الأساسية في محركات البحث المعتمدة على الذكاء الاصطناعي مع تقليل استهلاك الذاكرة بشكل كبير.

تفاصيل الخبر

كشفت Perplexity AI عن إطلاق نموذجين جديدين لتضمين النصوص: pplx-embed-v1 وpplx-embed-context-v1، صُمما لدعم الاسترجاع واسع النطاق على مستوى الويب، ومنافسة نماذج شركات كبرى مثل Google وAlibaba.

تعتمد المرحلة الأولى في أنظمة البحث المعززة بالذكاء الاصطناعي على نماذج التضمين، حيث يتم تحويل الاستعلامات والمستندات إلى متجهات رقمية تسمح بحساب التشابه الدلالي، قبل تمرير النتائج إلى نماذج إعادة الترتيب ثم إلى نموذج اللغة لتوليد الإجابة.

طرح النموذجين بحجمين: 0.6 مليار و4 مليارات معامل.
نسخة 0.6B تستهدف الأداء الخفيف وزمن استجابة منخفض.
نسخة 4B تركز على تعظيم جودة الاسترجاع.
دعم تمثيلات INT8 وBINARY لتقليل التخزين بمقدار 4× و32× مقارنة بـ FP32.
لا تتطلب النماذج تعليمات (Instruction Prefixes) ما يسهل دمجها عملياً.

النموذج pplx-embed-v1 مخصص للاسترجاع الكثيف القياسي، بينما pplx-embed-context-v1 يضمّن المقاطع النصية مع أخذ سياق المستند الكامل بعين الاعتبار، ما يعزز دقة النتائج في الحالات التي يعتمد فيها معنى الفقرة على سياقها الأوسع.

وأظهرت نتائج التقييم تفوق عائلة pplx-embed في عدة معايير عامة مثل MTEB (الإصدار متعدد اللغات) ومعيار ConTEB للاسترجاع السياقي، إضافة إلى اختبارات داخلية واسعة النطاق شملت ملايين الاستعلامات وعشرات الملايين من الصفحات.

الأهداف المستقبلية

تسعى بيربلكسيتي من خلال هذه النماذج إلى إعادة تعريف البنية التحتية لمحركات البحث القائمة على الذكاء الاصطناعي.

تحسين جودة المرحلة الأولى من الاسترجاع في أنظمة RAG.
تمكين تخزين مليارات التضمينات بكفاءة أعلى.
دعم بيئات متعددة اللغات على نطاق واسع.
تقليل التكلفة التشغيلية للبنية التحتية.
تسريع تطوير تطبيقات بحث تعتمد على الذكاء الاصطناعي المفتوح المصدر.

وتتوفر النماذج عبر منصة Hugging Face بترخيص MIT، إضافة إلى إتاحتها عبر واجهة برمجة تطبيقات الشركة، ما يمنح المطورين مرونة في التكامل مع أطر العمل المختلفة.

في الختام، تمثل هذه الخطوة محاولة جادة لمنافسة كبار مزودي نماذج التضمين عبر الجمع بين الأداء العالي والكفاءة التخزينية. كما تعكس تصاعد المنافسة في البنية الأساسية لمحركات البحث المدعومة بالذكاء الاصطناعي.