Mercury 2 من Inception Labs أسرع نموذج استدلال

أعلنت Inception Labs عن إطلاق Mercury 2، نموذج استدلال يعتمد على تقنيات الانتشار (Diffusion) ويصل إلى سرعة تتجاوز 1000 رمز في الثانية، متفوقاً بثلاثة أضعاف على أقرب منافسيه ضمن نفس الفئة السعرية.

تفاصيل الخبر

يمثل Mercury 2 تحولاً معمارياً في طريقة توليد النصوص، حيث يتخلى عن فك الترميز التسلسلي التقليدي (autoregressive) الذي ينتج الرموز واحداً تلو الآخر، ويعتمد بدلاً من ذلك على التوليد المتوازي عبر “تحسين تدريجي” ينتج عدة رموز في الوقت نفسه.

سرعة توليد تصل إلى 1009 رمز في الثانية على معالجات NVIDIA من فئة Blackwell.
تسعير يبلغ 0.25 دولار لكل مليون رمز إدخال و0.75 دولار لكل مليون رمز إخراج.
سياق ممتد حتى 128 ألف رمز.
دعم مدمج لاستخدام الأدوات وإخراج JSON متوافق مع المخططات.
إمكانية ضبط مستوى الاستدلال وفق احتياجات المهمة.

بحسب الشركة، يغير هذا النهج منحنى العلاقة بين الجودة والسرعة. فبدلاً من زيادة زمن الاستجابة كلما زاد تعقيد التفكير، يسمح الاستدلال المعتمد على الانتشار بالحفاظ على جودة عالية ضمن ميزانيات زمنية منخفضة، ما يجعله مناسباً لبيئات الإنتاج الحساسة للزمن.

تشير اختبارات الأداء إلى تفوق Mercury 2 في سيناريوهات تتطلب استجابات فورية، مثل مساعدات البرمجة، الحلقات الوكيلية متعددة الخطوات، تطبيقات الصوت اللحظية، وأنظمة البحث المعززة بالاسترجاع (RAG).

الأهداف المستقبلية

تسعى Inception Labs إلى ترسيخ نماذج الانتشار كجيل جديد من نماذج الاستدلال في بيئات الإنتاج واسعة النطاق.

توسيع الشراكات المؤسسية لتقييم الأداء في أحمال العمل الواقعية.
تحسين الاستقرار تحت ضغط التزامن العالي.
تطوير أدوات تقييم مخصصة لبيئات الشركات.
تعزيز التوافق مع واجهات برمجة التطبيقات القياسية لتسهيل الدمج دون إعادة كتابة الأنظمة.

مع Mercury 2، تدخل نماذج الذكاء الاصطناعي مرحلة جديدة تركز على الاستجابة الفورية دون التضحية بجودة التفكير، ما قد يعيد تشكيل تطبيقات الوكلاء، البحث، والصوت التفاعلي في بيئات العمل الحديثة.