Meituan تطلق LongCat-Flash-Chat: نموذج لغوي منافس للعمالقة

أعلنت شركة Meituan الصينية عن إطلاق LongCat-Flash-Chat، أول نموذج لغوي مفتوح المصدر من الشركة، والذي حقق نتائج منافسة على نطاق واسع مع نماذج رائدة مثل DeepSeek V3 وQwen 3 وKimi K2.

أبرز المزايا التقنية

يمتاز النموذج الجديد بمجموعة من الخصائص المبتكرة التي تجمع بين الكفاءة والقدرة على الاستدلال:

معمارية MoE مبتكرة: النموذج يضم 560 مليار معامل، مع تفعيل ديناميكي بين 18.6 و31.3 مليار معامل (بمعدل 27 مليار) حسب أهمية السياق، مما يزيد الكفاءة ويخفض التكاليف.
تصميم ScMoE متصل بالاختصارات: يقلل من اختناق الاتصال أثناء التدريب الضخم، ويتيح سرعة معالجة تتجاوز 100 توكن في الثانية عند الاستدلال.
إستراتيجية استقرار وتوسّع: تشمل نقل المعاملات الفائقة من نماذج أصغر، وآلية نمو تدريجية للنموذج، وتقنيات مثل z-loss وضبط الموازن للموجهات لمنع الانفجارات الحسابية.
تدريب متعدد المراحل لتعزيز القدرات الوكيلية: يتضمن مراحل ما قبل التدريب بدمج بيانات مركّزة على الاستدلال، توسيع طول السياق إلى 128k، وتوليد مهام تدريبية معقدة عبر إطار متعدد الوكلاء لرفع مستوى التفكير التفاعلي.

الأداء في الاختبارات

وفق التقرير الفني، يقدم LongCat-Flash-Chat أداءً تنافسياً للغاية مقابل أحدث النماذج العالمية مثل GPT-4.1 وClaude 4 Sonnet وGemini 2.5 Flash، مع تميز خاص في المهام الوكيلية (Agentic Tasks).

بفضل مزيج من المعمارية المبتكرة، استراتيجيات التوسع الذكية، وقدرات الاستدلال المتقدمة، يُتوقع أن يشكل LongCat-Flash-Chat خطوة مهمة في سباق النماذج اللغوية العملاقة، ويعزز مكانة الصين كمطور رئيسي في مجال الذكاء الاصطناعي المفتوح المصدر.