نموذج Hunyuan-Large

تينسنت تكشف عن نموذج Hunyuan-Large مفتوح المصدر

أعلنت شركة تينسنت عن إطلاق نموذج Hunyuan-Large مفتوح المصدر، الذي يجمع بين الحجم الكبير وهندسة Mixture-of-Experts لتحقيق أداء متميز يقارن بالنماذج الرائدة مثل Llama-405B.

تفاصيل الخبر

يشمل نموذج Hunyuan-Large المزايا التالية:

  • 389 مليار معلمة إجمالية: يحتوي النموذج على 389 مليار معلمة، لكنه يستخدم فقط 52 مليارًا منها لتحسين الكفاءة.
  • تدريب على 7 تريليون رمز: تم تدريب النموذج على 7 تريليون رمز، بما في ذلك 1.5 تريليون من البيانات الاصطناعية.
  • أداء متفوق: حقق النموذج أداءً ممتازًا في المهام الرياضية والبرمجية والمنطقية، حيث حصل على نسبة 88.4% في معيار MMLU، متفوقًا على LLama3.1-405B.
  • دعم طويل للسياق: يدعم النموذج أطوال سياق تصل إلى 256 ألف رمز، وهو ضعف ما تدعمه النماذج المماثلة.

الأهداف المستقبلية

  • تحسين الكفاءة: تهدف تينسنت إلى إعادة تعريف كيفية توسيع النماذج بطريقة أكثر كفاءة.
  • تعزيز الأداء: تواصل الشركة العمل على تحسين أداء النموذج في مختلف المجالات.
  • دعم الابتكار: تستمر تينسنت في تعزيز الابتكار في الذكاء الاصطناعي وتطوير تقنيات جديدة.
  • الاستفادة المستدامة: تلتزم الشركة بتقديم حلول فعالة ومستدامة تلبي احتياجات المستخدمين والمطورين.

يمثل إطلاق نموذج Hunyuan-Large خطوة مهمة في مسيرة تينسنت لتعزيز الابتكار في مجال الذكاء الاصطناعي، مما يوفر إمكانات جديدة لتحسين الكفاءة والأداء في مختلف التطبيقات.

مقالات مشابهة