NVIDIA تطلق Llama-3.1 Nemotron Ultra 253B ذكاء فائق بكفاءة أعلى

أعلنت شركة NVIDIA عن نموذجها الجديد Llama-3.1 Nemotron Ultra 253B، المصمم لتعزيز قدرات التفكير والتفاعل البشري بدقة وكفاءة غير مسبوقتين.

تفاصيل الخبر

في خطوة جديدة نحو تطوير نماذج الذكاء الاصطناعي الضخمة، كشفت شركة NVIDIA عن نموذج Llama-3.1-Nemotron-Ultra-253B-v1، وهو إصدار مشتق من نموذج Meta المرجعي Llama-3.1-405B-Instruct. يركز هذا النموذج على تعزيز قدرات الاستدلال، وتفضيلات المحادثة البشرية، واستخدامات متقدمة مثل استرجاع المعلومات (RAG) وتشغيل الأدوات (Tool Calling).

النموذج يدعم سياقًا بطول يصل إلى 128 ألف رمز (Token).
يمكن تشغيله على عقدة واحدة تحتوي على 8 بطاقات H100 فقط، مما يقلل تكاليف التشغيل.
يتميز بكفاءة عالية مقارنة بالحجم، بفضل تقنية بحث الهيكلة العصبية (NAS) التي تقلل من استخدام الذاكرة.
تم ضغط النموذج بشكل رأسي لتقليل زمن الاستجابة وتحسين الأداء.
مرّ بعدة مراحل تدريب إضافية:
- تدريب تحت إشراف في الرياضيات، البرمجة، الاستدلال، المحادثة، واستخدام الأدوات.
- مراحل تعزيز عبر خوارزميات GRPO لتحسين المتابعة والتفاعل البشري.

هذا النموذج يُعد مناسبًا لتطبيقات الذكاء الاصطناعي المتقدمة مثل الوكلاء الأذكياء (AI Agents)، أنظمة RAG، وروبوتات المحادثة.

الأهداف المستقبلية

من خلال هذا نموذج Llama-3.1 Nemotron Ultra 253B، تسعى NVIDIA إلى:

دعم المطورين في إنشاء تطبيقات أكثر ذكاءً وتفاعلية.
توفير نموذج عالي الدقة بأقل تكلفة تشغيلية ممكنة.
توسيع نطاق نماذج Nemotron لتشمل سيناريوهات إنتاجية وتجارية أكثر تنوعًا.
تعزيز إمكانيات النماذج في فهم الأوامر والتعليمات، والتفاعل بشكل أكثر طبيعية مع البشر.

نموذج Llama-3.1 Nemotron Ultra 253B من NVIDIA يمثل نقلة نوعية في موازنة الدقة والكفاءة، مما يجعله خيارًا مثاليًا لتطبيقات الذكاء الاصطناعي المتقدمة في المؤسسات والمشاريع التجارية.