إطلاق VibeThinker-1.5B: نموذج ذكاء صناعي ينتصر على العمالقة

أطلقت WeiboAI نموذجاً مفتوح المصدر يحمل اسم VibeThinker-1.5B بعدد معامِلات يبلغ 1.5 مليار فقط وتكلفة تدريب لاحقة تُقدَّر بـ 7,800 دولار، محققاً أداءً قويّاً في الرياضيات والبرمجة يُضاهي نماذج ضخمة.

التفاصيل

فيما يلي نظرة شاملة على أبرز مواصفات نموذج VibeThinker-1.5B والتقنيات التي جعلته يتفوّق رغم صِغر حجمه:

  • النموذج عبارة عن نموذج كثيف (dense) بحجم 1.5 مليار معامِلات.
  • تكلفة مرحلة ما بعد التدريب (“post-training”) تبلغ نحو 7,800 دولار أمريكي.
  • استخدم إطار تدريب يُسمى مبدأ «الطيف إلى الإشارة» (Spectrum-to-Signal Principle – SSP) الذي يقسم العملية إلى:
    • مرحلة Fine-Tuning بموجب الإشراف (SFT) لتعزيز تنوع الحلول.
    • مرحلة Reinforcement Learning لتقوية المسارات الصحيحة (Signal) من هذا الطيف.
  • أداء النموذج في الرياضيات: مثلاً على معايير AIME24 حصل على 80.3، بينما النموذج الضخم DeepSeek R1 (671 بليون معامِلات) حصل على 79.8.
  • أداءه في البرمجة: على معيار LiveCodeBench v6 حصل على 51.1، متقدم على Magistral Medium الذي حصل على 50.3.
  • النموذج متاح مفتوح المصدر بتراخيص مرنة (MIT) على منصات مثل Hugging Face وGitHub.

الأهداف المستقبلية

فيما يأتي مجموعة من الأهداف التي يُحتمل أن تسعى WeiboAI لتحقيقها من خلال هذا الإصدار:

  • دفع مفهوم أن النماذج الأصغر حجماً يمكن أن تحقق أداء عالي في التفكير والبرمجة بدل الاعتماد فقط على تكبير المعاملات.
  • فتح الباب أمام المزيد من الباحثين والمؤسسات ذات الموارد المحدودة للمساهمة في أبحاث الذكاء الصناعي والتدريب.
  • توفير أساس قابل للتخصيص والتشغيل على أجهزة أبسط أو بنية تحتية أقل تكلفة، مما يعزز الانتشار.
  • تحسين قدرات النموذج في المعرفة العامة خارج نطاق الرياضيات والبرمجة، إذ التقرير يشير إلى أن هناك فجوة ما زالت قائمة في قدرات المعرفة الموسوعية.

إطلاق VibeThinker-1.5B يشكّل علامة فارقة في عالم تطوير نماذج الذكاء الصناعي، موضحاً أن الابتكار في طريقة التدريب قد يغيّر قواعد اللعبة — فبدلاً من مضاعفة حجم المعاملات، التركيز على تنوّع الحلول وتدريب ذكي قد يكون كافياً لتحقيق أداء متميّز.

مقالات مشابهة