Steerling-8B نموذج لغوي قابل للتفسير من Guide Labs

أعلنت شركة Guide Labs عن إطلاق نموذجها اللغوي الجديد Steerling-8B، وهو نموذج مفتوح المصدر يركز على القابلية للتفسير وتتبع المخرجات بدقة، في خطوة تستهدف معالجة تحديات الصندوق الأسود في أنظمة الذكاء الاصطناعي الحديثة.

تفاصيل الخبر

يأتي إطلاق Steerling-8B كجزء من توجه متزايد نحو تطوير نماذج ذكاء اصطناعي أكثر شفافية وقابلية للفهم، خاصة في القطاعات الحساسة التي تتطلب تفسيراً واضحاً لآلية اتخاذ القرار.

يعتمد النموذج على معمارية Causal Diffusion Language Model مع طبقة مفاهيم قابلة للتفسير.
يضم نحو 8 مليارات معلمة، مع طول سياق يصل إلى 4096 رمزاً.
يستخدم أسلوب block-causal attention الذي يسمح بانتباه ثنائي الاتجاه داخل كتل محددة، مع الحفاظ على التسلسل السببي بين الكتل.
يتضمن 33,732 مفهوماً معروفاً و101,196 مفهوماً غير معروف لإعادة بناء التمثيلات الداخلية بدقة.
يتيح تتبع كل كلمة مولدة وربطها بمفاهيم محددة داخل النموذج، ما يقلل الحاجة إلى أدوات تفسير خارجية.
يعمل بدقة bfloat16 ويتطلب نحو 18 جيجابايت من ذاكرة GPU.
تم تدريبه على نسخة موسعة من بيانات Nemotron-CC-HQ بإجمالي يقارب 1.35 تريليون رمز.

وتؤكد الشركة أن النموذج يحقق نحو 90% من أداء النماذج المتقدمة، رغم استخدام بيانات تدريب أقل، مع توفير مزايا تفسيرية قد تجعله مناسباً للقطاع المالي والرعاية الصحية والامتثال التنظيمي.

الأهداف المستقبلية

تسعى Guide Labs إلى توسيع هذا النهج ليشمل نماذج أكبر حجماً وأكثر قوة، مع تطوير أدوات إضافية تسهل التحكم في المفاهيم الداخلية للنموذج وتوجيه عملية التوليد النصي.

إطلاق تقارير تقنية تفصيلية حول المعمارية.
توفير دعم موسع لواجهات برمجة التطبيقات والتكامل مع الأنظمة المؤسسية.
العمل على إتاحة إمكانيات الضبط الدقيق مستقبلاً.
تطوير آليات أعمق لإسناد البيانات التدريبية وتحليل مصادر المخرجات.

في ظل تصاعد الاهتمام بالشفافية في الذكاء الاصطناعي، يمثل Steerling-8B محاولة عملية لإعادة تعريف العلاقة بين الأداء العالي والقابلية للتفسير، وقد يشكل خطوة مهمة نحو نماذج أكثر مسؤولية وموثوقية في الاستخدام المؤسسي.