SubQ تقدم ثورة جديدة في معالجة السياق الطويل بالذكاء الاصطناعي

كشفت شركة Subquadratic عن نموذجها الجديد SubQ، الذي يعتمد على تقنية SSA لمعالجة السياقات الطويلة بكفاءة غير مسبوقة، مع نافذة سياق تصل إلى 12 مليون رمز وسرعة أعلى بعشرات المرات مقارنة بالنماذج التقليدية.

تفاصيل الخبر

يشهد قطاع الذكاء الاصطناعي سباقاً متسارعاً لتطوير نماذج قادرة على التعامل مع كميات ضخمة من البيانات والسياقات الطويلة دون تراجع الأداء أو ارتفاع التكاليف.

  • يعتمد نموذج SubQ على تقنية جديدة تسمى SSA أو Subquadratic Sparse Attention.
  • التقنية صُممت لمعالجة مشاكل السياق الطويل في البرمجة، العقود، قواعد البيانات، والأبحاث الضخمة.
  • الشركة تؤكد أن النموذج يوفر نافذة سياق تصل إلى 12 مليون Token.
  • SSA تعمل بطريقة مختلفة عن آلية الانتباه التقليدية المستخدمة في معظم النماذج الحديثة.
  • بدلاً من مقارنة كل رمز مع جميع الرموز الأخرى، تقوم التقنية بتحديد الأجزاء المهمة فقط داخل السياق.
  • هذا الأسلوب يقلل استهلاك الموارد ويمنح النموذج قدرة أسرع على استرجاع المعلومات المهمة.
  • الشركة كشفت أن النموذج يحقق تسارعاً يصل إلى 52.2 مرة عند معالجة مليون Token مقارنة بالأنظمة التقليدية.
  • الاختبارات أظهرت أيضاً انخفاضاً كبيراً في العمليات الحسابية المطلوبة داخل النموذج.
  • SubQ حقق نتائج قوية في اختبارات RULER وMRCR v2 الخاصة بفهم واسترجاع المعلومات عبر السياقات الطويلة.
  • النموذج استطاع منافسة أنظمة متقدمة مثل OpenAI وGoogle DeepMind وAnthropic في بعض الاختبارات.
  • الشركة أوضحت أن المشكلة الحقيقية ليست فقط في حجم نافذة السياق، بل في قدرة النموذج على التفكير الفعلي داخل هذا الحجم الضخم من البيانات.

الأهداف المستقبلية

تعكس تقنية SSA اتجاهاً جديداً في صناعة الذكاء الاصطناعي يركز على الكفاءة العملية بدلاً من مجرد زيادة أحجام النوافذ النصية.

  • تهدف Subquadratic إلى جعل معالجة ملايين الرموز أمراً عملياً من حيث التكلفة والسرعة.
  • التقنية قد تقلل الحاجة إلى أنظمة RAG المعقدة وتقنيات تقسيم البيانات التقليدية.
  • النموذج يستهدف تطبيقات البرمجة الضخمة، تحليل العقود، الأبحاث العلمية، وإدارة البيانات المؤسسية.
  • الشركة تسعى لتطوير وكلاء ذكاء اصطناعي قادرين على الاحتفاظ بالسياق لفترات طويلة دون فقدان المعلومات المهمة.
  • النجاح في هذا المجال قد يغير طريقة بناء أنظمة الذكاء الاصطناعي المستقبلية داخل الشركات الكبرى.

في النهاية، يبدو أن SubQ تحاول إعادة تعريف مفهوم “السياق الطويل” في الذكاء الاصطناعي، عبر التركيز على الفهم الحقيقي للمعلومات وليس مجرد القدرة على استيعاب عدد أكبر من الرموز النصية.

مقالات مشابهة