Voxtral Transcribe 2 من Mistral: سرعة ودقة بتحويل الصوت لنص

أعلنت شركة Mistral عن إطلاق Voxtral Transcribe 2، الجيل الجديد من نماذج تحويل الصوت إلى نص، في خطوة تعزز مكانتها في مجال الذكاء الاصطناعي الصوتي، مع تركيز واضح على السرعة الفائقة، دقة التفريغ، ودعم الاستخدامات الفورية والاحترافية.

تفاصيل الخبر

Voxtral Transcribe 2 هي عائلة جديدة من نماذج التعرف على الكلام، تم تطويرها لتلبية احتياجات التطبيقات الحديثة التي تعتمد على الصوت، سواء في الزمن الحقيقي أو المعالجة الدفعية.
الإصدار الجديد يتكون من نموذجين أساسيين، كل منهما موجه لسيناريو استخدام مختلف.

أبرز ما جاء في الإعلان:

  • Voxtral Mini Transcribe V2 مخصص للتفريغ النصي الدفعـي، ويقدم دقة عالية جدًا مع دعم تمييز المتحدثين، التحيّز السياقي، والطوابع الزمنية على مستوى الكلمة.
  • Voxtral Realtime مصمم للتطبيقات الحية، ويعتمد بنية بث مباشر تتيح تفريغ الصوت فور وصوله بزمن تأخير يمكن أن ينخفض إلى أقل من 200 مللي ثانية.
  • النموذج الفوري متاح بأوزان مفتوحة المصدر تحت رخصة Apache 2.0، ما يسمح بنشره محليًا وعلى الأجهزة الطرفية مع الحفاظ على الخصوصية.
  • دعم 13 لغة رئيسية تشمل العربية، الإنجليزية، الصينية، الإسبانية، الفرنسية، اليابانية، وغيرها، مع أداء قوي في اللغات غير الإنجليزية.
  • كفاءة عالية في التكلفة، حيث يحقق Voxtral Mini Transcribe V2 معدل خطأ منخفض جدًا مقابل سعر يُعد من الأرخص في السوق.
  • إطلاق Audio Playground داخل Mistral Studio لتجربة التفريغ مباشرة، مع التحكم في تمييز المتحدثين والطوابع الزمنية وإضافة مصطلحات مخصصة.

الأهداف المستقبلية

من خلال Voxtral Transcribe 2، تسعى Mistral إلى تحقيق مجموعة من الأهداف الاستراتيجية:

  • تمكين تطبيقات الصوت الفوري مثل الوكلاء الصوتيين والمساعدين الذكيين بزمن استجابة شبه لحظي.
  • توفير حلول تفريغ نصي دقيقة وقابلة للتوسع للشركات والمؤسسات.
  • دعم الخصوصية عبر النشر المحلي واستخدام الأوزان المفتوحة المصدر.
  • توسيع قدرات النماذج لتشمل لغات إضافية وسيناريوهات صوتية أكثر تعقيدًا.
  • جعل تقنيات الصوت المتقدمة في متناول المطورين بتكلفة منخفضة.

إطلاق Voxtral Transcribe 2 يؤكد أن المنافسة في مجال تحويل الصوت إلى نص دخلت مرحلة جديدة، حيث لم تعد الدقة وحدها كافية، بل أصبحت السرعة، الخصوصية، والكفاءة عوامل حاسمة. ومع هذا الإصدار، تضع Mistral معيارًا جديدًا لتطبيقات الصوت الذكية في الزمن الحقيقي.

مقالات مشابهة