Nvidia تطلق Parakeet V2: نموذج مفتوح المصدر للترجمة الصوتية

أعلنت Nvidia عن إطلاق Parakeet V2، نموذج مفتوح المصدر للترجمة الصوتية الآلية (ASR)، الذي يتميز بدقة عالية وقدرة على تحويل ساعة من الصوت إلى نص في ثانية واحدة.

تفاصيل الخبر

أطلقت Nvidia مؤخرًا Parakeet V2، وهو نموذج متطور مفتوح المصدر للترجمة الصوتية الآلية (ASR). يتيح هذا النموذج تحويل ساعة من الصوت إلى نص في ثانية واحدة، مع تحقيق مستويات دقة تجارية.

أبرز النقاط:

تصدر Parakeet V2 قائمة Open ASR مع معدل خطأ في الكلمات 6.05%، متفوقًا على نماذج بارزة مثل Scribe من ElevenLabs و Whisper من OpenAI.
النموذج مفتوح المصدر ويعمل بموجب ترخيص CC-BY-4.0، مما يتيح للمطورين والباحثين الاستفادة منه بشكل حر.
يحتوي النموذج على ميزات متقدمة مثل العلامات الزمنية الدقيقة، التعامل مع الحروف الكبيرة، وضبط علامات الترقيم، بالإضافة إلى إمكانية تحويل الأغاني إلى كلمات.

الأهداف المستقبلية

أطلقت Nvidia نموذج Parakeet V2 المفتوح المصدر للترجمة الصوتية الآلية (ASR)، الذي يتفوق بدقة عالية وقدرة على تحويل ساعة من الصوت إلى نص في ثانية واحدة.

تحسين أداء تطبيقات الصوت: مع الأداء العالي لـ Parakeet V2، يمكن تطوير تطبيقات صوتية متقدمة بشكل أسرع وأكثر دقة.
تمكين المطورين والباحثين: النموذج المفتوح المصدر يمكن أن يسهم في تسريع الابتكارات في مجال الترجمة الصوتية والنماذج الصوتية الأخرى.
تقليل التكاليف: من خلال النموذج المفتوح، ستتمكن الشركات من بناء تطبيقات ترجمة صوتية متطورة دون الحاجة إلى استثمارات كبيرة.

إطلاق Parakeet V2 من Nvidia يشكل خطوة كبيرة نحو مستقبل أفضل للترجمة الصوتية، حيث يصبح الوصول إلى تقنيات متطورة أسهل وأكثر مرونة للمطورين حول العالم.