Hume AI تطلق Octave 2: ذكاء صوتي متعدد اللغات

أعلنت Hume AI عن الجيل الثاني من نموذجها الصوتي Octave 2، الذي يقدم قدرات متقدمة في تحويل النص إلى كلام بـ 11 لغة، مع ميزات جديدة مثل تحويل الأصوات وتحرير الفونيمات.

تفاصيل الخبر

يأتي Octave 2 كقفزة كبيرة في عالم الذكاء الاصطناعي الصوتي.

  • يفهم النغمة العاطفية للكلام بشكل أعمق لتوليد أصوات طبيعية.
  • يدعم 11 لغة تشمل العربية، الإنجليزية، الفرنسية، الألمانية، الإسبانية، اليابانية، الكورية وغيرها.
  • أسرع بنسبة 40% من الجيل السابق، ويولد الصوت في أقل من 200 ملي ثانية.
  • يقدم ميزات جديدة غير مسبوقة مثل تحويل الأصوات والتحكم المباشر في الفونيمات.
  • أكثر دقة في نطق الكلمات النادرة والأرقام والرموز.
  • نصف تكلفة Octave 1، مما يجعله مناسباً للتطبيقات واسعة النطاق.

الابتكارات الرئيسية

تطمح Hume AI لجعل النموذج معياراً جديداً في الذكاء الصوتي.

  • تحويل الأصوات: استبدال صوت بآخر مع الحفاظ على الإيقاع والصفات الصوتية.
  • تحرير الفونيمات: تعديل النطق والتوقيت لإنتاج أسماء أو كلمات جديدة بدقة عالية.
  • EVI 4 mini: نسخة مصغرة من النموذج تعمل عبر API لبناء تطبيقات محادثة فورية بـ 11 لغة.
  • دعم التطبيقات في مجالات مثل الترفيه، الألعاب، خدمة العملاء، والترجمة الفورية.

مع إطلاق Octave 2، تقدم Hume AI تجربة صوتية أكثر واقعية وتفاعلية، مع سرعة وكفاءة غير مسبوقة، ما يجعل الذكاء الاصطناعي الصوتي أقرب من أي وقت مضى لمحاكاة الأداء البشري الطبيعي.

مقالات مشابهة