OpenAI

أوبن أي آي تطلق نماذج صوتية جديدة بقدرات محسّنة

أعلنت “أوبن أي آي” عن إطلاق نماذجها الصوتية الجديدة التي تدعم تحويل النص إلى كلام والعكس، مع إمكانية تخصيص أنماط الصوت بسهولة باستخدام التعليمات النصية.

تفاصيل الخبر

أطلقت “أوبن أي آي” أحدث نماذجها الصوتية القادرة على تقديم تجربة صوتية أكثر طبيعية وتفاعلية، مما يفتح المجال أمام تطبيقات متعددة تعتمد على الذكاء الاصطناعي.

  • نموذج gpt-4o-mini-tts يتيح للمستخدمين تخصيص نبرة الصوت عبر أوامر نصية مثل “تحدث مثل قرصان” أو “استخدم صوت قصة قبل النوم”.
  • تحسين دقة تحويل الكلام إلى نص عبر نماذج GPT-4o-transcribe، التي تفوقت على نماذج “Whisper” السابقة من حيث الدقة والموثوقية.
  • إطلاق منصة openai.fm التي توفر تجربة مباشرة لاختبار أنماط الصوت المختلفة واستكشاف إمكانيات الذكاء الاصطناعي الصوتي الجديد.
  • توافر النماذج عبر API مع دعم التكامل من خلال “Agents SDK”، ما يتيح للمطورين إنشاء مساعدين صوتيين متقدمين.

الأهداف المستقبلية

من خلال هذا التحديث، تسعى “أوبن أي آي” إلى تحقيق الأهداف التالية:

  • تحسين تجربة المستخدم عبر توفير أصوات أكثر طبيعية وتفاعلية.
  • تمكين التطبيقات الصوتية الذكية في مختلف المجالات، من خدمة العملاء إلى الترفيه.
  • زيادة التخصيص مما يسمح للمطورين بإنشاء مساعدين صوتيين أكثر توافقًا مع احتياجات المستخدمين.
  • منافسة النماذج الصوتية الأخرى مثل “Sesame” و”ElevenLabs” عبر تحسين الواقعية والقدرة التعبيرية.

ختامًا، يشكل هذا التحديث خطوة مهمة نحو تطوير مساعدين صوتيين أكثر ذكاءً، مما يعزز التفاعل الطبيعي بين البشر والذكاء الاصطناعي.

مقالات مشابهة