Chatterbox من Resemble AI: نموذج مفتوح المصدر لتقليد الصوت
أعلنت Resemble AI عن إطلاق Chatterbox، نموذج مجاني ومفتوح المصدر لتقليد الأصوات يتفوق على ElevenLabs في اختبارات المستخدمين.

تفاصيل إطلاق النموذج
أطلقت شركة Resemble AI نموذج Chatterbox، وهو نموذج حديث لتوليد الصوت وتقليده، متاح الآن كمشروع مفتوح المصدر تحت رخصة MIT.
- تفوق على ElevenLabs: في اختبارات الاستماع الحديثة، فضّل 63.75% من المشاركين Chatterbox على ElevenLabs من حيث جودة الصوت وتقليد الأسلوب.
- مفتوح المصدر ومجاني بالكامل: يتوفر Chatterbox كمكتبة يمكن تثبيتها مباشرة عبر Python، مما يمنح المطورين والباحثين الحرية الكاملة في التعديل والاستخدام.
- يدعم ميزتين رئيسيتين:
- تحويل النص إلى كلام (Text-to-Speech)
- تحويل صوت إلى صوت آخر (Voice Conversion)
- أداء واقعي عالي الجودة: يوفّر Chatterbox أصواتًا طبيعية وقابلة للتخصيص، ويمكنه تقليد نبرة وأسلوب المتحدث بدقة كبيرة.
- سهولة التجربة: يتوفر على GitHub مع صفحة تجريبية عبر Hugging Face، بالإضافة إلى عينات صوتية قابلة للاستماع مباشرة.
الأهداف المستقبلية للنموذج
تسعى Resemble AI إلى تعزيز مكانة النموذج كأداة رائدة في الذكاء الاصطناعي الصوتي من خلال:
- دعم لغات إضافية لتوسيع الاستخدام عالميًا
- تحسين نماذج التدريب لتقليد لهجات ونبرات أدق
- تسهيل التكامل مع أدوات البودكاست والتعليق الصوتي
- تعزيز واجهات الاستخدام لتكون مناسبة للمطورين غير المتخصصين
Chatterbox يفتح بابًا جديدًا للابتكار في تقنيات تقليد الصوت، وهو خيار مثالي للمطورين الذين يبحثون عن أداء عالي بدون قيود الملكية أو التكلفة.
