xAI تطلق Grok Voice Agent API لتطوير تقنيات الصوت الذكية
أعلنت شركة xAI عن إطلاق Grok Voice Agent API، لتمكين المطورين من إنشاء وكلاء صوتيين متعدد اللغات بسرعة وكفاءة، مع دعم أدوات البحث والمهام في الوقت الحقيقي.

تفاصيل الخبر
تم بناء Grok Voice Agent API على نفس التكنولوجيا المستخدمة في تطبيقات Grok ومركبات Tesla، ويتيح للمطورين الاستفادة من نماذج الصوت إلى الصوت المتقدمة للشركة.
وتسعى xAI لتوفير تجربة صوتية طبيعية وسريعة مع دقة عالية في النطق، والتبديل السلس بين اللغات، إضافة إلى إمكانية الوصول إلى أدوات مخصصة.
- النموذج يتصدر اختبارات Big Bench Audio، ويحقق زمن استجابة أقل من ثانية واحدة، أي أسرع بحوالي 5 مرات من أقرب منافس.
- التسعير يعتمد على معدل ثابت يبلغ 0.05 دولار لكل دقيقة اتصال، ما يجعله الأكثر كفاءة من حيث التكلفة في السوق.
- يمكن للوكلاء الصوتيين التحدث بعدة لغات بطلاقة، مع قدرة على الالتقاط الدقيق للفروق اللهجية والنطق، مع دعم الإشارة للرد بلغة محددة عند الحاجة.
- تجربة Tesla كانت شريكًا تصميميًا رئيسيًا، حيث يتيح الوكيل الوصول إلى حالة السيارة، البحث عن الاتجاهات، والتحكم في التنقل لتقديم تجربة تخطيط رحلات سلسة.
- تشمل الأصوات المعبرة المتوفرة Ara وEve وLeo، مع دعم مؤثرات صوتية طبيعية مثل الهمس والضحك والتنهد لتحسين واقعية التفاعل.
الأهداف المستقبلية
تركز xAI على توسيع قدرات Grok Voice Agent API لتعزيز التطبيقات الصوتية في مختلف القطاعات.
ومن أبرز الأهداف:
- إطلاق نقاط نهاية مستقلة لتحويل النص إلى كلام والعكس.
- تحسين أداء النماذج الصوتية في النطق وزمن الاستجابة.
- توسيع التكامل مع أدوات مخصصة والبحث في الوقت الحقيقي عبر الإنترنت.
- توفير بيئة اختبار مباشرة للمطورين لتجربة أصوات ونماذج مختلفة قبل دمجها في التطبيقات.
مع إطلاق Grok Voice Agent API، تتيح xAI للمطورين بناء وكلاء صوتيين متقدمين قادرين على أداء المهام بسرعة ودقة، وفتح آفاق جديدة لتجارب صوتية طبيعية ومتعددة اللغات.
