أخبار

OpenAI تطلق gpt-realtime لتعزيز قدرات وكلاء الصوت

31/08/202531/08/2025

أعلنت OpenAI عن إصدار gpt-realtime من واجهة Realtime API مع نموذج حديث للصوت، مزود بإدراك الإشارات غير اللفظية ودعم الصور، لتعزيز تفاعل الوكلاء الصوتيين مع المستخدمين.

تفاصيل الخبر

أبرز ميزات الإصدار الجديد:

gpt-realtime يتيح التفاعل الصوتي اللحظي مع اكتشاف الإشارات غير اللفظية وتغيير اللغة بسلاسة.
حقق النموذج دقة 82.8% في اختبارات فهم الصوت مقارنة بـ 65.6% في الإصدار السابق.
دعم Model Context Protocol (MCP) لربط الوكلاء الصوتيين بمصادر بيانات وأدوات خارجية بدون تكاملات مخصصة.
إمكانية التعامل مع مدخلات الصور مثل الصور الفوتوغرافية أو لقطات الشاشة لتفسير المعلومات المرئية ضمن الحوار.
يتيح التحديث دمج الوكلاء الصوتيين بسهولة في خدمات دعم العملاء والتطبيقات الصوتية المخصصة.

الأهداف المستقبلية

تركز OpenAI على:

تعزيز قدرات التفاعل البشري الطبيعي للوكلاء الصوتيين في مختلف اللغات والسيناريوهات.
تمكين المطورين والشركات من دمج الذكاء الاصطناعي الصوتي بسلاسة مع البيانات الخارجية والأدوات الأخرى.
توسيع الوظائف لتشمل تفسير الصور والفيديوهات في الوقت الحقيقي داخل المحادثات.
دعم الاعتماد التجاري للوكلاء الصوتيين في مجالات مثل خدمة العملاء والتطبيقات التعليمية والصحية.

إطلاق gpt-realtime يمثل خطوة كبيرة نحو جعل الوكلاء الصوتيين أكثر ذكاءً وتفاعلاً، مما يفتح المجال لتطبيقات عملية واسعة في قطاع الأعمال وخدمة العملاء.

أخبار

ديب سيك تحد من الوصول إلى نموذجها بسبب زيادة الطلب

10/02/202510/02/2025

أعلنت شركة ديب سيك عن تقييد الوصول إلى نموذج الذكاء الاصطناعي الخاص بها، وذلك بسبب الطلب…

أخبار

تيليجرام تُطلق أول نسخة رسمية لحواسيب سطح المكتب

10/11/202411/11/2024

أعلنت شركة تيليجرام عن إطلاق أول نسخة رسمية لتطبيقها المخصص لحواسيب سطح المكتب ويندوز، مما يوفر…

أخبار

Hugging Face تطلق Open Computer Agent

11/05/202511/05/2025

أعلنت Hugging Face عن إطلاق Open Computer Agent، عميل ذكاء اصطناعي مجاني بطيء نسبيًا، قادر على…

أخبار

Temenos تقود ثورة الذكاء الاصطناعي في عالم البنوك الرقمية

25/11/202524/11/2025

تعزز شركة Temenos مكانتها العالمية في البنوك الرقمية عبر الابتكار المستمر واعتماد حلول ذكاء اصطناعي متقدمة،…

أخبار

AMA Augment Code: مستقبل وكلاء الذكاء الاصطناعي في البرمجة

01/09/202531/08/2025

أجرت Augment Code جلسة AMA على r/webdev مع مؤسسيها لمناقشة مستقبل وكلاء الذكاء الاصطناعي في تطوير…

أخبار

أدوبي تطلق أدوات فيديو تعتمد على الذكاء الاصطناعي، تتحدى OpenAI وMeta

15/10/202415/10/2024

أعلنت شركة أدوبي مؤخرًا عن إطلاق أدواتها الجديدة للفيديو المدعومة بالذكاء الاصطناعي، والمعروفة باسم Firefly Video Model. هذه الأداة المبتكرة قادرة على إنشاء مقاطع فيديو من النصوص المكتوبة، مما يجعلها تنافس شركات مثل OpenAI وMeta. ما يميز Firefly هو تدريبها على المحتوى المرخص، بهدف معالجة القضايا الأخلاقية وحقوق الطبع والنشر. تفاصيل الخبر تم تصميم نموذج الفيديو Firefly من أدوبي ليكون آمنًا تجاريًا ويُدمج في العديد من تطبيقات Adobe Creative Cloud، بما في ذلك Premiere Pro وPhotoshop وIllustrator وAdobe Express. تُعزز الأداة قدرات تحرير الفيديو من خلال تمديد المقاطع، وتنعيم الانتقالات، وتحسين كفاءة إنتاج الفيديو بشكل عام. الأهداف المستقبلية تهدف أدوبي:

تفاصيل الخبر

الأهداف المستقبلية

مقالات مشابهة