نموذج حبيبي يوحّد أكثر من 20 لهجة عربية بنظام تحويل نص للكلام

كشف باحثون من Shanghai Jiao Tong University، بقيادة مختبر X-LANCE، عن نموذج ذكاء اصطناعي جديد باسم نموذج حبيبي يُعد أول نظام مفتوح المصدر يهدف إلى توحيد أكثر من 20 لهجة عربية ضمن إطار واحد لتحويل النص إلى كلام (TTS).

جاء الإعلان عن نموذج حبيبي ضمن ورقة بحثية نُشرت على منصة arXiv تحت المعرف arXiv:2601.13802.

ما الذي يميز “نموذج حبيبي”؟

يتميز نموذج حبيبي بالتالي:

توحيد اللهجات العربية: يعالج فجوة بحثية كبيرة في نمذجة اللهجات العربية، بدل التركيز التقليدي على العربية الفصحى فقط.
دعم واسع النطاق: يشمل لهجات ذات موارد لغوية عالية وأخرى منخفضة الموارد ضمن نموذج موحد.
قدرة Zero-shot: يمكنه استنساخ لهجة أو صوت معين اعتمادًا على مقطع صوتي قصير دون تدريب إضافي مكثف.
تعلم سياقي (In-context learning): يسمح بتوسيع النموذج وتكييفه بمرونة دون الحاجة لإعادة تدريب شامل.
دون الحاجة إلى التشكيل: يعمل بكفاءة دون إلزام المستخدم بإدخال النصوص المشكلة.
تفوق على خدمات تجارية: أشار الباحثون إلى أن جودة التوليد تتجاوز إحدى الخدمات التجارية الرائدة (لم تُسمَّ في الورقة).
بناء معيار تقييم جديد: يسعى الفريق لإنشاء أول Benchmark منهجي لتقييم أنظمة توليد الكلام متعددة اللهجات العربية.

لماذا يمثل هذا إنجازًا مهمًا؟

تعاني أبحاث معالجة اللغة العربية صوتيًا من:

تعقيد لغوي كبير بين اللهجات.
نقص في البيانات الموحدة والمعايير القياسية.
غياب أطر تقييم منهجية واضحة.

يوفر “نموذج حبيبي” أساسًا تقنيًا مفتوح المصدر يمكن أن يدعم تطبيقات:

المساعدات الصوتية
مراكز الاتصال الذكية
خدمات الحكومة الرقمية
أدوات التعليم والتعلم الإلكتروني
إنشاء المحتوى الصوتي المحلي

يمثل المشروع خطوة مهمة نحو تمكين الذكاء الاصطناعي من فهم وتمثيل التنوع اللغوي العربي بصورة أدق وأكثر شمولًا، مع توفير قاعدة مفتوحة تُمكّن الباحثين والمطورين من البناء عليها مستقبلًا.