دراسة تكشف تحيز نماذج الذكاء الاصطناعي ضد اللهجات المحلية

كشفت دراسة أكاديمية حديثة أن النماذج اللغوية الكبيرة المستخدمة في نماذج الذكاء الاصطناعي ما زالت تعكس تحيزات سلبية ضد المتحدثين باللهجات المحلية، خاصة الألمانية.

تفاصيل الدراسة

تسلط هذه الدراسة الضوء على جانب حساس في تطور نماذج الذكاء الاصطناعي، وهو التحيز اللغوي والثقافي المدمج داخل النماذج اللغوية الكبيرة. وقد عُرضت نتائج البحث ضمن مؤتمر الأساليب التجريبية في معالجة اللغة الطبيعية 2025، أحد أهم المؤتمرات الأكاديمية في مجال معالجة اللغة باللهجات المحلية.

اعتمد الباحثون على اختبار 10 نماذج لغوية كبيرة، من بينها ChatGPT-5 mini وLlama 3.1، وركزت التجارب على كيفية توصيف هذه النماذج لمتحدثين باللهجات الألمانية المحلية، سواء عبر ربطهم بسمات شخصية أو عبر اتخاذ قرارات افتراضية تتعلق بعملهم أو بيئتهم الاجتماعية.

ومن خلال مهام الارتباط واتخاذ القرار، ظهرت أنماط واضحة من التحيز، خاصة عند استخدام اللهجات المحلية أو عند الإشارة الصريحة إلى أن النص مكتوب بلهجة إقليمية.

أبرز النتائج التي توصلت إليها الدراسة حول اللهجات المحلية:

جميع النماذج المختبرة أظهرت تحيزاً لغوياً ضد متحدثي اللهجات المحلية.
ربط المتحدثين بسمات نمطية سلبية مثل قلة التعليم أو العمل في الزراعة.
افتراض الحاجة إلى ضبط الغضب أو انخفاض المكانة الاجتماعية.
تصاعد حدة التحيز عند التصريح المباشر بأن النص مكتوب بلهجة محلية.
تكرار هذه التحيزات في قرارات افتراضية متعلقة بالوظائف والسكن.

وتخالف هذه النتائج بعض الدراسات السابقة التي افترضت أن ذكر الخصائص الديموغرافية صراحة يقلل التحيز، حيث أظهرت هذه الدراسة العكس تماماً في السياق اللغوي.

الأهداف المستقبلية

تشير الدراسة إلى أهمية تطوير نماذج لغوية أكثر حساسية للتنوع اللغوي والثقافي. ومن الأهداف المستقبلية المقترحة:

تحسين بيانات التدريب لتشمل تمثيلاً عادلاً للهجات.
تطوير أدوات تقييم تكشف التحيزات اللغوية مبكراً.
إشراك خبراء لغويين واجتماعيين في تصميم النماذج.
تقليل الاعتماد على الصور النمطية في مهام اتخاذ القرار.

تكشف هذه الدراسة أن تقدم الذكاء الاصطناعي لا يعني بالضرورة حياده، ما يجعل معالجة التحيز اللغوي باللهجات المحلية ضرورة أساسية لضمان عدالة التقنيات المستقبلية.