ذكاء اصطناعي يتجاوز اختبار تورينج رسميًا وGPT-4.5 يخدع البشر
أكدت دراسة جديدة من جامعة كاليفورنيا، سان دييغو، أن أنظمة الذكاء الاصطناعي يمكنها اجتياز اختبار تورينج بانتظام، حيث تمكن نموذج GPT-4.5 من OpenAI من خداع البشر في 73% من المحاولات.

تفاصيل الخبر
لأول مرة، تُثبت النماذج اللغوية الكبيرة (LLMs) أنها تستطيع تقليد البشر بدرجة عالية من الإقناع.
- اختبار تورينج، الذي اقترحه آلان تورينج عام 1950، يهدف إلى تقييم قدرة الذكاء الاصطناعي على محاكاة الإنسان عبر محادثات نصية فقط.
- اعتمدت الدراسة على مقارنة مباشرة بين الذكاء الاصطناعي والإنسان في محادثات استمرت خمس دقائق، حيث حاول الحكام تحديد من هو الذكاء الاصطناعي.
- ركّزت المحادثات بنسبة 60% على مواضيع يومية وتفاصيل شخصية، بدلاً من المعرفة التقنية أو الإجابات المعقدة.
- عند تبني شخصيات محددة، تمكن GPT-4.5 من خداع الحكام في 73% من الحالات، متجاوزًا حتى المشاركين البشريين في بعض الأحيان.
- نموذج LLaMa-3.1-405B من Meta اجتاز الاختبار أيضًا بنسبة نجاح 56%، بينما فشلت نماذج مثل GPT-4o بتحقيق أكثر من 20%.
الأهداف المستقبلية
يترتب على هذا الإنجاز تحديات وفرص جديدة، حيث تسعى الأبحاث إلى:
- تحسين معايير الكشف عن الذكاء الاصطناعي لتمييزه عن البشر.
- تطوير لوائح تنظيمية للتعامل مع تداعيات الذكاء الاصطناعي في المحادثات اليومية والأنظمة التفاعلية.
- استكشاف إمكانيات الذكاء الاصطناعي في تطبيقات أكثر تقدمًا، مثل التفاعل الاجتماعي المعقد والمساعدة النفسية.
لطالما كان اختبار تورينج معيارًا أساسيًا لقياس ذكاء الآلات، لكن مع تسارع تطور الذكاء الاصطناعي، لم يعد اجتيازه مفاجئًا. السؤال الأهم الآن: كيف سيؤثر ذلك على مستقبل التفاعل بين البشر والذكاء الاصطناعي؟