دراسة جديدة: الذكاء الاصطناعي يحقق قفزة بإنجاز الأعمال الحرة

أظهرت دراسة حديثة أن نماذج الذكاء الاصطناعي أصبحت أكثر قدرة على تنفيذ مهام العمل الحر بجودة احترافية، بعدما سجلت معدلات أداء أعلى بكثير مقارنة بالعام الماضي. وتصدر نموذج Fable 5 النتائج، مما يعكس التطور السريع في قدرات الوكلاء الأذكياء على إنجاز المشاريع الواقعية.

تفاصيل الخبر

كشف كل من Center for AI Safety وScale Labs عن نتائج أحدث إصدار من مؤشر Remote Labor Index، وهو معيار يقيس أداء وكلاء الذكاء الاصطناعي في تنفيذ مهام العمل الحر التي يتم تقييمها بواسطة مراجعين بشريين مقارنة بمستوى محترفين في المجال.

وجاءت أبرز نتائج الدراسة على النحو التالي:

أُطلق مؤشر Remote Labor Index لأول مرة في أكتوبر 2025 لقياس قدرة نماذج الذكاء الاصطناعي على أتمتة وظائف العمل الحر الواقعية.
عند إطلاق المؤشر، تصدر نموذج GPT-5.2 النتائج بمعدل أتمتة بلغ 2.5% فقط.
الإصدار الجديد أظهر ارتفاعًا يقارب ستة أضعاف في أداء النماذج الرائدة خلال أقل من عام.
اعتمدت الدراسة على 240 مهمة حقيقية من منصات العمل الحر، شملت مجالات متنوعة مثل تصميم المجوهرات ثلاثية الأبعاد، وإنشاء الإعلانات المتحركة، وتصميم المخططات الهندسية.
تم تقييم جميع النتائج بواسطة مراجعين بشريين، مع مقارنة جودة مخرجات النماذج بأداء محترفين في كل تخصص.
حقق نموذج Anthropic Fable 5 أفضل نتيجة حتى الآن، بعدما ساوى أو تفوق على أداء المحترف في 16.1% من المشاريع.
جاء نموذج Opus 4.8 في المركز الثاني بنسبة 8.3%.
احتل نموذج OpenAI GPT-5.5 المركز الثالث بنسبة 6.3%.
تشير النتائج إلى أن النماذج الحديثة أصبحت أكثر قدرة على تنفيذ المهام المعقدة، لكنها لا تزال بعيدة عن الوصول إلى مستوى احترافي في غالبية الأعمال.

الأهداف المستقبلية

تشير نتائج المؤشر إلى أن المرحلة المقبلة ستشهد توسعًا أكبر في استخدام الذكاء الاصطناعي داخل سوق العمل الحر، مع استمرار الحاجة إلى الإشراف البشري لضمان الجودة.

ومن أبرز التوقعات المستقبلية:

تحسين قدرة النماذج على تنفيذ نسبة أكبر من المشاريع بجودة احترافية.
زيادة إنتاجية المستقلين عبر استخدام الذكاء الاصطناعي كمساعد لإنجاز المهام بسرعة أكبر.
تطوير معايير تقييم جديدة تقيس أداء النماذج في وظائف أكثر تعقيدًا وتخصصًا.
توسيع نطاق الاختبارات ليشمل مجالات مهنية إضافية تتطلب مهارات إبداعية وتقنية.
تقليل الوقت اللازم لإنجاز المشاريع مع الحفاظ على جودة النتائج.
استمرار المنافسة بين شركات الذكاء الاصطناعي لتحسين أداء نماذجها في سيناريوهات العمل الواقعية.
تعزيز مفهوم التعاون بين الإنسان والذكاء الاصطناعي، حيث يتولى النموذج تنفيذ جزء كبير من العمل بينما يحتفظ الإنسان بالمراجعة واتخاذ القرار النهائي.

توضح نتائج Remote Labor Index أن الذكاء الاصطناعي يحقق تقدمًا سريعًا في تنفيذ مهام العمل الحر، إلا أن الأداء الاحترافي الكامل لا يزال محدودًا. وفي الوقت الحالي، يبدو أن أكبر المستفيدين سيكونون المستقلين الذين يوظفون هذه الأدوات لزيادة إنتاجيتهم، بدلًا من الاعتماد عليها كبديل كامل عن الخبرة البشرية.