OpenAI تطلق Safety Evaluations Hub لاختبارات سلامة النماذج

أعلنت OpenAI عن إطلاق “Safety Evaluations Hub”، وهي لوحة عرض تفاعلية تُظهر نتائج اختبارات السلامة لنماذج الذكاء الاصطناعي الخاصة بها.

الهدف من هذه المبادرة هو تعزيز الشفافية والاستجابة للمخاوف المتزايدة من المجتمع والمختصين بشأن مخاطر الذكاء الاصطناعي. اللوحة ستُحدّث بشكل دوري وتعرض مؤشرات واضحة حول مدى أمان النماذج ودقتها.

تفاصيل الخبر

أطلقت OpenAI أداة جديدة تُعرف بـ “Safety Evaluations Hub” لعرض أداء نماذجها في اختبارات السلامة بشكل دوري وشفاف.

تعرض اللوحة نتائج أداء النماذج عبر أربع مؤشرات رئيسية:
- إنتاج المحتوى الضار.
- قابلية الاختراق (Jailbreak Vulnerability).
- معدلات الهلوسة (Hallucination Rates).
- الالتزام بالتعليمات (Instruction Following).
تُظهر البيانات مقارنة بين النماذج المختلفة التي طورتها OpenAI مثل GPT-4 وGPT-4o.
تتضمن المؤشرات:
- مدى رفض النموذج إنتاج محتوى ضار أو منحاز.
- الدقة في الإجابة على الأسئلة الواقعية.
تأتي هذه المبادرة في أعقاب الانتقادات التي وُجهت لـ OpenAI بسبب عدم الشفافية، خاصةً بعد التحديات التي صاحبت تحديث GPT-4o الأخير.
OpenAI وعدت بتحديث هذه البيانات “بشكل دوري” كجزء من التزامها بشفافية أكبر تجاه المجتمع.

الأهداف المستقبلية

تهدف OpenAI إلى بناء جسور ثقة بين المجتمع ومطوري الذكاء الاصطناعي عبر نهج أكثر انفتاحًا في السلامة.

تعزيز الشفافية في اختبارات السلامة الخاصة بالنماذج المتقدمة.
توفير بيانات مرجعية للمستخدمين والباحثين لفهم أداء النماذج بدقة.
تشجيع تبني معايير مشتركة بين الشركات المطورة للذكاء الاصطناعي.
تحسين تصميم النماذج المستقبلية بناءً على نتائج القياسات الواقعية.
الرد العملي على المخاوف التنظيمية والسياسية حول مخاطر النماذج الذكية.

خطوة OpenAI نحو مشاركة Safety Evaluations Hub تقييمات السلامة علنًا تعكس تحولًا مهمًا في صناعة الذكاء الاصطناعي، لكن مدى فاعليتها سيعتمد على مصداقية التحديثات واستمراريتها.