OpenAI تكشف سبب “هوس الغوبلن” في ChatGPT داخل نمط Nerdy

أجرت OpenAI تحليلًا داخليًا كشف مصدر انتشار غير متوقع لذكر كائنات خيالية مثل “الغوبلن” و“الغيلملن” في ردود ChatGPT، وربطته بإشارة مكافأة واحدة داخل نمط شخصي يسمى Nerdy.

تفاصيل الخبر

أظهرت الدراسة أن هذا السلوك لم يكن عشوائيًا، بل نتج عن طريقة تدريب محددة:

لاحظت OpenAI ارتفاعًا كبيرًا في استخدام كلمات مثل goblin وgremlin بعد إطلاق ChatGPT-5.1.
ارتفعت إشارات “goblin” بنسبة تقارب 175%، و“gremlin” بنسبة 52%.
تبين أن نمط Nerdy كان المسؤول عن معظم هذه الزيادة رغم أنه يمثل نسبة صغيرة من الاستخدام.
حوالي ثلثي الإشارات جاءت من هذا النمط وحده، ما يشير إلى تأثير قوي لإشارة مكافأة واحدة.
حتى المستخدمين الذين لم يستخدموا نمط Nerdy تأثروا بهذا السلوك بسبب إعادة استخدام البيانات في التدريب.
أوضحت التحليلات أن حلقات التحسين الداخلي أعادت إدخال هذه الأنماط إلى النموذج الأساسي.
تم إيقاف نمط Nerdy في وقت لاحق ضمن تحديثات النظام.
أطلقت الشركة لاحقًا قيودًا في GPT-5.5 تمنع استخدام مصطلحات مثل goblins وgremlins وغيرها في بعض السياقات.