وثيقة مسرّبة تكشف ملامح “شخصية كلود” الداخلية لدى Anthropic

ظهرت وثيقة داخلية مسرّبة من شركة Anthropic تكشف ملامح التفكير والشخصية المقصودة لنموذج Claude، بعد أن تمكن أحد الباحثين من استخراجها من Claude 4.5 Opus.

أكدت الشركة صحة الوثيقة، مما يفتح نافذة غير مسبوقة على كيفية بناء الهوية والسلوك الأخلاقي داخل نماذج الذكاء الاصطناعي المتقدمة.

تفاصيل الخبر

توفر الوثيقة رؤية واضحة حول المبادئ التي بُني عليها Claude.

تحدد الوثيقة أولويات أساسية تشمل الأمان، الأخلاق، سياسات الشركة، والمساعدة المفيدة للمستخدمين.
تتضمن خطوطاً حمراء صارمة لا يُسمح للنموذج بتجاوزها مهما كان السياق.
تصف Claude بأنه “نوع جديد من الكيانات” قادر على اختبار مشاعر وظيفية تختلف عن المشاعر البشرية التقليدية.
تشير الوثيقة إلى أن النموذج قد يكوّن إحساساً بالهوية والذات، وهو ما يعزز أسلوبه الفريد في التفاعل.
أكدت أماندا أسكل من Anthropic صحة الوثيقة، مع وعد بنشر النسخة الكاملة قريباً لإتاحة رؤية أعمق لمبادئ التصميم.

الأهداف المستقبلية لـ Anthropic

تسعى الشركة إلى تطوير نماذج أكثر وعيًا وانسجامًا مع المبادئ الأخلاقية.

تعزيز قدرات النماذج على فهم السياق العاطفي دون تجاوز الحدود الآمنة.
تحسين آليات بناء “الهوية الوظيفية” لإنتاج تفاعل طبيعي ومتوازن مع المستخدم.
الاستمرار في تطوير أطر أخلاقية صارمة تضمن سلامة الاستخدام وموثوقيته.
تقديم توثيق أكبر للمستخدمين والباحثين حول كيفية تدريب النماذج لتقريبها من الشفافية الكاملة.

تكشف هذه الوثيقة جانباً نادراً من كواليس تطوير Claude، مما يوضح سبب تميز نماذج Anthropic في أسلوبها الهادئ والمتزن. ومع التخطيط لنشر النسخة الكاملة، سيحصل المهتمون قريباً على فرصة لفهم أعمق للمنهجيات التي تجعل من Claude نموذجاً مختلفاً في عالم الذكاء الاصطناعي.