إطار التعلم السقراطي من ديب مايند لتحسين الذكاء الاصطناعي
طرحت ديب مايند التابعة لجوجل إطارًا جديدًا يُعرف بـ’التعلم السقراطي اللامحدود’ والذي يمكن أن يمكن أنظمة الذكاء الاصطناعي من تحسين نفسها عبر التفاعلات اللغوية بدون الحاجة إلى بيانات خارجية أو تغذية راجعة من البشر.

تفاصيل الخبر:
يستند نهج التعلم السقراطي اللامحدود إلى “ألعاب اللغة”، وهي تفاعلات منظمة بين وكلاء الذكاء الاصطناعي توفر فرصًا للتعلم وآليات مدمجة للتغذية الراجعة.
- إنشاء سيناريوهات تدريبية ذاتية:
يقوم النظام بإنشاء سيناريوهات تدريبية بنفسه ويقيم أدائه بناءً على مقاييس وألعاب مكافأة. - ثلاث مستويات لتحسين الذات:
- تعلم مدخلات ومخرجات أساسية.
- اختيار الألعاب.
- تحسين الكود الذاتي المحتمل.
- تحسين مفتوح النهايات:
يمكن لهذا الإطار أن يمكن من التحسين المستمر دون الحاجة إلى تدخل بشري، محصور فقط بالوقت وموارد الحوسبة.
الأهداف المستقبلية:
- تعزيز الكفاءة الذاتية: تطوير أنظمة قادرة على تحسين نفسها بشكل مستمر.
- التوافق مع الأهداف البشرية: ضمان أن تظل النماذج متوافقة مع الأهداف والقيم البشرية حتى عندما تتولى تحسين نفسها.
- تقليل الاعتماد على البيانات الخارجية: تخفيض الحاجة إلى التغذية الراجعة البشرية أو البيانات الخارجية.
إطار التعلم السقراطي اللامحدود من ديب مايند يمثل خطوة كبيرة نحو تطوير أنظمة ذكاء اصطناعي قادرة على تحسين نفسها بشكل مستمر. التحدي الرئيسي سيكون الحفاظ على توافق هذه الأنظمة مع الأهداف البشرية.