FlexOlmo نهج ثوري لتدريب النماذج اللغوية بتعاون آمن بالبيانات
قدّمت AI2 نموذج FlexOlmo الجديد الذي يغيّر قواعد اللعبة في تطوير نماذج اللغة، عبر تمكين المؤسسات من التعاون دون مشاركة البيانات الخام أو فقدان السيطرة عليها.

ما هو FlexOlmo؟
هو إطار تدريبي مبتكر يُتيح للمؤسسات تدريب نماذج لغوية باستخدام بياناتهم الخاصة دون مشاركتها فعليًا. يعالج النموذج تحديات الخصوصية والتحكم والاعتماد على البيانات المركزية.
النقاط الأبرز:
- يمكن للجهات المالكة للبيانات تدريب وحدات “خبراء” محليًا على بياناتهم، ثم دمجها في نموذج عام مشترك (Mixture-of-Experts).
- يمكن تفعيل أو تعطيل هذه البيانات في أي وقت أثناء الاستدلال، مع الحفاظ على حقوق النسب والاستخدام.
- يسمح للمشاركين بإجراء التدريب بشكل غير متزامن وبدون اتصال مباشر بباقي الجهات.
- تم تصميم FlexOlmo بطريقة تتفوق على تقنيات الدمج التقليدية للنماذج، التي تعاني عند التعامل مع بيانات متباينة.
لماذا هذا مهم الآن؟
تشكل البيانات حجر الأساس في تطوير نماذج الذكاء الاصطناعي، لكن معظم المؤسسات غير قادرة على مشاركتها لأسباب تتعلق بالخصوصية، أو الملكية الفكرية، أو الأمن.
FlexOlmo يقدم حلاً عمليًا لـ:
- المؤسسات الصحية: مشاركة بيانات حساسة دون تعريض الخصوصية للخطر.
- القطاع الحكومي: التعاون على تطوير نماذج دون كسر القيود القانونية أو الأمنية.
- الأوساط الأكاديمية والمالية: التدريب الجماعي لنماذج لغوية دون مغادرة البيانات لموقعها.
أبرز الابتكارات التقنية
FlexOlmo يعتمد على هندسة Mixture-of-Experts (MoE)، مع لمسة مبتكرة:
- يتم تدريب كل “خبير” محليًا جنبًا إلى جنب مع نسخة مجمدة من النموذج العام، لضمان التوافق.
- يستخدم النموذج موجهًا ذكيًا (Router) يعتمد على تمثيلات المستندات لتحديد أي “خبير” يُستدعى أثناء الاستخدام.
- يضمن إمكانية الانسحاب في أي وقت، ويمنح كل جهة حرية تطبيق الخصوصية التفاضلية (Differential Privacy) بحسب الحاجة.
هل هناك مخاطر على البيانات؟
تم اختبار النموذج باستخدام هجمات استخراج البيانات، وكانت النتائج مشجعة:
- معدل الاسترجاع للبيانات من وحدة خبير تم تدريبها على بيانات رياضيات صغيرة لمدة 3 تكرارات بلغ فقط 0.7٪.
- في المقابل، نموذج تم الإفراط في تدريبه على نفس البيانات لـ100 تكرار أظهر معدل استرجاع بنسبة 60٪.
نموذج FlexOlmo مقاوم بشكل فعّال لهجمات استرجاع البيانات، مع إمكانية تعزيز الأمان أكثر عبر تقنيات الخصوصية التفاضلية.
الخاتمة:
FlexOlmo يمثل ثورة في تطوير الذكاء الاصطناعي التشاركي، حيث يمكن للمؤسسات أخيرًا أن تساهم في بناء نماذج قوية دون التضحية بخصوصية البيانات أو التحكم بها. إذا كنت تملك بيانات حساسة وتطمح للمشاركة في مستقبل الذكاء المفتوح، فقد يكون FlexOlmo هو البوابة المناسبة لذلك.