دراسة: الذكاء الاصطناعي يكشف الهوية خلف الأسماء المستعارة

كشفت دراسة حديثة أن النماذج اللغوية الكبيرة باتت قادرة على إعادة تحديد هوية مستخدمين ينشرون الأسماء المستعارة عبر الإنترنت خلال دقائق وبتكلفة منخفضة، ما يثير تساؤلات جدية حول مستقبل الخصوصية الرقمية.

تفاصيل الخبر

أجرى باحثون من المعهد الفدرالي السويسري للتكنولوجيا في زيورخ بالتعاون مع شركة Anthropic دراسة بعنوان “Large-scale online deanonymization with LLMs”، أظهرت أن النماذج اللغوية الكبيرة يمكنها تنفيذ عمليات كشف هوية على نطاق واسع بكفاءة عالية لكشف الأسماء المستعارة.

تكلفة كشف الهوية تراوحت بين دولار و4 دولارات لكل ملف.
زمن التنفيذ لا يتجاوز دقائق مقارنة بساعات لمحقق بشري.
الاعتماد على تحليل مؤشرات تقليدية مثل المهنة، الاهتمامات، نمط الحياة، وإشارات الموقع الجغرافي.
في تجربة على منصة Hacker News، نجح النظام في مطابقة نحو ثلثي 338 ملفاً.
معدل النتائج الإيجابية الخاطئة بلغ قرابة 10%.

الدراسة أوضحت أن النموذج لا يستخدم وسائل “خارقة”، بل يستفيد من قدرته على جمع الإشارات المتناثرة عبر الإنترنت وتحليلها بسرعة هائلة. ففي إحدى التجارب، تم تزويد وكيل ذكاء اصطناعي بملخصات منشورات مجهولة بعد إزالة الأسماء والروابط، ثم أُتيح له البحث المستقل عبر الإنترنت لتحديد الهوية الحقيقية.

كما اختبر الباحثون سيناريو “العالم المغلق”، حيث تتم مطابقة هويات بين قاعدتي بيانات المستخدمين بالأسماء المستعارة اعتماداً على نصوص غير منظمة. وشملت التجارب الربط بين حسابات على Hacker News وLinkedIn، ومطابقة مستخدمين عبر مجتمعات Reddit، وحتى تقسيم سجل مستخدم واحد زمنياً لإنشاء ملفين مستعارين ومحاولة ربطهما.

النتائج أظهرت أن الأساليب المعتمدة على النماذج اللغوية تفوقت بشكل كبير على الطرق التقليدية، محققة معدل استرجاع وصل إلى 68% عند دقة 90%، مقارنة بنتائج شبه معدومة للطرق غير المعتمدة على الذكاء الاصطناعي.

الأهداف المستقبلية

تشير هذه النتائج حول الأسماء المستعارة إلى ضرورة إعادة تقييم نماذج التهديد المتعلقة بالخصوصية الرقمية في عصر الذكاء الاصطناعي.

تطوير سياسات أقوى لحماية الهوية الرقمية.
تقليل البيانات التعريفية القابلة للاستنتاج من المحتوى العام.
تحديث أطر الامتثال والحوكمة للمنصات الرقمية.
توعية المستخدمين بمخاطر الإفراط في مشاركة التفاصيل الشخصية.
تعزيز الأبحاث حول تقنيات إخفاء الهوية المقاومة لتحليل الذكاء الاصطناعي.

تؤكد الدراسة أن ما كان يُعرف بـ“الغموض العملي” الذي كان يحمي المستخدمين بالأسماء المستعارة لم يعد فعالاً في ظل تطور النماذج اللغوية الكبيرة.

ختاماً، يعكس هذا البحث تحولاً عميقاً في معادلة الخصوصية على الإنترنت، حيث أصبحت القدرة على الربط بين الهويات الرقمية أسرع وأرخص من أي وقت مضى، ما يستدعي مراجعة شاملة لاستراتيجيات حماية البيانات في المستقبل.