التعلم بدون إشراف: استخراج المعرفة من البيانات
هل سمعت عن آلات تتعلم وحدها بدون مساعدة البشر؟ يتكرر مصطلح التعلم بدون إشراف في عالم الذكاء الاصطناعي بكثرة، كما يحمل ألقاباً أخرى وأهمها التعلم غير الموجه والتعلم غير المراقب. وعلى الرغم من الانتشار الضخم، ما يزال المفهوم غير واضح بالنسبة إلى الأشخاص المبتدئين وخاصة أن التعقيد يسيطر عليه ويتداخل مع أشكال أخرى من التعلم الآلي Machine Learning. بناء على ذلك، نتعرف في هذه المقالة على ما هو التعلم غير الخاضع للإشراف، وأهميته، وأنواعه، والاختلافات بينه وبين التعلم الخاضع للإشراف، ونستعرض أخيراً تطبيقات واقعية لاستخدامه.
جدول المحتويات
ما هو التعلم بدون إشراف وأهميته
التعلم غير الخاضع للإشراف (التعلم غير الموجه) Unsupervised Learning هو أحد أنواع التعلم الآلي الذي يتعلم من البيانات غير المصنفة بدون تلقي تعليمات بشرية، وإنما يستخدم بدلاً من ذلك الخوارزميات لتقييم البيانات ثم العثور على العلاقات سواء كانت تشابه أو اختلاف. هذا يعني أنه يتخذ طريقة استكشافية تستخلص النتائج من البيانات بدون مساعدة أحد، على سبيل المثال يستطيع فرز مجموعة صور حسب خصائصها المشتركة [1] [2].
من ناحية أخرى ترجع أهمية التعلم غير الموجه إلى تأثيره الكبير على تفاصيل حياتنا اليومية، هذا فضلاً عن دوره الواضح في تطوير عملية تعلم الآلة وجعلها أكثر سهولة ويسراً من السابق، حيث يستخدم في بناء أنظمة التوصية وإنشاء المحتوى المكتوب والمرئي والترجمة من لغة إلى أخرى وغيرها الكثير [1] [2].
ما هو الفرق الرئيسي بين التعلم الخاضع للإشراف وغير الخاضع للإشراف؟
يعتبر الاختلاف الأساسي بين النوعين الرئيسين من تعلم الآلة هو نوع بيانات الإدخال التي يتم استعمالها، إذ يستخدم التعلم الخاضع للإشراف بيانات مصنفة (مسماة) Labeled Data، في حين أن التعلم بدون إشراف يلجأ إلى البيانات غير المصنفة Unlabeled Data، وهكذا يكون الأخير مسؤولاً عن تحديد أنماط البيانات غير المسماة فقط. ومن هنا، يحمل التعلم الخاضع للإشراف (المراقب) أهدافاً واضحة من البداية، أي محددة مسبقاً قبل تطبيق الخوارزمية، حيث يكون نوع الناتج الذي يصدره النموذج معروفاً بناء على بيانات التدريب [3].
تطبيقات وأمثلة على التعلم بدون إشراف
يتعامل التعلم غير الخاضع للإشراف Unsupervised Learning مع البيانات الضخمة بطرق متنوعة، نتيجة لذلك يصنف إلى أنواع عديدة بعضها شائع الاستخدام، وهي: [4]
- التجميع Clustering: هي خوارزميات تقوم بتجميع البيانات المتشابهة في مجموعات بناءً على معايير ثابتة، ومن أبرز أنواعه التجميع الهرمي.
- الارتباط Association: هي تقنيات متخصصة في اكتشاف العلاقات أياً كان نوعها داخل مجموعات البيانات الضخمة.
- تقليل الأبعاد Dimensionality Reduction: هي تقنيات تعمل على تقليل المزايا الموجودة في البيانات دون التخلي عن معلوماتها الأساسية، ومن أنواعها تحليل المكونات الأساسية (PCA).
والأهم من المفاهيم النظرية المذكورة سابقاً هو اكتشاف مثال على التعلم غير الخاضع للإشراف من واقع الحياة اليومية، لذلك فيما يلي 5 تطبيقات شائعة الاستخدام: [1]
- محركات التوصية: تستخدم جميع أنواع التعلم بدون إشراف (التجميع، الارتباط، تقليل الأبعاد) لتقديم اقتراحات حول ما يستمتع العميل بشرائه أو مشاهدته بعد ذلك.
- تحليل سلة التسوق: ينتشر استخدام تحليل سلة التسوق في عالم التجارة الإلكترونية، ويُقصد به استعمال قواعد الارتباط لمعرفة أسماء المنتجات التي يختارها المتسوق في نفس عملية الشراء مثل النقانق والكاتشب.
- تقسيم العملاء: يحلل التعلم غير المراقب سلوك العملاء لكي يختار مجموعات محددة، هذا ما يساعد على حملات إعلان وتسويق أكثر نجاحاً من الطرق التقليدية.
- اكتشاف الاحتيال: يمتلك قدرة هائلة على فهم الأنماط وهذا ما يمكّنه من اكتشاف عمليات الاحتيال بسرعة عالية، ومن أشهرها عمليات الشراء الاحتيالية عبر بطاقات الائتمان.
- التعرف على الكلام: يساعد أجهزة الحاسب على تحليل الكلام من خلال معرفة الأصوات التي ترتبط بأي فونيمات (وحدات الكلام) وتصفية الضوضاء الخلفية في المقاطع الصوتية.
في الختام، يراهن علماء الذكاء الاصطناعي على إمكانيات التعلم بدون إشراف في الحاضر والمستقبل، ولاسيما أن استخداماته تتزايد في قطاعات الحياة المختلفة من الصناعة والتسويق والتجارة وغيرها، هذا فضلاً عن التماهي مع التعلم الخاضع للإشراف في بعض التطبيقات لتحقيق مستقبل أفضل.