اصلیترین زمینه تحقیقاتی در حوزه یادگیری ماشین، شناسایی الگو[1] است؛ یعنی استخراج اطلاعات و الگوهای تکرار شونده از داده ورودی[2]، که این اطلاعات برای انجام تصمیمگیری در مورد دادههای نادیده[3] کاربرد دارد.
بر اساس نوع پیش بینی دادههای نادیده، انواع روشهای شناسایی الگو را می توان به دو گروه کلی روشهای مبتنی بر دستهبندی[4] و روشهای مبتنی بر رگرسیون[5] تقسیمبندی کرد. سیستمهای مبتنی بر دستهبندی، سعی در ساختن مدلی دارند که خروجی آن گسسته[6] میباشد و این خروجی در واقع برچسب کلاسی[7] است که سیستم برای یک نمونه خاص پیشنهاد میدهد؛ در مقابل، سیستمهای مبتنی بر رگرسیون، تابعی پیوسته[8] را مدل میکنند و خروجی آنها به صورت عددی[9] میباشد.
یادگیری ماشین را میتوان به چهار دسته کلی یادگیری با نظارت[10] و یادگیری بدون نظارت[11]، یادگیری نیمه نظارتی[12] و یادگیری فعال[13] تقسیمبندی کرد. در یادگیری با نظارت، سیستم با دادههای آموزشی که دارای برچسبهای کلاس معین هستند آموزش داده میشود. این گروه از الگوریتمها که بسیار رایج نیز میباشند، سعی در ساخت مدلی دارند که به بهترین نحو دادههای آموزشی را به برچسب کلاس داده شدهی آنها مرتبط سازند. مدل ساخته شده بر این اساس، در مرحله آزمایش[14] سعی در پیش بینی برچسب کلاس دادههای آزمایشی خواهد کرد. در مقابل این گروه از الگوریتم ها، الگوریتم های مبتنی بر یادگیری بدون نظارت، بدون دریافت برچسب کلاس دادههای آموزشی، سعی در دستهبندی دادههای آموزشی میکنند؛ به این نوع از یادگیری، خوشهبندی[15] نیز گفته میشود. گاهی تنها بخشی از برچسب کلاس دادههای آموزشی در دسترس است بنابر این دسته سوم از الگوریتمها، یعنی الگوریتمهای نیمهنظارتی، عملکردی مابین الگوریتمهای نظارتی و الگوریتمهای بدون نظارت دارند. در یادگیری فعال، سیستم در مرحله آموزش، با انسان تعامل دارد؛ به این صورت که انسان برچسبهای مناسب را به دادههای ورودی نسبت میدهد و سیستم با توجه به برچسبهای اختصاص داده شده، به پایش اطلاعات خود و مدل آموزشی میپردازد.
[2] Input data
[3] Unseen data
[4] Classification
[5] Regression
[6] Discrete
[7] Class label
[8] Continues-valued function
[9] Numerical
[11] Unsupervised learning
[12] Semi-supervised
[13] Active learning
[14] Testing phase
[15] Clustering
بر روی هر تصویر کلیک کنید تا توضیحات کامل هر قسمت را مشاهده فرمایید