القای دستهبندیکننده ها هنگامی که تعداد دادههای آموزشی به طرز چشمگیری زیاد باشد با مشکل روبهرو خواهد شد. این پدیده باعث به وجود آمدن مرزهای کلاس[1] پیچیده میشود؛ یادگیری دقیق این مرزها، برای دستهبندیکنندههایی که سعی در تولید یک قانون برای توصیف داده دارند، به چالشی عظیم تبدیل می شود. پیچیدگی این وضعیت زمانی به اوج خود می رسد که بردار خصیصه دادهها، دارای ابعاد بالا[2] باشد.
رواج خانواده خاصی از الگوریتمهای یادگیری ماشین، تحت عنوان الگوریتمهای یادگیری جمعی که سعی در مواجهه و برطرف نمودن چالشهای موجود دارند، طی سالهای اخیر بسیار چشمگیر بوده است. این دسته از الگوریتمها، موفقیت خود را مرهون عملکرد محافظهکارانه خود میباشند. در حالی که اکثر الگوریتمهای یادگیری از القای یک دستهبندیکننده برای توصیف داده استفاده میکنند، الگوریتمهای یادگیری جمعی از تعداد زیادی یادگیرهای ضعیف[3]، که قدرت پیش بینی آنها اندکی بهتر از حدس تصادفی[4] است، بهره می برند.
به بیان دیگر، ایده اصلی الگوریتمهای یادگیری جمعی، بهکارگیری چندین یادگیر و ترکیب نتیجه پیشبینی آنها به عنوان یک گروه از دستهبندیکنندهها و بالا بردن دقت کلی[5] یادگیری است. به هر یک از اعضای موجود در این گروه از یادگیرها، یادگیر پایه[6] گفته میشود. در مسائل دستهبندی، الگوریتم یادگیری جمعی به عنوان سیستم دسته بندی چندگانه[7]، ائتلاف دستهبندیکننده ها[8]، کمیتهای از دستهبندیکننده ها[9] و یا ترکیب دستهبندیکننده ها[10] نیز خوانده میشود. پیش بینی هر یک از اعضا ممکن است به صورت یک عدد حقیقی[11]، برچسب کلاس، احتمال پسین[12] و یا هر چیز دیگری باشد. چگونگی ترکیب رأی اعضای الگوریتم، در نتیجه گیری نهایی بسیار مهم است که شامل میانگینگیری، رأی به اکثریت[13] و روشهای احتمالی میشود.
[1] Class boundaries
[2] High dimensional
[3] Weak learners
[4] Random guess
[5] Overall accuracy
[6] Base learner
[7] Multiple classifier system
[8] Classifier fusion
[9] Committee of classifiers
[10] Classifier combination
[11] Real number
[12] Posterior probability
[13] Majority vote
بر روی هر تصویر کلیک کنید تا توضیحات کامل هر قسمت را مشاهده فرمایید