دسته بندی متدهای فیلترینگ اشتراکی

متدهای فیلترینگ اشتراکی به دو گروه کلی فیلترینگ اشتراکی مبتنی بر همسایگی[1] یا مبتنی بر حافظه[2] و فیلترینگ اشتراکی مبتنی بر مدل[3]  تقسیم می­شوند.[12]

الگوریتم­های موجود در گروه فیلترینگ اشتراکی مبتنی بر همسایگی یا مبتنی بر حافظه نسبت به الگوریتم­های موجود در فیلترینگ اشتراکی مبتنی بر مدل رایج­تر می­باشند اما قابل ذکر است که این الگوریتم­ها نیازمند حافظه­ بیشتری هستند. از نظر کارایی الگوریتم­های موجود در گروه مدل محور نتایج قابل توجهی را ارائه می­دهند. اما از نظر دقت به جز تحقیقات اخیر[21] نتایج خوبی به دست نیاورده­اند. الگوریتم­های حافظه محور به طور عمده بر الگوریتم KNN استوار می­باشند.

از تلفیق دو دسته مدل محور و حافظه محور مدل تلفیقی به وجود می­آید که هدف آن تلفیق مزیت هر دو دسته است . [22]هم اکنون تحقیقات در راه پیشروی  به سمت مدل تلفیقی می­باشد .[23]

در راهکار مبتنی بر حافظه پیش­بینی به دو صورت براساس کاربران و براساس اقلام انجام می­پذیرد  .[24]اختلاف­ نظر­هایی در مورد اینکه پیش­بینی بر اساس اقلام مبتنی بر حافظه و یا مبتنی بر مدل است وجود دارد ؛ در [25] اعلام شده است که الگوریتم­های بر اساس اقلام همیشه مبتنی بر حافظه هستند و در [26] این الگوریتم­ها بر اساس مدل کلاس بندی شده­اند.

2-5-1- فیلترینگ اشتراکی مبتنی بر حافظه

در فیلترینگ اشتراکی مبتنی بر همسایگی یا مبتنی بر حافظه سرتاسر ماتریس کاربران – اقلام بررسی می­شود (شکل شماره­ 6). در این ماتریس که در حافظه ذخیره شده است امتیازهایی که کاربران به اقلام مختلف داده­اند وجود دارد. این ماتریس به صورت مستقیم برای پیش­بینی نمره اقلامی که تا کنون هیچ امتیازی دریافت نکرده­اند به کار می­رود [19]. یعنی این محاسبات به صورت برون خط[4] انجام نمی­پذیرد و همه چیز به صورت بر خط انجام می­شود و همواره کل داده­ها مورد نیاز می­باشد. مزیت این روش این است که در هر زمان کل اطلاعات در دسترس می­باشد اما با بزرگ شدن ماتریس یعنی تعداد کاربران و اقلام، فضای جستجو، حافظه­ مورد نیاز و زمان محاسبه افزایش می­یابد.

همانطور که گفته شد در راهکار مبتنی بر حافظه پیش­بینی به دو صورت پیش­بینی بر اساس کاربران[5] و پیش­بینی براساس اقلام[6] انجام می­شود.

2-5-1-1- فیلترینگ اشتراکی مبتنی بر حافظه  با پیش بینی براساس کاربران

در سیستم­های مبتنی برکاربر پیش­بینی بر اساس ارزیابی امتیازهایی که توسط کاربران مشابه با کاربر فعال به اقلام مورد نظر تخصیص یافته انجام می­پذیرد [27]. کاربران شبیه آنهایی هستند که الگوی امتیازدهی­شان شبیه به کاربر فعال با­­شد (شکل شماره­ 6(.

یکی از چالش­های اصلی در این مدل نحوه­ پیدا کردن میزان شباهت بین کاربران می­باشد. زیرا با استفاده از معیار شباهت شبیه­ترین همسایگان به کاربر فعال انتخاب و در پیش­بینی استفاده می­شوند.

2-5-1-2- فیلترینگ اشتراکی مبتنی بر حافظه با پیش بینی براساس اقلام

سیستم­های مبتنی بر اقلام امتیاز یک قلم خاص را بر اساس امتیازهایی که کاربر به اقلام مشابه داده است پیش­بینی می­کنند [28] . دو قلم در صورتی به هم شبیه هستند که چند کاربر به طور مشابه به آنها رای داده باشند (شکل شماره­ 7).

 

شکل شماره­ 6:  فیلترینگ اشتراکی مبتنی بر قلم       شکل شماره­ 7 : فیلترینگ اشتراکی مبتنی بر کاربر

2-5-1- 3- تفاوت فیلترینگ اشتراکی بر اساس کاربران و بر اساس اقلام   

فیلترینگ اشتراکی بر اساس اقلام زمانی به کار می­رود که روند افزایش اقلام کندتر از روند افزایش کاربران باشد [28]. ولی در زمانی که روند افزایش اقلام سریع­تر از روند افزایش کاربران باشد فیلترینگ اشتراکی بر اساس کاربران به کار می رود .[29] به عنوان مثال اگر اقلامی مانند اخبار، مورد پژوهش باشد استفاده از روش قلم مبنا نامناسب خواهد بود و در صورتی که از این روش به عنوان مدل محور  استفاده گردد به علت افزایش  بسیار سریع اقلام مشکل سربار زیاد محاسباتی برای به روز رسانی مدل به وجود خواهد آمد. بر عکس اگر اقلامی مانند فیلم یا کتاب مورد پژوهش باشد استفاده از این روش مناسب خواهد بود.

2-5-2- فیلترینگ اشتراکی مبتنی بر مدل

برخلاف سیستم­های مبتنی بر حافظه که امتیازهای ذخیره شده را به طور مستقیم درپیش­بینی به کار می­برند، سیستم­های مبتنی بر مدل از این امتیازها برای یادگیری یک مدل پیش­بینی استفاده می­کنند. یعنی پارامترهای مدل به صورت برون خطی یاد گرفته می­شوند و دیگر نیازی نیست که هر بار ماتریس امتیازدهی کاربران- اقلام بررسی شود. این مدل بر اساس داده­های موجود آموزش[7] داده می­شود و در آینده برای پیش­بینی امتیازهایی که کاربران به اقلام جدید خواهند داد به صورت روی خط به کار می­رود [4]. به همین دلیل نسبت به فیلترینگ اشتراکی مبتنی بر حافظه از سرعت بیشتری برخوردار است. این مدل می­تواند یک الگوریتم یادگیری ماشین[8] یا داده کاوی[9] باشد [30]. در گذشته الگوریتم­های موجود در حوزه­ یادگیری ماشین مانند شبکه­های بیز[10] [8] و خوشه بندی[11] [31,32] بسیار مورد توجه بوده­ اند .[28] اگر چه امروزه الگوریتم­های فاکتورسازی ماتریس بسیار مورد توجه واقع شده­اند اما همچنان الگوریتم­های خوشه بندی جایگاه خود را حفظ کرده­اند.

[1] Neighborhood-Based

[2] Memory-Based

[3] Model-Based

[4] Off Line

[5]User-Based

[6] Item-Based

[7] Train

[8] Machine Learning

[9] Data Mining

[10] Bayesian Networks

[11] Clustering

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *