نحوه تشخیص علائق کاربران

تشخیص میزان علائق کاربران نسبت به اقلام متفاوت یکی از مهم­ترین وظایف فیلترینگ اشتراکی می­باشد. هر بار که کاربری در مورد قلمی‌خاص ابراز علاقه می­کند مقدار جدیدی در نمایه­ او اضافه می­شود. به دو صورت صریح و ضمنی می­توان علائق کاربر را استخراج نمود.

2-6-1- تشخیص علائق به صورت صریح

برای این منظور سیستم­های پیشنهادگر تمایلی که کاربر به صورت واضح و آشکار نسبت به محصولات نشان می­دهد مثل نمره­هایی که به اقلام نسبت داده است را در یک پایگاه داده جمع آوری می­کند. کاربر می­تواند علائق خود را به طور صریح در غالب تک بیتی باینری یک و صفر به معنای خوب و بد و یا به صورت بازه­ای از اعداد که نشان دهنده­ میزان تمایل کاربر به قلم است  نشان دهد. .به عنوان مثال اگر بازه­ امتیازدهی، اعداد 1 تا 5 باشد نسبت دادن امتیاز 1 از سوی کاربر به معنای عدم علاقه و اختصاص دادن امتیاز­ 5 به معنای علاقه کاربر به قلمی‌خاص می­باشد [7,9].

2-6-2- تشخیص علائق به صورت ضمنی

برای این منظور سیستم به  صورت ضمنی بعضی رویدادها مثل حرکت اشاره­گر به سمت محصولی خاص را در نظر می­گیرد [24]. در این روش کاربر تمایلاتش را به طور صریح  و در قالب امتیاز نشان نمی­دهد بلکه از رفتارش علائق­او محاسبه می­شود .[33,34,35,36]

این پایان­ نامه فقط بر استنباط علائق به طور صریح متمرکز شده است. یعنی تمایلات کاربران باید به صورت نسبت دادن امتیاز به اقلام مشخص شده باشد.

2-7- محاسبه شباهت

برای پیش­بینی یا ارائه­ پیشنهاد توسط فیلترینگ اشتراکی می­بایست شبیه­ترین کاربران به کاربر فعال را پیدا کرد و به عنوان مجموعه­ همسایگی کاربر فعال در نظر گرفت. برای اندازه­گیری میزان شباهت بین دو کاربر راهکارهای متفاوتی ارائه شده است که در اینجا دو مورد از معیارهای شباهت رایج که در فیلترینگ اشتراکی استغاده می­شوند را معرفی می­کنیم.

2-7-1- معیار همبستگی پیرسون

این معیار میزان وابستگی بین الگوهای امتیازدهی دو کاربر (دو قلم) را می­سنجد (فرمول شماره 4). نتیجه­ حاصل از این فرمول عددی بین 1 و 1- می­باشد. عدد 1 نشان­ دهنده­ بیشترین شباهت، 1- نمایانگر کمترین شباهت می­باشد و اگر نتیجه عدد 0 باشد یعنی دو موجودیت مورد مقایسه با هم هیچ ارتباطی ندارند.

                                (4)                                                                              

از فرمول فوق برای اندازه­گیری میزان شباهت دو کاربر u و v استفاده می­شود.  نشان دهنده­ امتیازی که کاربر u به قلم j ام اختصاص داده می­باشد.  میانگین کل امتیازهایی که کاربر u به اقلام نسبت داده است می­باشد.

فرمول زیر با کمی‌تغییر شباهت بین دو قلم i و j  را اندازه­گیری می­کند.

                                          (5)                                               

2-7-2- معیار اندازه ­گیری کسینوس

معیار شباهت کسینوسی در حوزه­ بازیابی اطلاعات بسیار رایج است و برای اندازه­ گیری شباهت بین دو سند به کار می­رود [37]. این معیار میزان شباهت دو کاربر (دو قلم) را با استفاده از کسینوس زاویه­ بین بردارهای امتیازدهی آنها مشخص می­کند (فرمول شماره 6). نتیجه­ حاصل عددی بین 1- و 1 می­باشد. هر چه عدد حاصل شده بزرگ­تر باشد یعنی دو موجودیت مورد مقایسه بیشتر به هم شبیه هستند و هر چه این عدد کوچک­تر باشد یعنی دو موجودیت کمتر به هم شبیه هستند.

 (6)                                                                                                                                                                                   

اگرچه این معیار در حوزه بازیابی اطلاعات به خوبی کار می­کند  [37,38]اما برای محاسبه­ شباهت در فیلترینگ اشتراکی کاربر مبنا به خوبی معیار همبستگی پیرسون عمل نمی­کند [12].

پیام بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

three + seven =