این معیارهای شباهت تنها از اطلاعات هر میزبان استفاده می کند و نیازی به اطلاعات مرتبط یا همسایگی گره ندارد. این معیارها به سادگی از گراف دوسویه شبکه استخراج می شوند. به گراف یک سویه به دست آمده از گراف دوسویه نیازی ندارد. در نتیجه استخراج آن به سادگی و با سرعت بیشتر صورت می گیرد.
- میانگین شباهت محلی[1]
همان طور که گفته شد، در تبدیل گراف دو سویه به یک سویه یال میان دو گره بر اساس تعداد مقصدهای مشترک میان دو گره وزن دهی می شود. این وزن نمایانگر شباهت میان دو گره در نحوه برقرار کردن ارتباط می باشد. با استفاده از معیار میانگین شباهت محلی می توان تعیین کرد که یک گره تا چه میزان شبیه به سایر گره ها در همسایگی خود می باشد. هر چه این میزان این شباهت کمتر باشد، گره غیر قابل اطمینان تر است.در فرمول زیر می توانید نحوه محاسبه این معیار را مشاهده کنید.
در فرمول فوق نمایانگر مجموع وزن لبه های مرتبط با گره مورد نظر می باشد. و متغییر نمایانگر درجه گره می باشد.
- نسبت درجه گره[2]
گره های مربوط به افراد نفوذگر معمولا دارای ترافیک شبکه غیر نرمال نسبت به مابقی گره های شبکه می باشند. به عنوان مثال گره هایی که مشغول پویش شبکه هستند، دارای درجه خروجی بسیار بالا هستند. در برخی موارد نفوذگران با نگه داشتن ترافیک مرتبط با گره خود در حد نرمال در تلاشند تا فعالیت های نفوذی خود را مخفی نگه دارند[39]. ما با ارائه معیار ارزیابی نسبت درجه گره، در پی شناسایی نفوذگرانی هستیم که ترافیک گره خود را در حد نرمال نگه می دارند.
در فرمول فوق نمایانگر درجه خروجی گره، متغییر نمایانگر درجه ورودی گره و نیز متغییر نمایانگر درجه کلی گره می باشد. این فرمول به خوبی قادر است رفتار نفوذگر را بدون در نظر گرفتن حجم فعالیت هایش بازنمایی کند. رفتار نفوذگر در شبکه به گونه ای است که حجم بسته های خروجی او بیش از حجم بسته های ورودی او می باشد. نسبت درجه گره از گراف دوسویه به دست آمده و محاسبه آن با توجه به این که تنها با اطلاعات گره در ارتباط است، بسیار سریع می باشد.
معیار Z-Score یک مفهوم آماری است که ارتباط یک متغییر تصادفی در یک جامعه آماری را نسبت به میانگین جامعه بازنمایی می کند. این معیار نشان می دهد که مقدار یک متغییر تصادفی در یک جامعه آماری نرمال یا غیرنرمال می باشد. با این معیار می توان جامعه های آماری مختلف را به صورت بازه ای قابل مقایسه با یکدیگر تبدیل کرد. یکی از کاربردهای این امتیاز در زندگی واقعی امتحان قابلیت استفاده[3] می باشد. این معیار نشان می دهد که یک متغییر تصادفی به اندازه چند واحد انحراف معیار از میانگین فاصله دارد. برای محاسبه این معیار از فرمول زیر استفاده می شود.
در شکل زیر می توانید رفتار یک جامعه آماری را در قبال معیار z-score مشاهده کنید.
با استفاده از این معیار در این پژوهش، معیاری ارائه داده ایم تا به شناسایی نفوذگران در شبکه بپردازیم. چرا که این معیار قادر به بازنمایی افرادی است که در جامعه رفتار متفاوتی از خود نشان می دهند. فرمول ارائه شده در زیر بر همین مبنا ارائه شده است.
در فرمول فوق میانگین و انحراف معیار درجه ارتباطی گره های شبکه می باشد. متغییر تصادفی یا همان درجه کلی گره است. همچنین درجه خروجی گره و درجه ورودی گره می باشد. در این معیار دو پارامتر میانگین و انحراف معیار در شبکه می بایست یاد گرفته شوند. در نتیجه این معیار نیاز به مدت زمانی جهت مشاهده و تخمین میانگین و انحراف معیار شبکه دارد. مزیت استفاده از این معیار این است که می توان رفتار یک فرد را در شبکه های متفاوت بررسی و رهگیری کرد.
[1] Avg. Sim.
[2]Deg. Ratio
[3] Usability testing