زبان برنامه نویسی پایتون یکی از زبان های برنامه نویسی است که به سرعت در حال افزایش محبوبیت و کاربرد در بین برنامه نویسان می باشد.
نزديكترين همسايه (KNN) يك الگوريتم يادگيري ميباشد كه در روش بازشناسي الگو طي چندين دهه مطالعه شده است.KNN به عنوان يكي از كاراترين روش ها شناخته شده است، و مطالعات زيادي KNN را روي اسناد آزمايشي Reuters بكاربرده اند، كه اين مطالعات پيشنهاد مي كنند كه KNN با SVM، از روشهايي مانند تقريب خطي كوچكترين مربعات ، Naïve Bayes و شبكه هاي عصبي بهتر عمل مي نمايد.
KNN هنوز يك روش كارآ و ساده براي دسته بندي متن مي باشد. ايده KNN طبق زير است: يك سند آموزشي براي دسته بندي وجود دارد، الگوريتم K همسايه نزديك در ميان سندهاي آموزشي پيش دسته بندي شده، بر اساس يك معيار شباهت پيدا كرده و دسته هاي اين K همسايه نزديك براي پيش بيني دسته سند آزمايشي بوسيله امتياز دهي سندهاي هر دسته منتخب، استفاده مي شود. اگر بيشتر از يك همسايه به دسته هاي مشابه تعلق داشته باشد، مجموع امتياز آنها به عنوان وزن آن دسته استفاده مي شود و دسته با بالاترين امتياز به سند مورد آزمايش انتساب مي يابد، كه اگر از يك مقدار آستانه تجاوز كند، بيشتر از يك دسته ميتواند به سند آزمايشي انتساب يابد.
سرفصل مطالب :
معرفی نزدیکترین همسایه KNN
نرمالیزه کردن داده ها
برنامه نویسی پایتون نزدیکترین همسایه KNN
دو مثال از برنامه نویسی پایتون نزدیکترین همسایه KNN