یکی از دیتاست های معروف در پردازش تصویر MNIST می باشد. یکی از مشکلات کاربران عدم توانایی خواندن این دیتاست به صورت تصویر می باشد. چون این دیتاست به صورت های زیر ذخیره شده است :
t10k-images.idx3-ubyte
t10k-labels.idx1-ubyte
train-images.idx3-ubyte
train-labels.idx1-ubyte
تعدادی از تصاویر این پایگاه تصویر را در شکل زیر می توانید ببینید :
ما برای شما یک کد متلب آماده کردیم که تصاویر آموزش و تست را می خواند .
سپس بر روی تمامی تصاویر استخراج ویژگی انجام می دهد.
سپس با داده های آموزش ، یک دسته بندی کننده را آموزش می دهد.
سپس داده های تست را به دسته بندی کننده می دهد.
نتیجه حاصل از ماتریس کانفیوژن confusion matrix در قسمت زیر نمایش داده شده است :
C =
83 0 0 0 0 0 1 0 0 1
0 125 0 0 1 0 0 0 0 0
1 0 101 2 1 0 2 9 0 0
1 0 3 96 0 3 0 0 3 1
1 0 0 0 102 0 1 0 0 6
0 0 0 2 0 82 0 1 2 0
1 0 0 0 0 0 85 0 1 0
0 1 2 4 0 1 0 88 0 2
0 0 1 0 0 0 3 0 77 8
0 0 0 0 1 0 0 2 2 9
درصد شناسایی برای داده های تست برابر 92.90درصد می باشد.
شما می توانید هر دسته بندی کننده دیگری را در این کد استفاده کنید ما به عنوان مثال از یک دسته بندی کننده استفاده کردیم.
در کنار این برنامه یک فایل word هم قرار دارد که خط به خط کد متلب را توضیح می دهد.