MP00 – تشخیص کلمه دستنویس و تایپی با بردار ویژگی و دسته بندی درخت تصمیم گیری

fig1

  Handwritten and Printed Word Identification Using Gray-Scale Feature Vector and Decision Tree Classifier

Abstract Document image analysis is one of the important steps towards a paper free world. An effective Optical  Character Recognition (OCR) system would be helpful for achieving this fit. But the next question may arise that whether a single OCR system will be sufficient for encoding both handwritten and printed text or not. So to come out of this dilemma, the work as reported here determines the category of a word from the document images containing words both in handwritten and printed forms. A 6-elements feature set is estimated from each gray level image and then these features are ranked based on discriminatory capabilities. Finally, a decision tree classifier has been designed and 1500 words images of handwritten and printed forms (equal in number) are fed to the classifier to evaluate the performance of the present technique. An overall success rate of 96.80% is achieved.

خروجی برنامه :

out1

خلاصه (ترجمه ماشین) :

تجزیه و تحلیل تصویر سند یکی از مراحل مهم در جهت یک جهان آزاد مقاله است. شخصیت نوری تشخیص (OCR) سیستم موثر خواهد بود برای دستیابی به این جا مفید باشد. اما سوال بعدی ممکن است بوجود می آیند که آیا یک سیستم واحد OCR برای رمزگذاری هر دو متن دست نوشته و چاپ شده یا نه کافی خواهد بود. بنابراین از این معضل آمده، کار به عنوان گزارش تعیین رده از یک کلمه از تصاویر سند حاوی کلمات هر دو در شکل دست نوشته و چاپ شده است.6-عناصر مجموعه ویژگی از هر تصویر سطح خاکستری برآورد و سپس این ویژگی ها بر اساس قابلیت های تبعیض آمیز قرار گرفت. در نهایت، یک طبقه بندی درخت تصمیم گیری طراحی شده است و 1500 واژه تصاویر از اشکال دست نوشته و چاپ شده (در تعداد مساوی) به طبقه بندی تغذیه برای ارزیابی عملکرد از روش حاضر.میزان موفقیت کلی 96.80٪ به دست میآید.

دانلود اصل مقاله

دریافت کدها و فایل توضیحی خط به خط کد مقاله

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *