5-2-1. کلاسه¬بند درخت تصمیم C4.5

کلاسه­بند C4.5 [22]، نوعی درخت تصمیم بوده که توسط Ross Quinlan در سال 1993 ارائه شده است. این الگوریتم نوع ارتقا یافته الگوریتم قبلی Quinlan یعنی ID3 بوده که برای کلاسه­بندی مفید است. C4.5 با نمونه های آموزشی، یک درخت تصمیم همانند ID3 با استفاده از مفاهیم تئوری اطلاعات[1] [53] می­سازد و از رابطه جداسازیِ[2] بهره­ی اطلاعات نرمال شده[3] استفاده می­کند. این الگوریتم در موارد مختلفی با الگوریتم ID3 متفاوت است؛ این الگوریتم برای ویژگی­های اسمی[4] و پیوسته[5] قابل‌استفاده بوده، همچنین قابلیت مواجهه با مقادیر غایب[6] در ویژگی­ها را دارد. همچنین می­توان این الگوریتم را به دو صورت هرس شده[7] و هرس نشده[8] پیاده­سازی کرد که در روال آزمایش‌ها الگوریتم هرس شده مورد استفاده قرار گرفته­ است.

[1] Information theory

[2] Splitting criterion

[3] Normalized information gain

[4] Nominal attribute

[5] Continuous attribute

[6] Missing value

[7] Pruned

[8] Unpruned

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.