دستهبندی دادههای دو ردهای با ابرمستطیل موازی محورهای مختصات
الموضوعات : جنرال لواءزهرا مصلحی 1 , مازیار پالهنگ 2
1 - دانشجو
2 - -
الکلمات المفتاحية: یادگیری ماشین, دستهبندی, درخت تصمیم, هندسه محاسباتی, تفکیکپذیری, مستطیل,
ملخص المقالة :
یکی از روشهای یادگیری در یادگیری ماشین و شناسایی الگو، یادگیری با ناظر است. در یادگیری با ناظر و در مسایل دو ردهای، برچسب دادههای آموزشی موجود و شامل دو رده مثبت و منفی میباشند. هدف الگوریتم یادگیری با ناظر، محاسبه فرضیهای است که بتواند با کمترین مقدار خطا، دادههای مثبت و منفی را از یکدیگر جدا کند. در این مقاله، از بین کلیه الگوریتمهای یادگیری با ناظر، بر عملکرد درختهای تصمیم متمرکز میشویم. دیدگاه هندسی درخت تصمیم ما را به مفهوم تفکیکپذیری در هندسه محاسباتی نزدیک میکند. از بین کلیه الگوریتمهای تفکیکپذیری موجود و مرتبط با درخت تصمیم، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح میکنیم و الگوریتم را در یک، دو، سه و m بعد پیادهسازی میکنیم که m تعداد ویژگیهای دادهها را نشان میدهد. نتیجه پیادهسازی نشاندهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده C4.5 است.
