دستهبندی دادههای دوردهای با ابرمستطیل موازی محورهای مختصات
الموضوعات :زهرا مصلحی 1 , مازیار پالهنگ 2
1 - دانشجو
2 -
الکلمات المفتاحية: یادگیری ماشین, دستهبندی, درخت تصمیم, هندسه محاسباتی, تفکیکپذیری, مستطیل.,
ملخص المقالة :
یکی از زمینههای فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر میباشد. در یادگیری با ناظر برچسب دادههای آموزشی موجود است. در مسایل دوردهای، هدف محاسبه فرضیهای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا دادههای با دو ردهی مثبت و منفی را از یکدیگر جدا کند. انواع روشهای یادگیری با ناظر پیشنهاد شده است. به عنوان مثال میتوان به درختهای تصمیم، یادگیر SVM و روشهای نزدیکترین همسایه اشاره کرد. در این مقاله بر عملکرد درختهای تصمیم متمرکز میشویم. عملکرد درخت تصمیم مشابه پیدا کردن ابرصفحههای تقسیمکننده در فضای d بعدی است، بطوریکه دادههای موجود را به درستی ردهبندی کند و تا حد ممکن ردهبندی صحیح دادههای آینده را نیز بدست آورد. دیدگاه هندسی عملکرد درخت تصمیم ما را به مفهوم تفکیکپذیری در هندسه محاسباتی نزدیک میکند. از بین کلیه الگوریتمهای تفکیکپذیری موجود، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح میکنیم. این مساله ارتباط نزدیکی با مساله درخت تصمیم در یادگیری ماشین دارد. در ادامه الگوریتم محاسبه مستطیل با حداکثر اختلاف دو رنگ را در یک، دو، سه و d بعد پیاده سازی میکنیم. نتیجه پیادهسازی نشاندهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده C4.5 است.