• فهرست مقالات انتخاب نمونه

      • دسترسی آزاد مقاله

        1 - انتخاب ویژگی و طبقه‌بندی سلول‌های سرطانی بر پایه داده‌های ریزآرایه با استفاده از الگوریتم جستجوی فاخته چندهدفه
        خدیجه کمری فرزان رشیدی عبدالله خلیلی
        داده‌هاي ریزآرایه نقش مؤثری در طبقه‌بندی و تشخیص انواع بافت‌های سرطانی ایفا می‌کنند. با این حال در پژوهش‌های مرتبط با سرطان، تعداد نسبتاً کم نمونه‌ها در مقایسه با تعداد بسیار زیاد ژن‌ها‏، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقه‌بندها، افزایش هزینه‌های محاسباتی و پیچ چکیده کامل
        داده‌هاي ریزآرایه نقش مؤثری در طبقه‌بندی و تشخیص انواع بافت‌های سرطانی ایفا می‌کنند. با این حال در پژوهش‌های مرتبط با سرطان، تعداد نسبتاً کم نمونه‌ها در مقایسه با تعداد بسیار زیاد ژن‌ها‏، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقه‌بندها، افزایش هزینه‌های محاسباتی و پیچیدگی در طبقه‌بندی سلول‌های سرطانی خواهد شد. یک راهکار‏ مناسب جهت افزایش کارایی طبقه‌بندها، حذف ژن‌ها‏ی نامربوط و انتخاب نمونه‌های مناسب برای آموزش طبقه‌بندها است. در این مقاله یک مدل ترکیبی بر پایه الگوریتم بهینه‌سازی جستجوی فاخته چندهدفه و خوشه‌بندی فازی برای طبقه‌بندی داده‌های ریزآرایه پیشنهاد شده است. در اين مطالعه از نسخه دودویی الگوريتم جستجوی فاخته چندهدفه به منظور انتخاب ويژگي‌هاي مرتبط با بیماری و از نسخه پیوسته آن برای انتخاب تعداد نمونه‌های مناسب برای آموزش طبقه‌بندها استفاده شده است. به منظور تسریع در فرایند بهینه‌سازی و جلوگیری از گیرافتادن الگوریتم در بهینه‌های محلی، راهکار‏های ابتکاری جدیدی نیز به الگوریتم اضافه شده‌اند. برای بررسی عملکرد مدل پیشنهادی، شبیه‌سازی‌های متعددی بر روی شش مجموعه داده سرطانی انجام گرفته و نتایج آن با دیگر مقالات مقایسه شده است. نتایج به دست آمده نشان می‌دهند در بسیاری از موارد مدل پیشنهادی قادر است در مقایسه با سایر روش‌ها، با انتخاب مجموعه کوچک‌تری از ژن‌ها‏ی متمایز، منجر به افزایش کارایی طبقه‌بندها شود. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - ترکیب تکنیک‌های انتخاب نمونه و داده‌افزایي برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن
        پرستو محقق سميرا نوفرستی مهری رجائی
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌ب چکیده کامل
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌بندی به‌طور معمول بر روی مجموعه داده‌های متوازن به‌خوبی عمل می‌کنند. با وجود این، یکی از مشکلاتی که الگوریتم‌های طبقه‌بندی با آن مواجه هستند، پیش‌بینی صحیح برچسب نمونه‌های جدید بر اساس یادگیری بر روی مجموعه داده‌های نامتوازن است. در این نوع از مجموعه داده‌ها، توزیع ناهمگونی که داده‌ها در کلاس‌های مختلف دارند باعث نادیده گرفته‌شدن نمونه‌های کلاس با تعداد نمونه کمتر در یادگیری طبقه‌بند می‌شوند؛ در حالی که این کلاس در برخی مسائل پیش‌بینی دارای اهمیت بیشتری است. به‌منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل‌سازی مجموعه داده‌های نامتوازن ارائه می‌شود که با متعادل‌نمودن تعداد نمونه‌های کلاس‌های مختلف در مجموعه داده‌ای نامتوازن، پیش‌بینی صحیح برچسب کلاس نمونه‌های جدید توسط الگوریتم یادگیری ماشین را بهبود می‌بخشد. بر اساس ارزیابی‌های صورت‌گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه‌بندی مجموعه داده‌های نامتوازن به نام‌های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش‌های دیگر دارد. پرونده مقاله