دادههاي ریزآرایه نقش مؤثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچ چکیده کامل
دادههاي ریزآرایه نقش مؤثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچیدگی در طبقهبندی سلولهای سرطانی خواهد شد. یک راهکار مناسب جهت افزایش کارایی طبقهبندها، حذف ژنهای نامربوط و انتخاب نمونههای مناسب برای آموزش طبقهبندها است. در این مقاله یک مدل ترکیبی بر پایه الگوریتم بهینهسازی جستجوی فاخته چندهدفه و خوشهبندی فازی برای طبقهبندی دادههای ریزآرایه پیشنهاد شده است. در اين مطالعه از نسخه دودویی الگوريتم جستجوی فاخته چندهدفه به منظور انتخاب ويژگيهاي مرتبط با بیماری و از نسخه پیوسته آن برای انتخاب تعداد نمونههای مناسب برای آموزش طبقهبندها استفاده شده است. به منظور تسریع در فرایند بهینهسازی و جلوگیری از گیرافتادن الگوریتم در بهینههای محلی، راهکارهای ابتکاری جدیدی نیز به الگوریتم اضافه شدهاند. برای بررسی عملکرد مدل پیشنهادی، شبیهسازیهای متعددی بر روی شش مجموعه داده سرطانی انجام گرفته و نتایج آن با دیگر مقالات مقایسه شده است. نتایج به دست آمده نشان میدهند در بسیاری از موارد مدل پیشنهادی قادر است در مقایسه با سایر روشها، با انتخاب مجموعه کوچکتری از ژنهای متمایز، منجر به افزایش کارایی طبقهبندها شود.
پرونده مقاله
در عصر کلاندادهها، تکنیکهای تجزیه و تحلیل خودکار مانند دادهکاوی بهطور گستردهای برای تصمیمگیری بهکار گرفته شده و بسیار مؤثر واقع شدهاند. از جمله تکنیکهای دادهکاوی میتوان به طبقهبندی اشاره کرد که یک روش رایج برای تصمیمگیری و پیشبینی است. الگوریتمهای طبقهب چکیده کامل
در عصر کلاندادهها، تکنیکهای تجزیه و تحلیل خودکار مانند دادهکاوی بهطور گستردهای برای تصمیمگیری بهکار گرفته شده و بسیار مؤثر واقع شدهاند. از جمله تکنیکهای دادهکاوی میتوان به طبقهبندی اشاره کرد که یک روش رایج برای تصمیمگیری و پیشبینی است. الگوریتمهای طبقهبندی بهطور معمول بر روی مجموعه دادههای متوازن بهخوبی عمل میکنند. با وجود این، یکی از مشکلاتی که الگوریتمهای طبقهبندی با آن مواجه هستند، پیشبینی صحیح برچسب نمونههای جدید بر اساس یادگیری بر روی مجموعه دادههای نامتوازن است. در این نوع از مجموعه دادهها، توزیع ناهمگونی که دادهها در کلاسهای مختلف دارند باعث نادیده گرفتهشدن نمونههای کلاس با تعداد نمونه کمتر در یادگیری طبقهبند میشوند؛ در حالی که این کلاس در برخی مسائل پیشبینی دارای اهمیت بیشتری است. بهمنظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادلسازی مجموعه دادههای نامتوازن ارائه میشود که با متعادلنمودن تعداد نمونههای کلاسهای مختلف در مجموعه دادهای نامتوازن، پیشبینی صحیح برچسب کلاس نمونههای جدید توسط الگوریتم یادگیری ماشین را بهبود میبخشد. بر اساس ارزیابیهای صورتگرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقهبندی مجموعه دادههای نامتوازن به نامهای «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روشهای دیگر دارد.
پرونده مقاله
رایمگ
سامانه رایمگ تمامی فرآیندهای دریافت، ارزیابی و داوری، ویراستاری، صفحهآرایی و انتشار الکترونیکی نشریات علمی را به انجام میرساند