الگوریتم نیمه نظارتی جمعی با استفاده از معیار انتخاب مبتنی بر آستانه امتیاز اطمینان در جریان-داده های غیر ایستا
محورهای موضوعی : مهندسی برق و کامپیوتر
شیرین خضری
1
,
جعفر تنها
2
,
علی احمدی
3
,
آرش شريفي
4
1 - دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
2 - دانشگا آمستردام هلند
3 - دانشگاه اوساکا ژاپن
4 - دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
کلید واژه:
چکیده مقاله :
در این مقاله، یک الگوریتم طبقهبندی نیمهنظارتی جمعی با استفاده از معیار انتخاب مبتنی بر آستانه امتياز اطمينان تحت عنوان SSE-CBS در محیطهای غیر ایستا ارائه میشود. رویکرد پیشنهادی از دادههای دارای برچسب و فاقد برچسب با هدف مقابله با انواع تغییر مفهوم در جریان دادهها استفاده میکند. SSE-CBS مکانیزم مشهور وزندهی بر اساس دقت الگوریتمهای جمعی مبتنی بر بلوک را با ماهیت افزایشی الگوریتم درخت هافدینگ تلفیق میکند. الگوریتم پیشنهادی به طور تجربی با 8 رویکرد منطبق بر جدیدترین دستاوردها، از جمله مدلهای طبقهبندی نظارتی، نیمهنظارتی، منفرد و الگوریتمهای جمعی مبتنی بر بلوک روی مجموعه دادههای متنوع مقایسه شده است. بر اساس نتایج تجربی، SSE-CBS بهترین میانگین دقت طبقهبندی را نسبت به سایر رویکردهای نیمهنظارتی داراست و قادر است در محیطهای دارای تغییر مفهوم با محدودیت داده برچسبدار عملکرد مناسبی داشته باشد.
In this article, we propose a novel Semi-Supervised Ensemble classifier using Confidence Based Selection metric, named SSE-CBS. The proposed approach uses labeled and unlabeled data, which aims at reacting to different types of concept drift. SSE-CBS combines an accuracy-based weighting mechanism known from block-based ensembles with the incremental nature of Hoeffding Tree. The proposed algorithm is experimentally compared to the state-of-the-art stream methods, including supervised, semi-supervised, single classifiers, and block-based ensembles in different drift scenarios. Out of all the compared algorithms, SSE-CBS outperforms other semi-supervised ensemble approaches. Experimental results show that SSE-CBS can be considered suitable for scenarios, involving many types of drift in limited labeled data.
