رویکرد شورای انتخاب ویژگی بر اساس خوشهبندی سلسلهمراتبی برای حل مشکل دادههای زايد در بینی الکترونیکی
محورهای موضوعی : مهندسی برق و کامپیوتر
محمدعلی باقری
1
,
غلامعلی منتظر
2
1 - دانشگاه تربیت مدرس
2 - دانشگاه تربیت مدرس
کلید واژه:
چکیده مقاله :
وجود دادههاي زايد در پاسخ حسگرهای بيني الكترونيكي اثر چشمگیری در دستهبندی بو دارد. برای بهبود صحت دستهبندی، میتوان از سیستم دستهبندی چندگانه بر اساس انتخاب چند زیرمجموعه از ویژگیها (بهجای استفاده از تمام ابعاد بردار ویژگی) استفاده کرد. در این رویکرد که "شورای انتخاب ویژگی" نامیده میشود، فرض بر آن است که مجموعه اولیه ویژگیها دارای دادههایی زايد بوده و میتوان با انتخاب زیرمجموعههای ویژگی مختلف و سپس ترکیب دستهبندهای ایجادشده با این زیرمجموعهها به نتایج دستهبندی بهتری رسید. در این مقاله پس از پیشپردازش سیگنال اولیه حسگرها و حذف نویز سیگنال با استفاده از تحلیل موجک، سیستم دستهبند چندگانه با زیرمجموعههای ویژگی مختلف طراحی شده است: ویژگیهای استخراجشده از سیگنال گذرای حسگر با روش خوشهبندی سلسلهمراتبی طبقهبندی شده و زیرمجموعههای مختلف با انتخاب یک ویژگی از هر خوشه ایجاد شدهاند. این موضوع موجب بهبود تنوع دستهبندهای پایه و افزایش کارایی و سرعت دستهبندی میشود. روش پیشنهادی ابتدا در چند مجموعه داده تراز از مخزن داده UCI آزمون شده و پس از اثبات توانایی آن، در مجموعه داده بویایی حاصل از رایحه سه نوع شیرینبیان به کار برده شده است. نتایج حاصل نشاندهنده کارایی روش جدید در شناسایی الگوهای بویایی است.
The redundancy problem of sensor response in electronic noses is still remarkable due to the cross-selectivity of chemical gas sensors which can degrade the classification performance. In such situations, a more efficient multiple classifier system can be obtained in random feature space rather than in the original one. Ensemble Feature Selection (EFS) methods assume that there is redundancy in the overall feature set and better performance can be achieved by choosing different subsets of input features for multiple classifiers. By combining these classifiers the higher recognition rate can be achieved. In this paper, we propose a feature subset selection method based on hierarchical clustering of transient features in order to enhance the classifier diversity and efficiency of learning algorithms. Our algorithm is tested on the UCI benchmark data sets and then used to design an odor recognition system. The experimental results of proposed method based on hierarchical clustering feature subset selection and multiple classifier system demonstrate the more efficient classification performance.
