تخمین مقادیر جاافتاده یک گام مهم در پیشپردازش دادهها است. در این مقاله یک رویکرد دومرحلهای برای پرکردن مقادیر جاافتاده عددی ارائه شده است. در مرحله اول دادهها خوشهبندی میشوند و در مرحله دوم دادههای جاافتاده درون هر خوشه با استفاده از یک روش ترکیبی از k نزدیکتر چکیده کامل
تخمین مقادیر جاافتاده یک گام مهم در پیشپردازش دادهها است. در این مقاله یک رویکرد دومرحلهای برای پرکردن مقادیر جاافتاده عددی ارائه شده است. در مرحله اول دادهها خوشهبندی میشوند و در مرحله دوم دادههای جاافتاده درون هر خوشه با استفاده از یک روش ترکیبی از k نزدیکترین همسایه وزندار و رگرسیون خطی تخمین زده میشوند. از معیار همبستگی بین صفات در هر خوشه برای تعیین روش پرکردن دادههای جاافتاده استفاده میشود. کیفیت پرکردن مقادیر جاافتاده با استفاده از معیار میانگین مربعات خطا سنجیده میشود. تأثیر پارامترهای مختلف بر میزان خطای دادههای تخمین زده شده بررسی میگردد. عملکرد روش ارائهشده برای تخمین دادههای جاافتاده بر روی پنج مجموعه داده نیز بررسی میشود. در نهایت عملکرد روش ارائهشده با چهار روش پرکردن با مقدار میانگین، روش تخمین با شبکه عصبی پرسپترون چندلایه (MLP)، روش پرکردن با خوشهبندی c-means فازی و روش k خوشه و نزدیکترین همسایه مبتنی بر دسته (CKNNI) مقایسه میشود. نتایج به دست آمده نشان داده که خطای تخمین مقادیر جاافتاده در روش ارائهشده کمتر از خطا در دیگر روشهای مقایسهشده است.
پرونده مقاله
رایمگ
سامانه رایمگ تمامی فرآیندهای دریافت، ارزیابی و داوری، ویراستاری، صفحهآرایی و انتشار الکترونیکی نشریات علمی را به انجام میرساند