-
حرية الوصول المقاله
1 - تعیین ماشینهای بردار پشتیبان بهینه در طبقهبندی تصاویر فرا طیفی بر مبنای الگوریتم ژنتیک
فرهاد صمدزادگان حديثه سادات حسنيامروزه تصاویر فرا طیفی به علت غنای اطلاعات طیفی یک ابزار قوی و کارامد در سنجش از دور به حساب میآیند و امکان تمایز بین عوارض مشابه را فراهم میآورند. با توجه به پایداری ماشینهای بردار پشتیبان در فضاهایی با ابعاد بالا، یک گزینه مناسب در طبقهبندی تصاویر فرا طیفی محسوب م أکثرامروزه تصاویر فرا طیفی به علت غنای اطلاعات طیفی یک ابزار قوی و کارامد در سنجش از دور به حساب میآیند و امکان تمایز بین عوارض مشابه را فراهم میآورند. با توجه به پایداری ماشینهای بردار پشتیبان در فضاهایی با ابعاد بالا، یک گزینه مناسب در طبقهبندی تصاویر فرا طیفی محسوب میشوند. با این وجود، عملکرد این طبقهبندی کنندهها تحت تأثیر پارامترها و فضای ویژگی ورودی آنها میباشد. به منظور استفاده از ماشینهای بردار پشتیبان با بیشترین کارایی، میبایست مقادیر بهینهی پارامترها و همچنین زیر مجموعه بهینه از ویژگیهای ورودی تعیین گردند. در این تحقیق از توانایی الگوریتم ژنتیک به عنوان یک تکنیک بهینهسازی فرا ابتکاری، در تعیین مقادیر بهینه پارامترهای ماشینهای بردار پشتیبان و همچنین انتخاب زیرمجموعه ویژگیهای بهینه در طبقهبندی تصاویر فرا طیفی استفاده شده است. نتایج عملی از بهکارگیری روش فوق در خصوص دادههای فرا طیفی سنجنده AVIRISنشان میدهند، ویژگیهای ورودی و پارامترها هر کدام جداگانه تأثیر بسزایی بر عملکرد ماشینهای بردار پشتیبان دارند ولی بهترین عملکرد طبقه-بندی کننده با حل همزمان آن دو بدست میآید. در حل همزمان تعیین پارامتر و انتخاب ویژگی، برای کرنل گوسین و پلینومیال به ترتیب 5% و 15% افزایش دقت با حذف بیش از نیمی از باندهای تصویر حاصل شد. همچنین الگوریتم بهینهسازی شبیهسازی تبرید تدریجی به منظور مقایسه با الگوریتم ژنتیک پیادهسازی شد که نتایج حاکی از برتری الگوریتم ژنتیک به ویژه با بزرگ و پیچیده شدن فضای جستجو در رویکرد حل همزمان تعیین پارامتر و انتخاب ویژگی میباشد. تفاصيل المقالة -
حرية الوصول المقاله
2 - بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری ایران با رویکرد داده کاوی
مهرناز مطهری نیاامروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شدهاست. سازمانها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان میباشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژیهای جدید مانند تکنیکهای دادهکاوی بر أکثرامروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شدهاست. سازمانها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان میباشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژیهای جدید مانند تکنیکهای دادهکاوی برای سازمانها امکانپذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری میباشد. به این منظور دادههای تراکنشهای پایانههای فروش کلیه بانکهای ایران از یک شرکت ارائهدهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفتهاست. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانههای فروش در هر ماه از نظر رویگردانی و وفاداری بخشبندی شدهاند سپس با استفاده از روش انتخاب ویژگی افزودن L، حذف R و الگوریتم رگرسیون خطی چند متغیره ویژگیهای موثر بر درصد مشتریان رویگردان از بین شاخصهای اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شدهاند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخصهای اقتصادی مورد بررسی هستند.امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شدهاست. سازمانها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان میباشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژیهای جدید مانند تکنیکهای دادهکاوی برای سازمانها امکانپذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری میباشد. به این منظور دادههای تراکنشهای پایانههای فروش کلیه بانکهای ایران از یک شرکت ارائهدهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفتهاست. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانههای فروش در هر ماه از نظر رویگردانی و وفاداری بخشبندی شدهاند سپس با استفاده از روش انتخاب ویژگی افزودن L، حذف R و الگوریتم رگرسیون خطی چند متغیره ویژگیهای موثر بر درصد مشتریان رویگردان از بین شاخصهای اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شدهاند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخصهای اقتصادی مورد بررسی هستند. تفاصيل المقالة -
حرية الوصول المقاله
3 - بهبود روش شناسایی وب سایت فیشینگ با استفاده از دادهکاوی روی صفحات وب
مهدیه بهارلو علیرضا یاریفیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسبوکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایتهای فیشینگ با استفاده از داد أکثرفیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسبوکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایتهای فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگیهای برجسته از فیشینگ یکی از پیششرطهای مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگیهای نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وبسایتهای فیشینگ آماده گردید. سپس برای افزایش کارایی سامانههای تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگیها بهطور قابلتوجهی کاهش یابند. پسازآن عملکرد روشهای درخت تصمیم J48، جنگل تصادفی و بیزین ساده بر روی ویژگیهای کاهشیافته موردبررسی قرار گرفت. نتایج نشان میدهند دقت مدل ایجاد شده برای تعیین وب سایتهای فیشینگ با استفاده از کاهش ویژگی دومرحلهای مبتنی بر پوششی و الگوریتم تحلیل مؤلفه اصلی (PCA) در روش جنگل تصادفی ۹۶٫۵۸% میباشد که نسبت به سایر روشها نتیجه مطلوبی است. تفاصيل المقالة -
حرية الوصول المقاله
4 - Handwritten Digits Recognition Using an Ensemble Technique Based on the Firefly Algorithm
Azar Mahmoodzadeh Hamed Agahi Marzieh SalehiThis paper develops a multi-step procedure for classifying Farsi handwritten digits using a combination of classifiers. Generally, the technique relies on extracting a set of characteristics from handwritten samples, training multiple classifiers to learn to discriminat أکثرThis paper develops a multi-step procedure for classifying Farsi handwritten digits using a combination of classifiers. Generally, the technique relies on extracting a set of characteristics from handwritten samples, training multiple classifiers to learn to discriminate between digits, and finally combining the classifiers to enhance the overall system performance. First, a pre-processing course is performed to prepare the images for the main steps. Then three structural and statistical characteristics are extracted which include several features, among which a multi-objective genetic algorithm selects those more effective ones in order to reduce the computational complexity of the classification step. For the base classification, a decision tree (DT), an artificial neural networks (ANN) and a k-nearest neighbor (KNN) models are employed. Finally, the outcomes of the classifiers are fed into a classifier ensemble system to make the final decision. This hybrid system assigns different weights for each class selected by each classifier. These voting weights are adjusted by a metaheuristic firefly algorithm which optimizes the accuracy of the overall system. The performance of the implemented approach on the standard HODA dataset is compared with the base classifiers and some state-of-the-art methods. Evaluation of the proposed technique demonstrates that the proposed hybrid system attains high performance indices including accuracy of 98.88% with only eleven features. تفاصيل المقالة -
حرية الوصول المقاله
5 - Graph Based Feature Selection Using Symmetrical Uncertainty in Microarray Dataset
Soodeh Bakhshandeh رضا عزمی Mohammad TeshnehlabMicroarray data with small samples and thousands of genes makes a difficult challenge for researches. Using gene selection in microarray data helps to select the most relevant genes from original dataset with the purpose of reducing the dimensionality of the microarray أکثرMicroarray data with small samples and thousands of genes makes a difficult challenge for researches. Using gene selection in microarray data helps to select the most relevant genes from original dataset with the purpose of reducing the dimensionality of the microarray data as well as increasing the prediction performance. In this paper, a new gene selection method is proposed based on community detection technique and ranking the best genes. Symmetric Uncertainty is used for selection of the best genes by calculation of similarity between two genes and between each gene and class label which leads to representation of search space as a graph, in the first step. Afterwards, the proposed graph is divided into several clusters using community detection algorithm and finally, after ranking the genes, the genes with maximum ranks are selected as the best genes. This approach is a supervised/unsupervised filter-based gene selection method that minimizes the redundancy between genes and maximizes the relevance of genes and class label. Performance of the proposed method is compared with thirteen well-known unsupervised/supervised gene selection approaches over six microarray datasets using four classifiers including SVM, DT, NB and k-NN. Results show the advantages of the proposed approach. تفاصيل المقالة -
حرية الوصول المقاله
6 - An Effective Method of Feature Selection in Persian Text for Improving the Accuracy of Detecting Request in Persian Messages on Telegram
zahra khalifeh zadeh Mohammad Ali Zare ChahookiIn recent years, data received from social media has increased exponentially. They have become valuable sources of information for many analysts and businesses to expand their business. Automatic document classification is an essential step in extracting knowledge from أکثرIn recent years, data received from social media has increased exponentially. They have become valuable sources of information for many analysts and businesses to expand their business. Automatic document classification is an essential step in extracting knowledge from these sources of information. In automatic text classification, words are assessed as a set of features. Selecting useful features from each text reduces the size of the feature vector and improves classification performance. Many algorithms have been applied for the automatic classification of text. Although all the methods proposed for other languages are applicable and comparable, studies on classification and feature selection in the Persian text have not been sufficiently carried out. The present research is conducted in Persian, and the introduction of a Persian dataset is a part of its innovation. In the present article, an innovative approach is presented to improve the performance of Persian text classification. The authors extracted 85,000 Persian messages from the Idekav-system, which is a Telegram search engine. The new idea presented in this paper to process and classify this textual data is on the basis of the feature vector expansion by adding some selective features using the most extensively used feature selection methods based on Local and Global filters. The new feature vector is then filtered by applying the secondary feature selection. The secondary feature selection phase selects more appropriate features among those added from the first step to enhance the effect of applying wrapper methods on classification performance. In the third step, the combined filter-based methods and the combination of the results of different learning algorithms have been used to achieve higher accuracy. At the end of the three selection stages, a method was proposed that increased accuracy up to 0.945 and reduced training time and calculations in the Persian dataset. تفاصيل المقالة -
حرية الوصول المقاله
7 - انتخاب ويژگي براي شناسايي نويسنده در متون کوتاه برخط فارسي
سمیه عارفی محمد احسان بصیری امید روزمندرشد فزايندهي استفاده از رسانههاي اجتماعي و ارتباطات برخط بهمنظور بيان نظرات، تبادل عقايد و همچنين گسترش استفادهي کاربران فارسي زبان از اين ابزارها باعث افزايش متون فارسي در وب شده است. اين رشد چشمگير در کنار سوءاستفادههاي ناشي از ناشناس بودن نويسندهي نوشتهها نياز أکثررشد فزايندهي استفاده از رسانههاي اجتماعي و ارتباطات برخط بهمنظور بيان نظرات، تبادل عقايد و همچنين گسترش استفادهي کاربران فارسي زبان از اين ابزارها باعث افزايش متون فارسي در وب شده است. اين رشد چشمگير در کنار سوءاستفادههاي ناشي از ناشناس بودن نويسندهي نوشتهها نياز به سامانهي خودکار شناسايي نويسنده در اين زبان را بيش از پيش آشکار ميسازد. هدف از اين پژوهش، بررسي ويژگيهاي مؤثر در شناسايي نويسندگان نظرات فارسي توليد شده توسط خريداران گوشي و همچنین ارزیابی روشهای نظارتی و غیرنظارتی میباشد. عواملي که در اين پژوهش بررسي ميشود شامل ويژگيهاي لغوي، نگارشی، معنايي، ساختاري، دستوري، مختص متن و مختص شبکههاي اجتماعي است. پس از استخراج ويژگيهاي مذکور، انتخاب ويژگيهاي برتر توسط چهار الگوريتم همبستگي ويژگي، نسبت بهره، OneR و تحليل اجزاي اصلي آزمايش ميشود. در ادامه از الگوريتمهاي K-means، EM و خوشهبندي مبتني بر چگالي براي خوشهبندي و الگوريتمهاي شبکهي بيز، جنگل تصادفي و Bagging براي دستهبندي استفاده خواهد شد. ارزيابي الگوريتمهاي فوق بر روي نظرات فارسي مربوط به خريداران گوشيهاي سامسونگ نشان ميدهد که بهترين تشخيص در بين الگوريتمهاي خوشهبندي با دقت 16/59% مربوط به الگوريتم EM روي 15 ويژگي برتر انتخابي توسطOneR است درحاليکه الگوريتم جنگل تصادفي بههمراه نسبت بهره برای 90 ویژگی با دقت 57/79% بهترين کارايي را در بين الگوريتمهاي دستهبندي دارد. همچنين مقايسهی ويژگيها نشان داد که ويژگيهاي نگارشی بيشترين تأثير را در شناسايي نويسندهي متون کوتاه داشته و پس از آن بهترتيب ويژگيهاي لغوي ، مختص متن، مختص شبکههای اجتماعی، ساختاري، دستوري و معنایی قرار گرفتند. تفاصيل المقالة -
حرية الوصول المقاله
8 - تحلیل یادگیری دانش آموزان از طریق ورزش صبحگاهی با استفاده از روش های داده کاوی
بهزاد لک نرگس عباسییکی از عوامل اصلی فرایند جامعه پذیری، مدرسه است که اهمیت آن در نظام آموزشی هر کشوری بیش از پیش احساس می شود. ارتقاء سطح یادگیری دانش آموزان، یک عامل مهم برای ارتقای کیفیت نظام آموزش در مدارس، می باشد. از آنجایی که ورزش کردن ثاثیر بسزایی در یادگیری دارد، هدف اصلی مقاله ا أکثریکی از عوامل اصلی فرایند جامعه پذیری، مدرسه است که اهمیت آن در نظام آموزشی هر کشوری بیش از پیش احساس می شود. ارتقاء سطح یادگیری دانش آموزان، یک عامل مهم برای ارتقای کیفیت نظام آموزش در مدارس، می باشد. از آنجایی که ورزش کردن ثاثیر بسزایی در یادگیری دارد، هدف اصلی مقاله ارائه روشی جهت تقویت روند یادگیری دانش آموزان از طریق ورزش صبحگاهی مبتنی بر تکنیک شبکه عصبی و الگوریتم بهینه سازی قطرات هوشمند آب است. رویکرد این پژوهش به صورت کمی بوده و از نظر هدف كاربردي و همچنین از نظر نوع روش، توصيفي- تحليلي است. جهت دستیابی به این هدف از تکنیک شبکه عصبی به منظور طبقهبندی و استخراج نتایج و از الگوریتم بهینه سازی قطرات هوشمند آب جهت انتخاب ویژگی استفاده می شود. برای شبکه عصبی از 11 نورون به عنوان تعداد نورون مناسب لایه مخفی و ترکیب دو تابع فعال سازي خطي و سيگموئيدي به عنوان توابع انتقال بین لایهای و از یک تابع آموزش جهت آموزش شبکه و حداکثر تکرار الگوریتم آموزش بر روی مجموعه داده 3000 تعداد، پیشنهاد شده است. دقت روش پیشنهادی 68 درصد است که به نسبت روش پایه حدود 2/2 درصد بهبود داشته و این یعنی ورزش برروی یادگیری دانشآموزان تاثیر دارد. نتایج نشان داد طبقه بندی بهینه روی مجموعه داده با پارامترهای همگن، عملکرد مناسبی داشته و همچنین شبکههای عصبی مصنوعی نسبت به روش های جدید ، عملکرد بهتری دارد. طبق نتایج به دست آمده روش پیشنهادی از نظر صحت خروجی می تواند بهبود مناسبی در تقویت روند یادگیری داشته باشد. تفاصيل المقالة -
حرية الوصول المقاله
9 - رویکرد شورای انتخاب ویژگی بر اساس خوشهبندی سلسلهمراتبی برای حل مشکل دادههای زايد در بینی الکترونیکی
محمدعلی باقری غلامعلی منتظروجود دادههاي زايد در پاسخ حسگرهای بيني الكترونيكي اثر چشمگیری در دستهبندی بو دارد. برای بهبود صحت دستهبندی، میتوان از سیستم دستهبندی چندگانه بر اساس انتخاب چند زیرمجموعه از ویژگیها (بهجای استفاده از تمام ابعاد بردار ویژگی) استفاده کرد. در این رویکرد که "شورای ا أکثروجود دادههاي زايد در پاسخ حسگرهای بيني الكترونيكي اثر چشمگیری در دستهبندی بو دارد. برای بهبود صحت دستهبندی، میتوان از سیستم دستهبندی چندگانه بر اساس انتخاب چند زیرمجموعه از ویژگیها (بهجای استفاده از تمام ابعاد بردار ویژگی) استفاده کرد. در این رویکرد که "شورای انتخاب ویژگی" نامیده میشود، فرض بر آن است که مجموعه اولیه ویژگیها دارای دادههایی زايد بوده و میتوان با انتخاب زیرمجموعههای ویژگی مختلف و سپس ترکیب دستهبندهای ایجادشده با این زیرمجموعهها به نتایج دستهبندی بهتری رسید. در این مقاله پس از پیشپردازش سیگنال اولیه حسگرها و حذف نویز سیگنال با استفاده از تحلیل موجک، سیستم دستهبند چندگانه با زیرمجموعههای ویژگی مختلف طراحی شده است: ویژگیهای استخراجشده از سیگنال گذرای حسگر با روش خوشهبندی سلسلهمراتبی طبقهبندی شده و زیرمجموعههای مختلف با انتخاب یک ویژگی از هر خوشه ایجاد شدهاند. این موضوع موجب بهبود تنوع دستهبندهای پایه و افزایش کارایی و سرعت دستهبندی میشود. روش پیشنهادی ابتدا در چند مجموعه داده تراز از مخزن داده UCI آزمون شده و پس از اثبات توانایی آن، در مجموعه داده بویایی حاصل از رایحه سه نوع شیرینبیان به کار برده شده است. نتایج حاصل نشاندهنده کارایی روش جدید در شناسایی الگوهای بویایی است. تفاصيل المقالة -
حرية الوصول المقاله
10 - ارائهی یک روش هوشمند انتخاب ویژگی مبتنی بر الگوریتم جستجوی گرانشی باینری در سیستم بازشناسی ارقام دستنویس فارسی
نجمه قنبری سیدمحمد رضوی سیدحسن نبوی کریزیدر این مقاله یک روش هوشمند انتخاب ویژگی برای بازشناسی ارقام دستنویس فارسی ارائه شده است. در این روش تابع برازندگی مرتبط با خطای سیستم بازشناسی ارقام دستنویس فارسی با استفاده از الگوریتم جستجوی گرانشی باینری و با انتخاب ویژگیهای مناسب کمینه میشود. نتایج پیادهسازی نش أکثردر این مقاله یک روش هوشمند انتخاب ویژگی برای بازشناسی ارقام دستنویس فارسی ارائه شده است. در این روش تابع برازندگی مرتبط با خطای سیستم بازشناسی ارقام دستنویس فارسی با استفاده از الگوریتم جستجوی گرانشی باینری و با انتخاب ویژگیهای مناسب کمینه میشود. نتایج پیادهسازی نشان میدهند که استفاده از روشهای هوشمند برای انتخاب ویژگی بهخوبی قادر است که موثرترین ویژگیها برای سیستم بازشناسی را انتخاب کند. همچنین مقایسه نتایج روش پیشنهادی با سایر روشهای مشابه مبتنی بر استفاده از الگوریتم ژنتیک و روش بهینهسازی گروه ذرات باینری نشان دهندهی کارایی خوب این روش است. تفاصيل المقالة -
حرية الوصول المقاله
11 - طرحی جديد برای طبقهبندی خودکار اغتشاشات کيفيت توان بر اساس ابزار پردازش سیگنال و یادگیری ماشین
مهدي حاجيان اصغر اکبری فرودتشخیص و دستهبندی اغتشاشات کیفیت توان یکی از وظایف مهم در حفاظت و نظارت سیستمهای قدرت امروزی است. در حال حاضر اهمیت اصلی، بهبود روشهای تشخيص و طبقهبندي خودکار شكل موجها به کمک يك الگوريتم مؤثر ميباشد. در این مقاله روشی مؤثر برای استخراج ویژگی بر اساس ترکیب تبدیل S أکثرتشخیص و دستهبندی اغتشاشات کیفیت توان یکی از وظایف مهم در حفاظت و نظارت سیستمهای قدرت امروزی است. در حال حاضر اهمیت اصلی، بهبود روشهای تشخيص و طبقهبندي خودکار شكل موجها به کمک يك الگوريتم مؤثر ميباشد. در این مقاله روشی مؤثر برای استخراج ویژگی بر اساس ترکیب تبدیل S هذلولی و موجک ارائه شده است. انتخاب و كاهش ويژگي، موجب كاهش زمان آموزش ميگردد و در بیشتر موارد افزايش ميزان دقت در طبقهبندي دادهها را به همراه دارد. در این مقاله، روشی جديد به نام گرام- اشمیت براي انتخاب ويژگي به کار گرفته شده و همچنین از ساختار طبقهبندی کننده مشهور ماشین بردار پشتیبان چندکلاسه استفاده شده است. همچنین پارامترهای متغیر این طبقهبندی کننده با استفاده از الگوریتم ابتکاری بهينهسازي گروهي ذرات، بهینه شده است. 6 اغتشاش منفرد و 2 اغتشاش ترکیبی و همچنین حالت نرمال برای طبقهبندی در نظر گرفته شدهاند. حساسیت روش پیشنهادی تحت شرایط مختلف نویزی با سطوح مختلف سیگنال همراه با نویز بررسی شده است. همچنین با مقایسه نتایج این مقاله با نتایج مقالات دیگر، کارامدی روش پیشنهادی مورد بررسی قرار گرفته است. تفاصيل المقالة -
حرية الوصول المقاله
12 - ارائه يک نسخه جديد از الگوريتم مورچگان باينری به منظور حل مسأله انتخاب ويژگی
شيما کاشف حسین نظامآبادیپوراستفاده از الگوریتمهای ابتکاری یک انتخاب مناسب برای حل مسایل بهینهسازی است. در اين مقاله نسخه بهبوديافتهاي از الگوريتم بهينهساز مورچگان باينري براي حل مسأله انتخاب ويژگي ارائه شده است. نسخه پيشنهادي خصوصيات الگوريتم جمعيت مورچه گسسته و الگوريتم مورچه باينري را به صو أکثراستفاده از الگوریتمهای ابتکاری یک انتخاب مناسب برای حل مسایل بهینهسازی است. در اين مقاله نسخه بهبوديافتهاي از الگوريتم بهينهساز مورچگان باينري براي حل مسأله انتخاب ويژگي ارائه شده است. نسخه پيشنهادي خصوصيات الگوريتم جمعيت مورچه گسسته و الگوريتم مورچه باينري را به صورت توأمان در خود دارد. کارايي روش پيشنهادي روي 12 پايگاه داده استاندارد در موضوع طبقهبندي بررسي و نتايج با چند الگوريتم مطرح در اين زمينه شامل بهينهساز جمعيت مورچگان گسسته و باينري مقايسه شده است. نتايج بيانگر کارايي مناسب الگوريتم پيشنهادي است. تفاصيل المقالة -
حرية الوصول المقاله
13 - یک روش انتخاب ویژگی ترکیبی برای دادههای با بعد بالا مبتنی بر خرد جمعی
امیررضا روحی حسین نظامآبادیپورامروزه با ظهور و گسترش دادههای بعد بالا، روند انتخاب ویژگی نقش بسیار مهمی را در زمینه یادگیری ماشینی و به خصوص مسایل طبقهبندی داده، بازی ميکند. کار بر روی دادههای با بعد بالا از جمله دادههای میکروآرایهای با مشکلاتی همچون وجود ویژگیهای نامرتبط و افزونه بسیار روبه أکثرامروزه با ظهور و گسترش دادههای بعد بالا، روند انتخاب ویژگی نقش بسیار مهمی را در زمینه یادگیری ماشینی و به خصوص مسایل طبقهبندی داده، بازی ميکند. کار بر روی دادههای با بعد بالا از جمله دادههای میکروآرایهای با مشکلاتی همچون وجود ویژگیهای نامرتبط و افزونه بسیار روبهرو است که باعث کاهش نرخ صحت طبقهبند، افزایش هزینه محاسباتی و معضل "نفرین بعد" میشود. در این مقاله به ارائه یک روش ترکیبی با استفاده از رویکردهای خرد جمعی برای انتخاب ویژگی در دادههای با بعد بالا پرداخته میشود. در روش پیشنهادی، ابتدا در مرحله اول از یک روش فیلتری برای کاهش بعد داده استفاده میشود، سپس در مرحله دوم، دو الگوریتم روزآمد پیچشی با استفاده از رویکرد خرد جمعی بر روی ویژگیهای کاهشیافته اعمال شده و نتیجه تجمیع میگردد. روش پیشنهادی بر روی 8 پایگاه داده میکروآرایهای مورد ارزیابی قرار گرفته و مقایسه نتایج با چندین روش روزآمد و شناختهشده در حوزه انتخاب ویژگی، کارایی روش پیشنهادی را تأیید میکند. تفاصيل المقالة -
حرية الوصول المقاله
14 - کاهش ابعاد روش پنهانشکنی CDF با استفاده از یک روش انتخاب ویژگی مبتنی بر تئوری گراف
سعید آزادیفر سیدحسین خواسته محمدهادی ادریسیپنهانشکنی دانش کشف حضور داده پنهان در یک رسانه پوششی است. هدف پنهانشکنی جلوگیری از رسیدن روشهای پنهاننگاری به اهداف خود میباشد. یکی از معروفترین روشهای پنهانشکنی روش CDF است که در این پژوهش استفاده شده است. یکی از چالشهای عمده در مسئله پنهانشکنی تصاویر تعداد أکثرپنهانشکنی دانش کشف حضور داده پنهان در یک رسانه پوششی است. هدف پنهانشکنی جلوگیری از رسیدن روشهای پنهاننگاری به اهداف خود میباشد. یکی از معروفترین روشهای پنهانشکنی روش CDF است که در این پژوهش استفاده شده است. یکی از چالشهای عمده در مسئله پنهانشکنی تصاویر تعداد زیاد ویژگیهای استخراجشده برای این کار است. مجموعههای دادهای با ابعاد بالا از دو جهت باعث کاهش عملکرد پنهانشکنی میشود. از یک طرف با افزایش ابعاد دادهها، حجم محاسبات افزایش پیدا میکند و از طرف دیگر مدلی که بر اساس دادههای با ابعاد بالا ساخته میشود دارای قابلیت تعمیم پایینی است و احتمال بیشبرازش افزایش مییابد. در نتیجه، کاهش ابعاد مسئله میتواند هم پیچیدگی محاسباتی را کاهش داده و هم باعث بهبود عملکرد پنهانشکنی شود. در این مقاله تلاش شده با ترکیب مفهوم زیرگراف کامل بیشینه وزندار و معیار مرکزیت یال و در نظر گرفتن مناسببودن هر ویژگی، ویژگیهای تأثیرگذار و دارای حداقل افزونگی بهعنوان ویژگیهای نهایی انتخاب شوند. نتایج شبیهسازی بر روی مجموعه دادههای SPAM و CC-PEV نشان داد روش پیشنهادی دارای عملکرد مناسبی است و به دقت حدود 96% در تشخیص جاسازی داده در تصاویر دست پیدا کرده و همچنین این روش در مقایسه با روشهای شناختهشده قبلی دارای دقت بالاتری است. تفاصيل المقالة -
حرية الوصول المقاله
15 - کاهش ابعاد ویژگی مبتنی بر تئوری راف با استفاده از الگوریتم رقابت لیگ فوتبال
مجید عبدالرزاق نژاد علی ادیبیانافزایش حجم پایگاه دادهها، مسئله کاهش ویژگی را ایجاد و پراهمیت میسازد. از این رو در علم دادهکاوی، یکی از زیربخشهای مهم، مسئله کاهش ابعاد (انتخاب ویژگی) میباشد که در آن زیرمجموعهای از ویژگیهایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب میشوند أکثرافزایش حجم پایگاه دادهها، مسئله کاهش ویژگی را ایجاد و پراهمیت میسازد. از این رو در علم دادهکاوی، یکی از زیربخشهای مهم، مسئله کاهش ابعاد (انتخاب ویژگی) میباشد که در آن زیرمجموعهای از ویژگیهایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب میشوند. در سالهای اخیر، تئوری مجموعه راف به عنوان یکی از ابزارهای موثر و کارآمد در کاهش ویژگی مورد توجه محققان قرار گرفته است. در این مقاله الگوریتم رقابت لیگ فوتبال برای اولین بار به منظور حل این مسئله مورد استفاده قرار گرفته شده است. توانایی فرار از بهینهای موضعی، امکان بهرهگیری از اطلاعات بازیکنان توزیعشده در فضای جستجو، همگرایی سریع به جوابهای بهین و پارامترهای کم این الگوریتم، انگیزه این انتخاب بود. علاوه بر این نوآوری، ارائه تغییراتی همچون بهرهگیری از مجموع توان بازیکنان ثابت و ذخیره در محاسبه توان هر تیم، در نظر گرفتن ترکیب ساختارهای پیوسته و گسسته برای هر بازیکن، ارائه یک مکانیزم ابتکاری گسستهسازی جدید، ارائه تحلیل هیدرولیک متناسب با مسئله تحقیق برای فرایند برازش هر بازیکن، ارائه اصلاح در عملگرهای تقلید و تهییج بر اساس چالشهای نسخه اصلی را میتوان به عنوان ایدههای پیشنهادی به منظور اصلاح و سازگاری این الگوریتم برای مسئله کاهش ویژگی برشمرد. ایدههای پیشنهادشده بر روی سه سطح داده در ابعاد کوچک، متوسط و بزرگ به همراه چهار الگوریتم فراابتکاری مشهور ژنتیک و بهینهسازی ازدحام ذارت، سیستم ایمنی مصنوعی و لیگ قهرمانان پیادهسازی گردیده و مقایسه نتایج به دست آمده نشان از مزیتهای رقابتی قابل توجه الگوریتم رقابت لیگ فوتبال با سایر الگوریتمها دارد. تفاصيل المقالة -
حرية الوصول المقاله
16 - تشخیص كمتوجهي- بيشفعالي (ADHD) مبتني بر الگوريتم تكاملي با طول متغير
مريم رمضانیان کشتلی حسین منتظری کردیروشهایی که امروزه برای بررسی ارتباطات مغز به منظور تشخیص بیماریهای مرتبط با عملکرد مغز استفاده میشود، روش تصويرنگاري عملكردي تشديد مغناطيسي در حالت استراحت میباشد. در این مقاله، یک روش جدید با استفاده از الگوریتم تکاملی با طول متغیر برای انتخاب ویژگیهای مناسب جهت ب أکثرروشهایی که امروزه برای بررسی ارتباطات مغز به منظور تشخیص بیماریهای مرتبط با عملکرد مغز استفاده میشود، روش تصويرنگاري عملكردي تشديد مغناطيسي در حالت استراحت میباشد. در این مقاله، یک روش جدید با استفاده از الگوریتم تکاملی با طول متغیر برای انتخاب ویژگیهای مناسب جهت بهبود دقت تشخيص افراد سالم و بيمار به اختلال كمتوجهي- بيشفعالي از يكديگر مبتني بر تحليل تصاوير rs-fMRI ارائه شده است. ویژگیهای مورد بررسی مقادیر همبستگی میان سیگنالهای سری زمانی مناطق مختلف مغز میباشند. انتخاب ویژگی با طول متغیر بر اساس الگوریتم زنبور عسل جهت غلبه بر مشکل انتخاب ویژگی در الگوریتمهای با طول بردار ویژگی ثابت صورت گرفت. فاصله ماهالانوبیس به عنوان تابع ارزیابی الگوریتم رنبور عسل استفاده شده است. کارایی الگوریتم از لحاظ مقدار تابع ارزیابی در درجه اول و زمان پردازش در درجه دوم مورد بررسی قرار گرفته شد. نتایج بهدستآمده از کارایی به مراتب بالاتر الگوریتم زنبور عسل با طول متغیر نسبت به سایر روشهای انتخاب ویژگی حکایت دارد. در حالی که بهترین نتیجه صحت طبقهبندی کلی در میان سایر روشها با 26 ویژگی منتخب از الگوریتم اجتماع ذرات، 61/76% میباشد، روش پیشنهادی توانسته به مقدار صحت طبقهبندی کلی 32/85% با انتخاب 25 ویژگی دست یابد. طبیعت داده به صورتی است که افزایش تعداد ویژگیها منجر به بهبود بیشتر صحت طبقهبندی میشود به گونهای که با افزایش طول بردار ویژگی به 35 و 45 صحت طبقهبندی بهترتیب به 66/91% و 57/95% رسیده است. تفاصيل المقالة -
حرية الوصول المقاله
17 - یک الگوریتم انتخاب ویژگی برخط در جریان دادهها با استفاده از اطلاعات متقابل چندمتغیره
مریم رحمانی نیا پرهام مرادیامروزه در بسیاری از مسایل دنیای واقعی همچون شبکههای اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه دادههای موجود اضافه میشود. از آنجا که کارایی بیشتر الگوریتمهای دادهکاوی با افزایش ابعاد دادهها کاهش مییابد، تحلیل این جریان دادهها در سالها أکثرامروزه در بسیاری از مسایل دنیای واقعی همچون شبکههای اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه دادههای موجود اضافه میشود. از آنجا که کارایی بیشتر الگوریتمهای دادهکاوی با افزایش ابعاد دادهها کاهش مییابد، تحلیل این جریان دادهها در سالهای اخیر به یکی از مسایل مهم در دادهکاوی تبدیل شده است. روشهای انتخاب ویژگی در جریان دادههای برخط، روشهای کارآمدی هستند که با حذف ویژگیهای افزونه و نامربوط باعث کاهش ابعاد کلان دادهها و در نتیجه بهبود کارایی الگوریتمها میشوند. از چالشهای اساسی در رابطه با الگوریتمهای انتخاب ویژگی برخط، در دسترس نبودن همه دادهها قبل از شروع الگوریتم، مقیاسپذیری، دقت ویژگیهای انتخابشده و اندازه زیرمجموعه انتخابی را میتوان نام برد. تا کنون الگوریتمهای انتخاب ویژگی موجود تنها توانستهاند بخش محدودی از این چالشها را به صورت همزمان مرتفع کنند. به همین منظور در این مقاله یک راهکار انتخاب ویژگی برخط به نام MMIOSFS با استفاده از اطلاعات متقابل ارائه دادهایم که حد واسط بهتری را میان چالشهای ذکرشده به دست میآورد. در روش پیشنهادی در ابتدا مجموعه ویژگیها با استفاده از تکنیک متغیرهای تصادفی توأم به یک ویژگی نگاشت و سپس اطلاعات متقابل ویژگی جدید با برچسب به عنوان میزان ارتباط مجموعه ویژگیهای اولیه در نظر گرفته میشود. کارایی روش پیشنهادی با چند الگوریتم انتخاب ویژگی برخط با استفاده از دستهبندهای مختلف مورد ارزیابی قرار گرفته و نتایج به دست آمده نشان میدهد الگوریتم پیشنهادی معمولاً حد واسط بهتری میان چالشها به دست میآورد. تفاصيل المقالة -
حرية الوصول المقاله
18 - انتخاب ویژگی و طبقهبندی سلولهای سرطانی بر پایه دادههای ریزآرایه با استفاده از الگوریتم جستجوی فاخته چندهدفه
خدیجه کمری فرزان رشیدی عبدالله خلیلیدادههاي ریزآرایه نقش مؤثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچ أکثردادههاي ریزآرایه نقش مؤثری در طبقهبندی و تشخیص انواع بافتهای سرطانی ایفا میکنند. با این حال در پژوهشهای مرتبط با سرطان، تعداد نسبتاً کم نمونهها در مقایسه با تعداد بسیار زیاد ژنها، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقهبندها، افزایش هزینههای محاسباتی و پیچیدگی در طبقهبندی سلولهای سرطانی خواهد شد. یک راهکار مناسب جهت افزایش کارایی طبقهبندها، حذف ژنهای نامربوط و انتخاب نمونههای مناسب برای آموزش طبقهبندها است. در این مقاله یک مدل ترکیبی بر پایه الگوریتم بهینهسازی جستجوی فاخته چندهدفه و خوشهبندی فازی برای طبقهبندی دادههای ریزآرایه پیشنهاد شده است. در اين مطالعه از نسخه دودویی الگوريتم جستجوی فاخته چندهدفه به منظور انتخاب ويژگيهاي مرتبط با بیماری و از نسخه پیوسته آن برای انتخاب تعداد نمونههای مناسب برای آموزش طبقهبندها استفاده شده است. به منظور تسریع در فرایند بهینهسازی و جلوگیری از گیرافتادن الگوریتم در بهینههای محلی، راهکارهای ابتکاری جدیدی نیز به الگوریتم اضافه شدهاند. برای بررسی عملکرد مدل پیشنهادی، شبیهسازیهای متعددی بر روی شش مجموعه داده سرطانی انجام گرفته و نتایج آن با دیگر مقالات مقایسه شده است. نتایج به دست آمده نشان میدهند در بسیاری از موارد مدل پیشنهادی قادر است در مقایسه با سایر روشها، با انتخاب مجموعه کوچکتری از ژنهای متمایز، منجر به افزایش کارایی طبقهبندها شود. تفاصيل المقالة -
حرية الوصول المقاله
19 - بازشناسی کارای کنشهای انسانی با محدود کردن فضای جستجو در روشهای یادگیری عمیق
مریم کوهزادی هیکویی نصرالله مقدم چرکریکارایی سیستمهای بازشناسی کنشهای انسانی به استخراج بازنمایی مناسب از دادههای ویدئویی وابسته است. در سالهای اخیر روشهای یادگیری عمیق به منظور استخراج بازنمایی فضایی- زمانی کارا از دادههای ویدئویی ارائه شده است، در حالی که روشهای یادگیری عمیق در توسعه بعد زمان، پیچ أکثرکارایی سیستمهای بازشناسی کنشهای انسانی به استخراج بازنمایی مناسب از دادههای ویدئویی وابسته است. در سالهای اخیر روشهای یادگیری عمیق به منظور استخراج بازنمایی فضایی- زمانی کارا از دادههای ویدئویی ارائه شده است، در حالی که روشهای یادگیری عمیق در توسعه بعد زمان، پیچیدگی محاسباتی بالایی دارند. همچنین پراکندگی و محدودبودن دادههای تمایزی و عوامل نویزی زیاد، مشکلات محاسباتی بازنمایی کنشها را شدیدتر ساخته و قدرت تمایز را محدود مینماید. در این مقاله، شبکههای یادگیری عمیق فضایی و زمانی با افزودن سازوکارهای انتخاب ویژگی مناسب جهت مقابله با عوامل نویزی و کوچکسازی فضای جستجو، ارتقا یافتهاند. در این راستا، سازوکارهای انتخاب ویژگی غیر برخط و برخط، برای بازشناسی کنشهای انسانی با پیچیدگی محاسباتی کمتر و قدرت تمایز بالاتر مورد بررسی قرار گرفته است. نتایج نشان داد که سازوکار انتخاب ویژگی غیر برخط، منجر به کاهش پیچیدگی محاسباتی قابل ملاحظه میگردد و سازوکار انتخاب ویژگی برخط، ضمن کنترل پیچیدگی محاسباتی، منجر به افزایش قدرت تمایز میشود. تفاصيل المقالة -
حرية الوصول المقاله
20 - ارائه روش جهش هوشمند مبتنی بر الگوریتم PSO برای حل مسئله انتخاب ویژگی
محمود پرنده مینا زلفی لیقوان جعفر تنهاامروزه با افزایش حجم تولید داده، توجه به الگوریتمهای یادگیری ماشین جهت استخراج دانش از دادههای خام افزایش یافته است. داده خام معمولاً دارای ویژگیهای اضافی یا تکراری است که بر روی عملکرد الگوریتمهای یادگیری تأثیر میگذارد. جهت افزایش کارایی و کاهش هزینه محاسباتی الگو أکثرامروزه با افزایش حجم تولید داده، توجه به الگوریتمهای یادگیری ماشین جهت استخراج دانش از دادههای خام افزایش یافته است. داده خام معمولاً دارای ویژگیهای اضافی یا تکراری است که بر روی عملکرد الگوریتمهای یادگیری تأثیر میگذارد. جهت افزایش کارایی و کاهش هزینه محاسباتی الگوریتمهای یادگیری ماشین، از الگوریتمهای انتخاب ویژگی استفاده میشود که روشهای متنوعی برای انتخاب ویژگی ارائه شده است. از جمله روشهای انتخاب ویژگی، الگوریتمهای تکاملی هستند که به دلیل قدرت بهینهسازی سراسری خود مورد توجه قرار گرفتهاند. الگوریتمهای تکاملی بسیاری برای حل مسئله انتخاب ویژگی ارائه شده که بیشتر آنها روی فضای هدف تمرکز داشتهاند. فضای مسئله نیز میتواند اطلاعات مهمی برای حل مسئله انتخاب ویژگی ارائه دهد. از آنجایی که الگوریتمهای تکاملی از مشکل عدم خروج از نقطه بهینه محلی رنج میبرند، ارائه یک مکانیزم مؤثر برای خروج از نقطه بهینه محلی ضروری است. در این مقاله از الگوریتم تکاملی PSO با تابع چندهدفه برای انتخاب ویژگی استفاده شده که در آن یک روش جدید جهش که از امتیاز ویژگیهای ذرات استفاده میکند، به همراه نخبهگرایی برای خروج از نقاط بهینه محلی ارائه گردیده است. الگوریتم ارائهشده بر روی مجموعه دادههای مختلف تست و با الگوریتمهای موجود بررسی شده است. نتایج شبیهسازیها نشان میدهند که روش پیشنهادی در مقایسه با روش جدید RFPSOFS بهبود خطای 20%، 11%، 85% و 7% به ترتیب در دیتاستهای Isolet، Musk، Madelon و Arrhythmia دارد. تفاصيل المقالة -
حرية الوصول المقاله
21 - بهبود تشخيص ناهنجاري بات¬نت¬هاي حوزة اينترنت اشياء مبتنی بر انتخاب ویژگی پویا و پردازش¬های ترکیبی
بشری پیشگو احمد اکبری ازیرانیپیچیدهشدن کاربردهای دنیای واقعی خصوصاً در حوزههای اینترنت اشیا، ریسکهای امنیتی متنوعی را برای این حوزه به همراه داشته است. باتنتهای این حوزه به عنوان گونهای از حملات امنیتی پیچیده شناخته میشوند که میتوان از ابزارهای یادگیری ماشین، به منظور شناسایی و کشف آنها است أکثرپیچیدهشدن کاربردهای دنیای واقعی خصوصاً در حوزههای اینترنت اشیا، ریسکهای امنیتی متنوعی را برای این حوزه به همراه داشته است. باتنتهای این حوزه به عنوان گونهای از حملات امنیتی پیچیده شناخته میشوند که میتوان از ابزارهای یادگیری ماشین، به منظور شناسایی و کشف آنها استفاده نمود. شناسایی حملات مذکور از یک سو نیازمند کشف الگوی رفتاری باتنتها از طریق پردازشهای دستهای و با دقت بالا بوده و از سویی دیگر میبایست همانند پردازشهای جریانی، به لحاظ عملیاتی بلادرنگ عمل نموده و وفقپذیر باشند. این مسئله، اهمیت بهرهگیری از تکنیکهای پردازش ترکیبی دستهای و جریانی را با هدف تشخیص باتنتها، بیش از پیش آشکار میسازد. از چالشهای مهم این پردازشها میتوان به انتخاب ویژگیهای مناسب و متنوع جهت ساخت مدلهای پایه و نیز انتخاب هوشمندانه مدلهای پایه جهت ترکیب و ارائه نتیجه نهایی اشاره نمود. در این مقاله به ارائه راهکاری مبتنی بر ترکیب روشهای یادگیری جریانی و دستهای با هدف تشخیص ناهنجاری باتنتها میپردازیم. این راهکار از یک روش انتخاب ویژگی پویا که مبتنی بر الگوریتم ژنتیک بوده و به طور کامل با ماهیت پردازشهای ترکیبی سازگار است، بهره میگیرد و ویژگیهای مؤثر در فرایند پردازش را در طول زمان و وابسته به جریان ورودی دادهها به صورت پویا تغییر میدهد. نتایج آزمایشها در مجموعه دادهای مشتمل بر دو نوع باتنت شناختهشده، بیانگر آن است که رویکرد پیشنهادی از یک سو با کاهش تعداد ویژگیها و حذف ویژگیهای نامناسب موجب افزایش سرعت پردازشهای ترکیبی و کاهش زمان تشخیص باتنت میگردد و از سویی دیگر با انتخاب مدلهای مناسب جهت تجمیع نتایج، دقت پردازش را افزایش میدهد. تفاصيل المقالة -
حرية الوصول المقاله
22 - انتخاب ویژگی چندبرچسبه با استفاده از راهکار ترکیبی مبتنی بر الگوریتم بهینهسازی ازدحام ذرات
آذر رفیعی پرهام مرادی عبدالباقی قادرزادهطبقهبندی چندبرچسبی یکی از مسائل مهم در یادگیری ماشین است که کارایی الگوریتمهای این طبقهبندی با افزایش ابعاد مسأله به شدت کاهش مییابد. انتخاب ویژگی، یکی از راهکارهای اصلی برای کاهش ابعاد در مسائل چندبرچسبی است. انتخاب ویژگی چندبرچسبی یک راهکار NP Hard است و تا کنون أکثرطبقهبندی چندبرچسبی یکی از مسائل مهم در یادگیری ماشین است که کارایی الگوریتمهای این طبقهبندی با افزایش ابعاد مسأله به شدت کاهش مییابد. انتخاب ویژگی، یکی از راهکارهای اصلی برای کاهش ابعاد در مسائل چندبرچسبی است. انتخاب ویژگی چندبرچسبی یک راهکار NP Hard است و تا کنون تعدادی راهکار مبتنی بر هوش جمعی و الگوریتمهای تکاملی برای آن ارائه شده است. افزایش ابعاد مسأله منجر به افزایش فضای جستجو و به تبع، کاهش کارایی و همچنین کاهش سرعت همگرایی این الگوریتمها میشود. در این مقاله یک راهکار هوش جمعی ترکیبی مبتنی الگوریتم دودویی بهینهسازی ازدحام ذرات و استراتژی جستجوی محلی برای انتخاب ویژگی چندبرچسبی ارائه شده است. برای افزایش سرعت همگرایی، در استراتژی جستجوی محلی، ویژگیها بر اساس میزان افزونهبودن و میزان ارتباط با خروجی مسأله به دو دسته تقسیمبندی میشوند. دسته اول را ویژگیهایی تشکیل میدهند که شباهت زیادی به کلاس مسأله و شباهت کمتری به سایر ویژگیها دارند و دسته دوم هم ویژگیهای افزونه و کمتر مرتبط است. بر این اساس، یک اپراتور محلی به الگوریتم بهینهسازی ازدحام ذرات اضافه شده که منجر به کاهش ویژگیهای غیر مرتبط و افزونه هر جواب میشود. اعمال این اپراتور منجر به افزایش سرعت همگرایی الگوریتم پیشنهادی در مقایسه با سایر الگوریتمهای ارائهشده در این زمینه میشود. عملکرد روش پیشنهادی با شناختهشدهترین روشهای انتخاب ویژگی، بر روی مجموعه دادههای مختلف مقایسه گردیده است. نتایج آزمایشها نشان دادند که روش پیشنهادی از نظر دقت، دارای عملکردی مناسب است. تفاصيل المقالة -
حرية الوصول المقاله
23 - Application of Machine Learning in the Telecommunications Industry: Partial Churn Prediction by using a Hybrid Feature Selection Approach
Fatemeh Mozaffari Iman Raeesi Vanani Payam Mahmoudian Babak SohrabiThe telecommunications industry is one of the most competitive industries in the world. Because of the high cost of customer acquisition and the adverse effects of customer churn on the company's performance, customer retention becomes an inseparable part of strategic d أکثرThe telecommunications industry is one of the most competitive industries in the world. Because of the high cost of customer acquisition and the adverse effects of customer churn on the company's performance, customer retention becomes an inseparable part of strategic decision-making and one of the main objectives of customer relationship management. Although customer churn prediction models are widely studied in various domains, several challenges remain in designing and implementing an effective model. This paper addresses the customer churn prediction problem with a practical approach. The experimental analysis was conducted on the customers' data gathered from available sources at a telecom company in Iran. First, partial churn was defined in a new way that exploits the status of customers based on criteria that can be measured easily in the telecommunications industry. This definition is also based on data mining techniques that can find the degree of similarity between assorted customers with active ones or churners. Moreover, a hybrid feature selection approach was proposed in which various feature selection methods, along with the crowd's wisdom, were applied. It was found that the wisdom of the crowd can be used as a useful feature selection method. Finally, a predictive model was developed using advanced machine learning algorithms such as bagging, boosting, stacking, and deep learning. The partial customer churn was predicted with more than 88% accuracy by the Gradient Boosting Machine algorithm by using 5-fold cross-validation. Comparative results indicate that the proposed model performs efficiently compared to the ones applied in the previous studies. تفاصيل المقالة -
حرية الوصول المقاله
24 - بهبود تشخیص وبگاه های جعل شده با استفاده از طبقه بندی کننده شبکه عصبی مصنوعی چند لایه با الگوریتم بهینه سازی شیرمورچه
فرهنگ پدیداران مقدم مهشید صادقی باجگیراندر حملات فیشینگ یک وبگاه جعلي از روي وبگاه اصلي جعل ميگردد که ظاهر بسیار شبیه به وبگاه اصلي دارد. فیشر یا سارق آنلاین براي هدایت کاربران به این وبگاهها، معمولا لینکهاي جعلي را در ایمیل قرار داده و براي قربانیان خود ارسال نموده و با روشهاي مهندسي اجتماعي سعي در فریب کارب أکثردر حملات فیشینگ یک وبگاه جعلي از روي وبگاه اصلي جعل ميگردد که ظاهر بسیار شبیه به وبگاه اصلي دارد. فیشر یا سارق آنلاین براي هدایت کاربران به این وبگاهها، معمولا لینکهاي جعلي را در ایمیل قرار داده و براي قربانیان خود ارسال نموده و با روشهاي مهندسي اجتماعي سعي در فریب کاربران و مجاب نمودن آنها براي کلیک روي لینکهاي جعلي دارد. حملات فیشینگ زیان مالي قابل توجهاي دارند و بیشتر روي بانکها و درگاههاي مالي متمرکز هستند. روشهاي یادگیري ماشین یک روش موثر براي تشخیص حملات فیشینگ است اما این مشروط به انتخاب بهینه ویژگي است. انتخاب ویژگي باعث ميشود فقط ویژگيهاي مهم به عنوان ورودي یادگیري در نظر گرفته شوند و خطاي تشخیص حملات فیشینگ کاهش داده شود. در روش پیشنهادي براي کاهش دادن خطاي تشخیص حملات فیشینگ یک طبقهبندي کننده شبکه عصبي مصنوعي چند لایه استفاده شده که فاز انتخاب ویژگي آن با الگوریتم بهینهسازي شیرمورچه انجام ميشود. ارزیابي و آزمایشها روي مجموعه داده Rami که مرتبط با فیشینگ است نشان ميدهد روش پیشنهادي داراي دقتي در حدود 98.53 % است و نسبت به شبکه عصبي مصنوعي چند لایه خطاي کمتري دارد. روش پیشنهادي در تشخیص حملات فیشینگ از روشهاي یادگیري BPNN ، SVM ، NB ، C4.5 ، RF و kNN با سازوکار انتخاب ویژگي توسط الگوریتم PSO دقت بیشتري دارد. تفاصيل المقالة