• فهرس المقالات Feature Selection

      • حرية الوصول المقاله

        1 - تعیین ماشین‌های بردار پشتیبان بهینه در طبقه‌بندی تصاویر فرا طیفی بر مبنای الگوریتم ژنتیک
        فرهاد صمدزادگان حديثه سادات  حسني
        امروزه تصاویر فرا طیفی به علت غنای اطلاعات طیفی یک ابزار قوی و کارامد در سنجش از دور به حساب می‌آیند و امکان تمایز بین عوارض مشابه را فراهم می‌آورند. با توجه به پایداری ماشین‌های بردار پشتیبان در فضاهایی با ابعاد بالا، یک گزینه مناسب در طبقه‌بندی تصاویر فرا طیفی محسوب م أکثر
        امروزه تصاویر فرا طیفی به علت غنای اطلاعات طیفی یک ابزار قوی و کارامد در سنجش از دور به حساب می‌آیند و امکان تمایز بین عوارض مشابه را فراهم می‌آورند. با توجه به پایداری ماشین‌های بردار پشتیبان در فضاهایی با ابعاد بالا، یک گزینه مناسب در طبقه‌بندی تصاویر فرا طیفی محسوب می‌شوند. با این وجود، عملکرد این طبقه‌بندی کننده‌ها تحت تأثیر پارامترها و فضای ویژگی ورودی آن‌ها می‌باشد. به منظور استفاده از ماشین‌های بردار پشتیبان با بیشترین کارایی، می‌بایست مقادیر بهینه‌ی پارامترها و همچنین زیر مجموعه بهینه از ویژگی‌های ورودی تعیین گردند. در این تحقیق از توانایی الگوریتم ژنتیک به عنوان یک تکنیک بهینه‌سازی فرا ابتکاری، در تعیین مقادیر بهینه پارامترهای ماشین‌های بردار پشتیبان و همچنین انتخاب زیرمجموعه ویژگی‌های بهینه در طبقه‌بندی تصاویر فرا طیفی استفاده شده است. نتایج عملی از به‌کارگیری روش فوق در خصوص داده‌های فرا طیفی سنجنده AVIRISنشان می‌دهند، ویژگی‌های ورودی و پارامترها هر کدام جداگانه تأثیر بسزایی بر عملکرد ماشین‌های بردار پشتیبان دارند ولی بهترین عملکرد طبقه-بندی کننده با حل همزمان آن دو بدست می‌آید. در حل همزمان تعیین پارامتر و انتخاب ویژگی، برای کرنل گوسین و پلی‌نومیال به ترتیب 5% و 15% افزایش دقت با حذف بیش از نیمی از باندهای تصویر حاصل شد. همچنین الگوریتم بهینه‌سازی شبیه‌سازی تبرید تدریجی به منظور مقایسه با الگوریتم ژنتیک پیاده‌سازی شد که نتایج حاکی از برتری الگوریتم ژنتیک به ویژه با بزرگ و پیچیده شدن فضای جستجو در رویکرد حل همزمان تعیین پارامتر و انتخاب ویژگی می‌باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        2 - بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری ایران با رویکرد داده کاوی
        مهرناز مطهری نیا
        امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی بر أکثر
        امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی برای سازمان‌ها امکان‌پذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری می‌باشد. به این منظور داده‌های تراکنش‌های پایانه‌های فروش کلیه بانک‌های ایران از یک شرکت ارائه‌دهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفته‌است. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانه‌های فروش در هر ماه از نظر رویگردانی و وفاداری بخش‌بندی شده‌اند سپس با استفاده از روش‌ انتخاب ویژگی افزودن L، حذف  R و الگوریتم رگرسیون خطی چند متغیره ویژگی‌های موثر بر درصد مشتریان رویگردان از بین شاخص‌های اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شده‌اند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخص‌های اقتصادی مورد بررسی هستند.امروزه شناخت مشتری و درک نیازهای آن به یک ضرورت تجاری تبدیل شده‌است. سازمان‌ها برای پایداری در کسب و کارهایشان و موفقیت در بازار رقابتی نیازمند رضایت مشتریان می‌باشند. شناخت مشتریان از طریق تحلیل رفتار مشتریان با استفاده از تکنولوژی‌های جدید مانند تکنیک‌های داده‌کاوی برای سازمان‌ها امکان‌پذیر است. هدف از این پژوهش بررسی بررسی تاثیر متغیرهای کلان اقتصادی بر رویگردانی مشتریان صنعت بانکداری می‌باشد. به این منظور داده‌های تراکنش‌های پایانه‌های فروش کلیه بانک‌های ایران از یک شرکت ارائه‌دهنده خدمات پرداخت(PSP) مورد تحلیل قرار گرفته‌است. در مدل ارائه شده با استفاده از روش WRFM و ترکیب آن با الگوریتم خوشه بندی K-Means پایانه‌های فروش در هر ماه از نظر رویگردانی و وفاداری بخش‌بندی شده‌اند سپس با استفاده از روش‌ انتخاب ویژگی افزودن L، حذف  R و الگوریتم رگرسیون خطی چند متغیره ویژگی‌های موثر بر درصد مشتریان رویگردان از بین شاخص‌های اقتصادی ماهانه منتشر شده از بانک مرکزی ایران، در هر ماه انتخاب شده‌اند. براساس نتایج حاصل از اجرای مدل سه متغیر شاخص ارزش سهام بورس، تورم و متوسط قیمت فروش سکه تمام بهارآزادی موثرترین متغیرها از بین شاخص‌های اقتصادی مورد بررسی هستند. تفاصيل المقالة
      • حرية الوصول المقاله

        3 - بهبود روش شناسایی وب سایت فیشینگ با استفاده از داده‌کاوی روی صفحات وب
        مهدیه بهارلو علیرضا یاری
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داد أکثر
        فیشینگ یک نوع حمله اینترنتی در سطح وب است که هدف آن سرقت مشخصات فردی کاربران برای دزدی آنلاین است. فیشینگ دارای اثر منفی در از بین بردن اعتماد بین کاربران در کسب‌وکارهای الکترونیکی است؛ بنابراین در این تحقیق سعی بر بررسی روشهای تشخیص وب سایت‌های فیشینگ با استفاده از داده کاوی شده است. شناسایی ویژگی‌های برجسته از فیشینگ یکی از پیش‌شرط‌های مهم در طراحی یک سیستم تشخیصی دقیق است؛ لذا در گام اول، برای شناسایی ویژگی‌های نفوذ فیشینگ یک لیست با 30 ویژگی مطرح در وب‌سایت‌های فیشینگ آماده گردید. سپس برای افزایش کارایی سامانه‌های تشخیص فیشینگ روش جدیدی جهت کاهش ویژگی ها در دومرحله‌ مبتنی بر انتخاب ویژگی و استخراج ویژگی پیشنهاد شده است که موجب می شود تعداد ویژگی‌ها به‌طور قابل‌توجهی کاهش یابند. پس‌ازآن عملکرد روش‌های درخت تصمیم J48، جنگل تصادفی و بیزین ساده بر روی ویژگی‌های کاهش‌یافته موردبررسی قرار گرفت. نتایج نشان می‌دهند دقت مدل ایجاد شده برای تعیین وب سایت‌های فیشینگ با استفاده از کاهش ویژگی دومرحله‌ای مبتنی بر پوششی و الگوریتم تحلیل مؤلفه اصلی (PCA) در روش جنگل تصادفی ۹۶٫۵۸% می‌باشد که نسبت به سایر روش‌ها نتیجه مطلوبی است. تفاصيل المقالة
      • حرية الوصول المقاله

        4 - Handwritten Digits Recognition Using an Ensemble Technique Based on the Firefly Algorithm
        Azar Mahmoodzadeh Hamed Agahi Marzieh  Salehi
        This paper develops a multi-step procedure for classifying Farsi handwritten digits using a combination of classifiers. Generally, the technique relies on extracting a set of characteristics from handwritten samples, training multiple classifiers to learn to discriminat أکثر
        This paper develops a multi-step procedure for classifying Farsi handwritten digits using a combination of classifiers. Generally, the technique relies on extracting a set of characteristics from handwritten samples, training multiple classifiers to learn to discriminate between digits, and finally combining the classifiers to enhance the overall system performance. First, a pre-processing course is performed to prepare the images for the main steps. Then three structural and statistical characteristics are extracted which include several features, among which a multi-objective genetic algorithm selects those more effective ones in order to reduce the computational complexity of the classification step. For the base classification, a decision tree (DT), an artificial neural networks (ANN) and a k-nearest neighbor (KNN) models are employed. Finally, the outcomes of the classifiers are fed into a classifier ensemble system to make the final decision. This hybrid system assigns different weights for each class selected by each classifier. These voting weights are adjusted by a metaheuristic firefly algorithm which optimizes the accuracy of the overall system. The performance of the implemented approach on the standard HODA dataset is compared with the base classifiers and some state-of-the-art methods. Evaluation of the proposed technique demonstrates that the proposed hybrid system attains high performance indices including accuracy of 98.88% with only eleven features. تفاصيل المقالة
      • حرية الوصول المقاله

        5 - Graph Based Feature Selection Using Symmetrical Uncertainty in Microarray Dataset
        Soodeh Bakhshandeh رضا عزمی Mohammad Teshnehlab
        Microarray data with small samples and thousands of genes makes a difficult challenge for researches. Using gene selection in microarray data helps to select the most relevant genes from original dataset with the purpose of reducing the dimensionality of the microarray أکثر
        Microarray data with small samples and thousands of genes makes a difficult challenge for researches. Using gene selection in microarray data helps to select the most relevant genes from original dataset with the purpose of reducing the dimensionality of the microarray data as well as increasing the prediction performance. In this paper, a new gene selection method is proposed based on community detection technique and ranking the best genes. Symmetric Uncertainty is used for selection of the best genes by calculation of similarity between two genes and between each gene and class label which leads to representation of search space as a graph, in the first step. Afterwards, the proposed graph is divided into several clusters using community detection algorithm and finally, after ranking the genes, the genes with maximum ranks are selected as the best genes. This approach is a supervised/unsupervised filter-based gene selection method that minimizes the redundancy between genes and maximizes the relevance of genes and class label. Performance of the proposed method is compared with thirteen well-known unsupervised/supervised gene selection approaches over six microarray datasets using four classifiers including SVM, DT, NB and k-NN. Results show the advantages of the proposed approach. تفاصيل المقالة
      • حرية الوصول المقاله

        6 - An Effective Method of Feature Selection in Persian Text for Improving the Accuracy of Detecting Request in Persian Messages on Telegram
        zahra khalifeh zadeh Mohammad Ali Zare Chahooki
        In recent years, data received from social media has increased exponentially. They have become valuable sources of information for many analysts and businesses to expand their business. Automatic document classification is an essential step in extracting knowledge from أکثر
        In recent years, data received from social media has increased exponentially. They have become valuable sources of information for many analysts and businesses to expand their business. Automatic document classification is an essential step in extracting knowledge from these sources of information. In automatic text classification, words are assessed as a set of features. Selecting useful features from each text reduces the size of the feature vector and improves classification performance. Many algorithms have been applied for the automatic classification of text. Although all the methods proposed for other languages are applicable and comparable, studies on classification and feature selection in the Persian text have not been sufficiently carried out. The present research is conducted in Persian, and the introduction of a Persian dataset is a part of its innovation. In the present article, an innovative approach is presented to improve the performance of Persian text classification. The authors extracted 85,000 Persian messages from the Idekav-system, which is a Telegram search engine. The new idea presented in this paper to process and classify this textual data is on the basis of the feature vector expansion by adding some selective features using the most extensively used feature selection methods based on Local and Global filters. The new feature vector is then filtered by applying the secondary feature selection. The secondary feature selection phase selects more appropriate features among those added from the first step to enhance the effect of applying wrapper methods on classification performance. In the third step, the combined filter-based methods and the combination of the results of different learning algorithms have been used to achieve higher accuracy. At the end of the three selection stages, a method was proposed that increased accuracy up to 0.945 and reduced training time and calculations in the Persian dataset. تفاصيل المقالة
      • حرية الوصول المقاله

        7 - انتخاب ويژگي براي شناسايي نويسنده در متون کوتاه برخط فارسي
        سمیه عارفی محمد احسان بصیری امید روزمند
        رشد فزاينده‏ي استفاده از رسانه‌هاي اجتماعي و ارتباطات برخط به‌منظور بيان نظرات، تبادل عقايد و همچنين گسترش استفاده‏ي کاربران فارسي زبان از اين ابزارها باعث افزايش متون فارسي در وب شده است. اين رشد چشمگير در کنار سوءاستفاده‏هاي ناشي از ناشناس بودن نويسنده‏ي نوشته‏ها نياز أکثر
        رشد فزاينده‏ي استفاده از رسانه‌هاي اجتماعي و ارتباطات برخط به‌منظور بيان نظرات، تبادل عقايد و همچنين گسترش استفاده‏ي کاربران فارسي زبان از اين ابزارها باعث افزايش متون فارسي در وب شده است. اين رشد چشمگير در کنار سوءاستفاده‏هاي ناشي از ناشناس بودن نويسنده‏ي نوشته‏ها نياز به سامانه‏ي خودکار شناسايي نويسنده در اين زبان را بيش از پيش آشکار مي‌سازد. هدف از اين پژوهش، بررسي ويژگي‌هاي مؤثر در شناسايي نويسندگان نظرات فارسي توليد شده توسط خريداران گوشي و همچنین ارزیابی روش‌های نظارتی و غیرنظارتی می‌باشد. عواملي که در اين پژوهش بررسي مي‏شود شامل ويژگي‌هاي لغوي، نگارشی، معنايي، ساختاري، دستوري، مختص متن و مختص شبکه‌هاي اجتماعي است. پس از استخراج ويژگي‌هاي مذکور، انتخاب ويژگي‌هاي برتر توسط چهار الگوريتم همبستگي ويژگي، نسبت بهره، OneR و تحليل اجزاي اصلي آزمايش مي‏شود. در ادامه از الگوريتم‏هاي K-means، EM و خوشه‏بندي مبتني بر چگالي براي خوشه‌بندي و الگوريتم‏هاي شبکه‏ي بيز، جنگل تصادفي و Bagging براي دسته‏بندي استفاده خواهد شد. ارزيابي الگوريتم‌هاي فوق بر روي نظرات فارسي مربوط به خريداران گوشي‌هاي سامسونگ نشان مي‏دهد که بهترين تشخيص در بين الگوريتم‏هاي خوشه‏بندي با دقت 16/59% مربوط به الگوريتم EM روي 15 ويژگي‌ برتر انتخابي توسطOneR است درحالي‌که الگوريتم جنگل تصادفي به‌همراه نسبت بهره برای 90 ویژگی با دقت 57/79% بهترين کارايي را در بين الگوريتم‏هاي دسته‏بندي دارد. همچنين مقايسه‌ی ويژگي‌ها نشان داد که ويژگي‌هاي نگارشی بيشترين تأثير را در شناسايي نويسنده‏ي متون کوتاه داشته و پس از آن‌ به‌ترتيب ويژگي‌هاي لغوي ، مختص متن، مختص شبکه‌های اجتماعی، ساختاري، دستوري و معنایی قرار گرفتند. تفاصيل المقالة
      • حرية الوصول المقاله

        8 - تحلیل یادگیری دانش آموزان از طریق ورزش صبحگاهی با استفاده از روش های داده کاوی
        بهزاد لک نرگس عباسی
        یکی از عوامل اصلی فرایند جامعه پذیری، مدرسه است که اهمیت آن در نظام آموزشی هر کشوری بیش از پیش احساس می شود. ارتقاء سطح یادگیری دانش آموزان، یک عامل مهم برای ارتقای کیفیت نظام آموزش در مدارس، می باشد. از آنجایی که ورزش کردن ثاثیر بسزایی در یادگیری دارد، هدف اصلی مقاله ا أکثر
        یکی از عوامل اصلی فرایند جامعه پذیری، مدرسه است که اهمیت آن در نظام آموزشی هر کشوری بیش از پیش احساس می شود. ارتقاء سطح یادگیری دانش آموزان، یک عامل مهم برای ارتقای کیفیت نظام آموزش در مدارس، می باشد. از آنجایی که ورزش کردن ثاثیر بسزایی در یادگیری دارد، هدف اصلی مقاله ارائه روشی جهت تقویت روند یادگیری دانش آموزان از طریق ورزش صبحگاهی مبتنی بر تکنیک شبکه عصبی و الگوریتم بهینه سازی قطرات هوشمند آب است. رویکرد این پژوهش به صورت کمی بوده و از نظر هدف كاربردي و همچنین از نظر نوع روش، توصيفي- تحليلي است. جهت دستیابی به این هدف از تکنیک شبکه عصبی به منظور طبقه‌بندی و استخراج نتایج و از الگوریتم بهینه سازی قطرات هوشمند آب جهت انتخاب ویژگی استفاده می شود. برای شبکه عصبی از 11 نورون به عنوان تعداد نورون مناسب لایه مخفی و ترکیب دو تابع فعال سازي خطي و سيگموئيدي به عنوان توابع انتقال بین لایه‌ای و از یک تابع آموزش جهت آموزش شبکه و حداکثر تکرار الگوریتم آموزش بر روی مجموعه داده 3000 تعداد، پیشنهاد شده است. دقت روش پیشنهادی 68 درصد است که به نسبت روش پایه حدود 2/2 درصد بهبود داشته و این یعنی ورزش برروی یادگیری دانش‌آموزان تاثیر دارد. نتایج نشان داد طبقه بندی بهینه روی مجموعه داده با پارامترهای همگن، عملکرد مناسبی داشته و همچنین شبکه‌های عصبی مصنوعی نسبت به روش های جدید ، عملکرد بهتری دارد. طبق نتایج به دست آمده روش پیشنهادی از نظر صحت خروجی می تواند بهبود مناسبی در تقویت روند یادگیری داشته باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        9 - رویکرد شورای انتخاب ویژگی بر اساس خوشه‌بندی سلسله‌مراتبی برای حل مشکل داده‌های زايد در بینی الکترونیکی
        محمدعلی باقری غلامعلی منتظر
        وجود داده‌هاي زايد در پاسخ حس‌گرهای بيني الكترونيكي اثر چشم‌گیری در دسته‌بندی بو دارد. برای بهبود صحت دسته‌بندی، می‌توان از سیستم دسته‌بندی چندگانه بر اساس انتخاب چند زیرمجموعه از ویژگی‌ها (به‌جای استفاده از تمام ابعاد بردار ویژگی) استفاده کرد. در این رویکرد که "شورای ا أکثر
        وجود داده‌هاي زايد در پاسخ حس‌گرهای بيني الكترونيكي اثر چشم‌گیری در دسته‌بندی بو دارد. برای بهبود صحت دسته‌بندی، می‌توان از سیستم دسته‌بندی چندگانه بر اساس انتخاب چند زیرمجموعه از ویژگی‌ها (به‌جای استفاده از تمام ابعاد بردار ویژگی) استفاده کرد. در این رویکرد که "شورای انتخاب ویژگی" نامیده‌ می‌شود، فرض بر آن است که مجموعه اولیه ویژگی‌ها دارای داده‌هایی زايد بوده و می‌توان با انتخاب زیرمجموعه‌های ویژگی مختلف و سپس ترکیب دسته‌بندهای ایجادشده با این زیرمجموعه‌ها به نتایج دسته‌بندی بهتری رسید. در این مقاله پس از پیش‌پردازش سیگنال اولیه حس‌گرها و حذف نویز سیگنال با استفاده از تحلیل موجک، سیستم دسته‌بند چندگانه با زیرمجموعه‌های ویژگی‌ مختلف طراحی شده است: ویژگی‌های استخراج‌شده از سیگنال گذرای حس‌گر با روش خوشه‌بندی سلسله‌مراتبی طبقه‌بندی شده‌ و زیرمجموعه‌های مختلف با انتخاب یک ویژگی از هر خوشه ایجاد شده‌اند. این موضوع موجب بهبود تنوع دسته‌بندهای پایه و افزایش کارایی و سرعت دسته‌بندی می‌شود. روش پیشنهادی ابتدا در چند مجموعه داده تراز از مخزن داده UCI آزمون شده و پس از اثبات توانایی آن، در مجموعه داده بویایی حاصل از رایحه سه نوع شیرین‌بیان به کار برده شده است. نتایج حاصل نشان‌دهنده کارایی روش جدید در شناسایی الگوهای بویایی است. تفاصيل المقالة
      • حرية الوصول المقاله

        10 - ارائه‌ی یک روش هوشمند انتخاب ویژگی مبتنی بر الگوریتم جستجوی گرانشی باینری در سیستم بازشناسی ارقام دست‌نویس فارسی
        نجمه قنبری سیدمحمد رضوی سیدحسن نبوی کریزی
        در این مقاله یک روش هوشمند انتخاب ویژگی برای بازشناسی ارقام دست‌نویس فارسی ارائه شده است. در این روش تابع برازندگی مرتبط با خطای سیستم بازشناسی ارقام دست‌نویس فارسی با استفاده از الگوریتم جستجوی گرانشی باینری و با انتخاب ویژگی‌های مناسب کمینه می‌شود. نتایج پیاده‌سازی نش أکثر
        در این مقاله یک روش هوشمند انتخاب ویژگی برای بازشناسی ارقام دست‌نویس فارسی ارائه شده است. در این روش تابع برازندگی مرتبط با خطای سیستم بازشناسی ارقام دست‌نویس فارسی با استفاده از الگوریتم جستجوی گرانشی باینری و با انتخاب ویژگی‌های مناسب کمینه می‌شود. نتایج پیاده‌سازی نشان می‌دهند که استفاده از روش‌های هوشمند برای انتخاب ویژگی به‌خوبی قادر است که موثر‌ترین ویژگی‌ها برای سیستم بازشناسی را انتخاب کند. همچنین مقایسه نتایج روش پیشنهادی با سایر روش‌های مشابه مبتنی بر استفاده از الگوریتم ژنتیک و روش بهینه‌سازی گروه ذرات باینری نشان دهنده‌ی کارایی خوب این روش است. تفاصيل المقالة
      • حرية الوصول المقاله

        11 - طرحی جديد برای طبقه‌بندی خودکار اغتشاشات کيفيت توان بر اساس ابزار پردازش سیگنال و یادگیری ماشین
        مهدي حاجيان اصغر اکبری فرود
        تشخیص و دسته‌بندی اغتشاشات کیفیت توان یکی از وظایف مهم در حفاظت و نظارت سیستم‌های قدرت امروزی است. در حال حاضر اهمیت اصلی، بهبود روش‌های تشخيص و طبقه‌بندي خودکار شكل موج‌ها به کمک يك الگوريتم مؤثر مي‌باشد. در این مقاله روشی مؤثر برای استخراج ویژگی بر اساس ترکیب تبدیل S أکثر
        تشخیص و دسته‌بندی اغتشاشات کیفیت توان یکی از وظایف مهم در حفاظت و نظارت سیستم‌های قدرت امروزی است. در حال حاضر اهمیت اصلی، بهبود روش‌های تشخيص و طبقه‌بندي خودکار شكل موج‌ها به کمک يك الگوريتم مؤثر مي‌باشد. در این مقاله روشی مؤثر برای استخراج ویژگی بر اساس ترکیب تبدیل S هذلولی و موجک ارائه شده است. انتخاب و كاهش ويژگي، موجب كاهش زمان آموزش مي‌گردد و در بیشتر موارد افزايش ميزان دقت در طبقه‌بندي داده‌ها را به همراه دارد. در این مقاله، روشی جديد به نام گرام- اشمیت براي انتخاب ويژگي به کار گرفته شده و همچنین از ساختار طبقه‌بندی کننده مشهور ماشین بردار پشتیبان چندکلاسه استفاده شده است. همچنین پارامتر‌های متغیر این طبقه‌بندی کننده با استفاده از الگوریتم ابتکاری بهينه‌سازي گروهي ذرات، بهینه شده است. 6 اغتشاش منفرد و 2 اغتشاش ترکیبی و همچنین حالت نرمال برای طبقه‌بندی در نظر گرفته شده‌اند. حساسیت روش پیشنهادی تحت شرایط مختلف نویزی با سطوح مختلف سیگنال همراه با نویز بررسی شده است. همچنین با مقایسه نتایج این مقاله با نتایج مقالات دیگر، کارامدی روش پیشنهادی مورد بررسی قرار گرفته است. تفاصيل المقالة
      • حرية الوصول المقاله

        12 - ارائه يک نسخه جديد از الگوريتم مورچگان باينری به منظور حل مسأله انتخاب ويژگی
        شيما کاشف حسین نظام‌آبادی‌پور
        استفاده از الگوریتم‌های ابتکاری یک انتخاب مناسب برای حل مسایل بهینه‌سازی است. در اين مقاله نسخه بهبوديافته‌اي از الگوريتم بهينه‌ساز مورچگان باينري براي حل مسأله انتخاب ويژگي ارائه شده است. نسخه پيشنهادي خصوصيات الگوريتم جمعيت مورچه گسسته و الگوريتم مورچه باينري را به صو أکثر
        استفاده از الگوریتم‌های ابتکاری یک انتخاب مناسب برای حل مسایل بهینه‌سازی است. در اين مقاله نسخه بهبوديافته‌اي از الگوريتم بهينه‌ساز مورچگان باينري براي حل مسأله انتخاب ويژگي ارائه شده است. نسخه پيشنهادي خصوصيات الگوريتم جمعيت مورچه گسسته و الگوريتم مورچه باينري را به صورت توأمان در خود دارد. کارايي روش پيشنهادي روي 12 پايگاه داده استاندارد در موضوع طبقه‌بندي بررسي و نتايج با چند الگوريتم مطرح در اين زمينه شامل بهينه‌ساز جمعيت مورچگان گسسته و باينري مقايسه شده است. نتايج بيانگر کارايي مناسب الگوريتم پيشنهادي است. تفاصيل المقالة
      • حرية الوصول المقاله

        13 - یک روش انتخاب ویژگی ترکیبی برای داده‌های با بعد بالا مبتنی بر خرد جمعی
        امیررضا روحی حسین نظام‌آبادی‌پور
        امروزه با ظهور و گسترش داده‌های بعد بالا، روند انتخاب ویژگی نقش بسیار مهمی را در زمینه یادگیری ماشینی و به خصوص مسایل طبقه‌بندی داده، بازی مي‌کند. کار بر روی داده‌های با بعد بالا از جمله داده‌های میکروآرایه‌ای با مشکلاتی همچون وجود ویژگی‌های نامرتبط و افزونه بسیار روبه‌ أکثر
        امروزه با ظهور و گسترش داده‌های بعد بالا، روند انتخاب ویژگی نقش بسیار مهمی را در زمینه یادگیری ماشینی و به خصوص مسایل طبقه‌بندی داده، بازی مي‌کند. کار بر روی داده‌های با بعد بالا از جمله داده‌های میکروآرایه‌ای با مشکلاتی همچون وجود ویژگی‌های نامرتبط و افزونه بسیار روبه‌رو است که باعث کاهش نرخ صحت طبقه‌بند، افزایش هزینه محاسباتی و معضل "نفرین بعد" می‌شود. در این مقاله به ارائه یک روش ترکیبی با استفاده از رویکردهای خرد جمعی برای انتخاب ویژگی در داده‌های با بعد بالا پرداخته می‌شود. در روش پیشنهادی، ابتدا در مرحله اول از یک روش فیلتری برای کاهش بعد داده استفاده می‌شود، سپس در مرحله دوم، دو الگوریتم روزآمد پیچشی با استفاده از رویکرد خرد جمعی بر روی ویژگی‌های کاهش‌یافته اعمال شده و نتیجه تجمیع می‌گردد. روش پیشنهادی بر روی 8 پایگاه داده میکروآرایه‌ای مورد ارزیابی قرار گرفته و مقایسه نتایج با چندین روش روزآمد و شناخته‌شده در حوزه انتخاب ویژگی، کارایی روش پیشنهادی را تأیید می‌کند. تفاصيل المقالة
      • حرية الوصول المقاله

        14 - کاهش ابعاد روش پنهان‌شکنی CDF با استفاده از یک روش انتخاب ویژگی مبتنی بر تئوری گراف
        سعید آزادی‌فر سیدحسین خواسته محمدهادی ادریسی
        پنهان‌شکنی دانش کشف حضور داده پنهان در یک رسانه پوششی است. هدف پنهان‌شکنی جلوگیری از رسیدن روش‌های پنهان‌نگاری به اهداف خود می‌باشد. یکی از معروف‌ترین روش‌های پنهان‌شکنی روش CDF است که در این پژوهش استفاده شده است. یکی از چالش‌های عمده در مسئله پنهان‌شکنی تصاویر تعداد أکثر
        پنهان‌شکنی دانش کشف حضور داده پنهان در یک رسانه پوششی است. هدف پنهان‌شکنی جلوگیری از رسیدن روش‌های پنهان‌نگاری به اهداف خود می‌باشد. یکی از معروف‌ترین روش‌های پنهان‌شکنی روش CDF است که در این پژوهش استفاده شده است. یکی از چالش‌های عمده در مسئله پنهان‌شکنی تصاویر تعداد زیاد ویژگی‌های استخراج‌شده برای این کار است. مجموعه‌های داده‌ای با ابعاد بالا از دو جهت باعث کاهش عملکرد پنهان‌شکنی می‌شود. از یک طرف با افزایش ابعاد داده‌‌ها، حجم محاسبات افزایش پیدا می‌کند و از طرف دیگر مدلی که بر اساس داده‌های با ابعاد بالا ساخته می‌شود دارای قابلیت تعمیم پایینی است و احتمال بیش‌برازش افزایش می‌یابد. در نتیجه، کاهش ابعاد مسئله می‌تواند هم پیچیدگی محاسباتی را کاهش داده و هم باعث بهبود عملکرد پنهان‌شکنی شود. در این مقاله تلاش شده با ترکیب مفهوم زیرگراف کامل بیشینه وزن‌دار و معیار مرکزیت یال و در نظر گرفتن مناسب‌بودن هر ویژگی، ویژگی‌های تأثیرگذار و دارای حداقل افزونگی به‌عنوان ویژگی‌های نهایی انتخاب ‌شوند. نتایج شبیه‌سازی بر روی مجموعه داده‌های SPAM و CC-PEV نشان داد روش پیشنهادی دارای عملکرد مناسبی است و به دقت حدود 96% در تشخیص جاسازی داده در تصاویر دست پیدا کرده و همچنین این روش در مقایسه با روش‌های شناخته‌شده قبلی دارای دقت بالاتری است. تفاصيل المقالة
      • حرية الوصول المقاله

        15 - کاهش ابعاد ویژگی مبتنی بر تئوری راف با استفاده از الگوریتم رقابت لیگ فوتبال
        مجید عبدالرزاق نژاد علی ادیبیان
        افزایش حجم پایگاه داده‌ها، مسئله کاهش ویژگی را ایجاد و پراهمیت می‌سازد. از این رو در علم داده‌کاوی، یکی از زیربخش‌های مهم، مسئله کاهش ابعاد (انتخاب ویژگی) می‌باشد که در آن زیرمجموعه‌ای از ویژگی‌هایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب می‌شوند أکثر
        افزایش حجم پایگاه داده‌ها، مسئله کاهش ویژگی را ایجاد و پراهمیت می‌سازد. از این رو در علم داده‌کاوی، یکی از زیربخش‌های مهم، مسئله کاهش ابعاد (انتخاب ویژگی) می‌باشد که در آن زیرمجموعه‌ای از ویژگی‌هایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب می‌شوند. در سال‌های اخیر، تئوری مجموعه راف به عنوان یکی از ابزارهای موثر و کارآمد در کاهش ویژگی مورد توجه محققان قرار گرفته است. در این مقاله الگوریتم رقابت لیگ فوتبال برای اولین بار به منظور حل این مسئله مورد استفاده قرار گرفته شده است. توانایی فرار از بهین‌های موضعی، امکان بهره‌گیری از اطلاعات بازیکنان توزیع‌شده در فضای جستجو، همگرایی سریع به جواب‌های بهین و پارامترهای کم این الگوریتم، انگیزه این انتخاب بود. علاوه بر این نوآوری، ارائه تغییراتی همچون بهره‌گیری از مجموع توان بازیکنان ثابت و ذخیره در محاسبه توان هر تیم، در نظر گرفتن ترکیب ساختارهای پیوسته و گسسته برای هر بازیکن، ارائه یک مکانیزم ابتکاری گسسته‌سازی جدید، ارائه تحلیل هیدرولیک متناسب با مسئله تحقیق برای فرایند برازش هر بازیکن، ارائه اصلاح در عملگرهای تقلید و تهییج بر اساس چالش‌های نسخه اصلی را می‌توان به عنوان ایده‌های پیشنهادی به منظور اصلاح و سازگاری این الگوریتم برای مسئله کاهش ویژگی برشمرد. ایده‌های پیشنهادشده بر روی سه سطح داده در ابعاد کوچک، متوسط و بزرگ به همراه چهار الگوریتم فراابتکاری مشهور ژنتیک و بهینه‌سازی ازدحام ذارت، سیستم ایمنی مصنوعی و لیگ قهرمانان پیاده‌سازی گردیده و مقایسه نتایج به دست آمده نشان از مزیت‌های رقابتی قابل توجه الگوریتم رقابت لیگ فوتبال با سایر الگوریتم‌ها دارد. تفاصيل المقالة
      • حرية الوصول المقاله

        16 - تشخیص كم‌توجهي- بيش‌فعالي (ADHD) مبتني ‌بر الگوريتم تكاملي با طول متغير
        مريم رمضانیان کشتلی حسین منتظری کردی
        روش‌هایی که امروزه برای بررسی ارتباطات مغز به منظور تشخیص بیماری‌های مرتبط با عملکرد مغز استفاده می‌شود، روش تصويرنگاري عملكردي تشديد مغناطيسي در حالت استراحت می‌باشد. در این مقاله، یک روش جدید با استفاده از الگوریتم تکاملی با طول متغیر برای انتخاب ویژگی‌های مناسب جهت ب أکثر
        روش‌هایی که امروزه برای بررسی ارتباطات مغز به منظور تشخیص بیماری‌های مرتبط با عملکرد مغز استفاده می‌شود، روش تصويرنگاري عملكردي تشديد مغناطيسي در حالت استراحت می‌باشد. در این مقاله، یک روش جدید با استفاده از الگوریتم تکاملی با طول متغیر برای انتخاب ویژگی‌های مناسب جهت بهبود دقت تشخيص افراد سالم و بيمار به اختلال كم‌توجهي- بيش‌فعالي از يكديگر مبتني ‌بر تحليل تصاوير rs-fMRI ارائه شده است. ویژگی‌های مورد بررسی مقادیر همبستگی میان سیگنال‌های سری زمانی مناطق مختلف مغز می‌باشند. انتخاب ویژگی با طول متغیر بر اساس الگوریتم زنبور عسل جهت غلبه بر مشکل انتخاب ویژگی در الگوریتم‌های با طول بردار ویژگی ثابت صورت گرفت. فاصله ماهالانوبیس به عنوان تابع ارزیابی الگوریتم رنبور عسل استفاده شده است. کارایی الگوریتم از لحاظ مقدار تابع ارزیابی در درجه اول و زمان پردازش در درجه دوم مورد بررسی قرار گرفته شد. نتایج به‌دست‌آمده از کارایی به مراتب بالاتر الگوریتم زنبور عسل با طول متغیر نسبت به سایر روش‌های انتخاب ویژگی حکایت دارد. در حالی که بهترین نتیجه صحت طبقه‌بندی کلی در میان سایر روش‌ها با 26 ویژگی منتخب از الگوریتم اجتماع ذرات، 61/76% می‌باشد، روش پیشنهادی توانسته به مقدار صحت طبقه‌بندی کلی 32/85% با انتخاب 25 ویژگی دست یابد. طبیعت داده به صورتی است که افزایش تعداد ویژگی‌ها منجر به بهبود بیشتر صحت طبقه‌بندی می‌شود به گونه‌ای که با افزایش طول بردار ویژگی به 35 و 45 صحت طبقه‌بندی به‌ترتیب به 66/91% و 57/95% رسیده است. تفاصيل المقالة
      • حرية الوصول المقاله

        17 - یک الگوریتم انتخاب ویژگی برخط در جریان داده‌ها با استفاده از اطلاعات متقابل چندمتغیره
        مریم رحمانی نیا پرهام مرادی
        امروزه در بسیاری از مسایل دنیای واقعی همچون شبکه‌های اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه داده‌های موجود اضافه می‌شود. از آنجا که کارایی بیشتر الگوریتم‌های داده‌کاوی با افزایش ابعاد داده‌ها کاهش می‌یابد، تحلیل این جریان داده‌ها در سال‌ها أکثر
        امروزه در بسیاری از مسایل دنیای واقعی همچون شبکه‌های اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه داده‌های موجود اضافه می‌شود. از آنجا که کارایی بیشتر الگوریتم‌های داده‌کاوی با افزایش ابعاد داده‌ها کاهش می‌یابد، تحلیل این جریان داده‌ها در سال‌های اخیر به یکی از مسایل مهم در داده‌کاوی تبدیل شده است. روش‌های انتخاب ویژگی در جریان داده‌های برخط، روش‌های کارآمدی هستند که با حذف ویژگی‌های افزونه و نامربوط باعث کاهش ابعاد کلان داده‌ها و در نتیجه بهبود کارایی الگوریتم‌ها می‌شوند. از چالش‌های اساسی در رابطه با الگوریتم‌های انتخاب ویژگی برخط، در دسترس نبودن همه داده‌ها قبل از شروع الگوریتم، مقیاس‌پذیری، دقت ویژگی‌های انتخاب‌شده و اندازه زیرمجموعه انتخابی را می‌توان نام برد. تا کنون الگوریتم‌های انتخاب ویژگی موجود تنها توانسته‌اند بخش محدودی از این چالش‌ها را به صورت هم‌زمان مرتفع کنند. به همین منظور در این مقاله یک راهکار انتخاب ویژگی برخط به نام MMIOSFS با استفاده از اطلاعات متقابل ارائه داده‌ایم که حد واسط بهتری را میان چالش‌های ذکرشده به دست می‌آورد. در روش پیشنهادی در ابتدا مجموعه ویژگی‌ها با استفاده از تکنیک متغیرهای تصادفی توأم به یک ویژگی نگاشت و سپس اطلاعات متقابل ویژگی جدید با برچسب به عنوان میزان ارتباط مجموعه ویژگی‌های اولیه در نظر گرفته می‌شود. کارایی روش پیشنهادی با چند الگوریتم انتخاب ویژگی برخط با استفاده از دسته‌بندهای مختلف مورد ارزیابی قرار گرفته و نتایج به دست آمده نشان می‌دهد الگوریتم پیشنهادی معمولاً حد واسط بهتری میان چالش‌ها به دست می‌آورد. تفاصيل المقالة
      • حرية الوصول المقاله

        18 - انتخاب ویژگی و طبقه‌بندی سلول‌های سرطانی بر پایه داده‌های ریزآرایه با استفاده از الگوریتم جستجوی فاخته چندهدفه
        خدیجه کمری فرزان رشیدی عبدالله خلیلی
        داده‌هاي ریزآرایه نقش مؤثری در طبقه‌بندی و تشخیص انواع بافت‌های سرطانی ایفا می‌کنند. با این حال در پژوهش‌های مرتبط با سرطان، تعداد نسبتاً کم نمونه‌ها در مقایسه با تعداد بسیار زیاد ژن‌ها‏، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقه‌بندها، افزایش هزینه‌های محاسباتی و پیچ أکثر
        داده‌هاي ریزآرایه نقش مؤثری در طبقه‌بندی و تشخیص انواع بافت‌های سرطانی ایفا می‌کنند. با این حال در پژوهش‌های مرتبط با سرطان، تعداد نسبتاً کم نمونه‌ها در مقایسه با تعداد بسیار زیاد ژن‌ها‏، باعث ایجاد مشکلاتی از قبیل کاهش کارایی طبقه‌بندها، افزایش هزینه‌های محاسباتی و پیچیدگی در طبقه‌بندی سلول‌های سرطانی خواهد شد. یک راهکار‏ مناسب جهت افزایش کارایی طبقه‌بندها، حذف ژن‌ها‏ی نامربوط و انتخاب نمونه‌های مناسب برای آموزش طبقه‌بندها است. در این مقاله یک مدل ترکیبی بر پایه الگوریتم بهینه‌سازی جستجوی فاخته چندهدفه و خوشه‌بندی فازی برای طبقه‌بندی داده‌های ریزآرایه پیشنهاد شده است. در اين مطالعه از نسخه دودویی الگوريتم جستجوی فاخته چندهدفه به منظور انتخاب ويژگي‌هاي مرتبط با بیماری و از نسخه پیوسته آن برای انتخاب تعداد نمونه‌های مناسب برای آموزش طبقه‌بندها استفاده شده است. به منظور تسریع در فرایند بهینه‌سازی و جلوگیری از گیرافتادن الگوریتم در بهینه‌های محلی، راهکار‏های ابتکاری جدیدی نیز به الگوریتم اضافه شده‌اند. برای بررسی عملکرد مدل پیشنهادی، شبیه‌سازی‌های متعددی بر روی شش مجموعه داده سرطانی انجام گرفته و نتایج آن با دیگر مقالات مقایسه شده است. نتایج به دست آمده نشان می‌دهند در بسیاری از موارد مدل پیشنهادی قادر است در مقایسه با سایر روش‌ها، با انتخاب مجموعه کوچک‌تری از ژن‌ها‏ی متمایز، منجر به افزایش کارایی طبقه‌بندها شود. تفاصيل المقالة
      • حرية الوصول المقاله

        19 - بازشناسی کارای کنش‌های انسانی با محدود کردن فضای جستجو در روش‌های یادگیری عمیق
        مریم کوهزادی هیکویی نصرالله مقدم چرکری
        کارایی سیستم‌های بازشناسی کنش‌های انسانی به استخراج بازنمایی مناسب از داده‌های ویدئویی وابسته است. در سال‌های اخیر روش‌های یادگیری عمیق به منظور استخراج بازنمایی فضایی- زمانی کارا از داده‌های ویدئویی ارائه شده‌ است، در حالی که روش‌های یادگیری عمیق در توسعه بعد زمان، پیچ أکثر
        کارایی سیستم‌های بازشناسی کنش‌های انسانی به استخراج بازنمایی مناسب از داده‌های ویدئویی وابسته است. در سال‌های اخیر روش‌های یادگیری عمیق به منظور استخراج بازنمایی فضایی- زمانی کارا از داده‌های ویدئویی ارائه شده‌ است، در حالی که روش‌های یادگیری عمیق در توسعه بعد زمان، پیچیدگی محاسباتی بالایی دارند. همچنین پراکندگی و محدودبودن داده‌های تمایزی و عوامل نویزی زیاد، مشکلات محاسباتی بازنمایی کنش‌ها را شدیدتر ساخته و قدرت تمایز را محدود می‌نماید. در این مقاله، شبکه‌های یادگیری عمیق فضایی و زمانی با افزودن سازوکارهای انتخاب ویژگی مناسب جهت مقابله با عوامل نویزی و کوچک‌سازی فضای جستجو، ارتقا یافته‌اند. در این راستا، سازوکارهای انتخاب ویژگی غیر برخط و برخط، برای بازشناسی کنش‌های انسانی با پیچیدگی محاسباتی کمتر و قدرت تمایز بالاتر مورد بررسی قرار گرفته است. نتایج نشان داد که سازوکار انتخاب ویژگی غیر برخط، منجر به کاهش پیچیدگی محاسباتی قابل ملاحظه می‌گردد و سازوکار انتخاب ویژگی برخط، ضمن کنترل پیچیدگی محاسباتی، منجر به افزایش قدرت تمایز می‌شود. تفاصيل المقالة
      • حرية الوصول المقاله

        20 - ارائه روش جهش هوشمند مبتنی بر الگوریتم PSO برای حل مسئله انتخاب ویژگی
        محمود پرنده مینا زلفی لیقوان جعفر  تنها
        امروزه با افزایش حجم تولید داده، توجه به الگوریتم‌های یادگیری ماشین جهت استخراج دانش از داده‌های خام افزایش یافته است. داده خام معمولاً دارای ویژگی‌های اضافی یا تکراری است که بر روی عملکرد الگوریتم‌های یادگیری تأثیر می‌گذارد. جهت افزایش کارایی و کاهش هزینه محاسباتی الگو أکثر
        امروزه با افزایش حجم تولید داده، توجه به الگوریتم‌های یادگیری ماشین جهت استخراج دانش از داده‌های خام افزایش یافته است. داده خام معمولاً دارای ویژگی‌های اضافی یا تکراری است که بر روی عملکرد الگوریتم‌های یادگیری تأثیر می‌گذارد. جهت افزایش کارایی و کاهش هزینه محاسباتی الگوریتم‌های یادگیری ماشین، از الگوریتم‌های انتخاب ویژگی استفاده می‌شود که روش‌های متنوعی برای انتخاب ویژگی ارائه شده است. از جمله روش‌های انتخاب ویژگی، الگوریتم‌های تکاملی هستند که به دلیل قدرت بهینه‌سازی سراسری خود مورد توجه قرار گرفته‌اند. الگوریتم‌های تکاملی بسیاری برای حل مسئله انتخاب ویژگی ارائه شده که بیشتر آنها روی فضای هدف تمرکز داشته‌اند. فضای مسئله نیز می‌تواند اطلاعات مهمی برای حل مسئله انتخاب ویژگی ارائه دهد. از آنجایی که الگوریتم‌های تکاملی از مشکل عدم خروج از نقطه بهینه محلی رنج می‌برند، ارائه یک مکانیزم مؤثر برای خروج از نقطه بهینه محلی ضروری است. در این مقاله از الگوریتم تکاملی PSO با تابع چندهدفه برای انتخاب ویژگی استفاده شده که در آن یک روش جدید جهش که از امتیاز ویژگی‌های ذرات استفاده می‌کند، به همراه نخبه‌گرایی برای خروج از نقاط بهینه محلی ارائه گردیده است. الگوریتم ارائه‌شده بر روی مجموعه داده‌های مختلف تست و با الگوریتم‌های موجود بررسی شده است. نتایج شبیه‌سازی‌ها نشان می‌دهند که روش پیشنهادی در مقایسه با روش جدید RFPSOFS بهبود خطای 20%، 11%، 85% و 7% به ترتیب در دیتاست‌های Isolet، Musk، Madelon و Arrhythmia دارد. تفاصيل المقالة
      • حرية الوصول المقاله

        21 - بهبود تشخيص ناهنجاري بات¬نت¬هاي حوزة اينترنت اشياء مبتنی بر انتخاب ویژگی پویا و پردازش¬های ترکیبی‌
        بشری پیشگو احمد اکبری ازیرانی
        پیچیده‌شدن کاربردهای دنیای واقعی خصوصاً در حوزه‌های اینترنت اشیا، ریسک‌های امنیتی متنوعی را برای این حوزه به همراه داشته است. بات‌نت‌های این حوزه به عنوان گونه‌ای از حملات امنیتی پیچیده شناخته می‌شوند که می‌توان از ابزارهای یادگیری ماشین، به منظور شناسایی و کشف آنها است أکثر
        پیچیده‌شدن کاربردهای دنیای واقعی خصوصاً در حوزه‌های اینترنت اشیا، ریسک‌های امنیتی متنوعی را برای این حوزه به همراه داشته است. بات‌نت‌های این حوزه به عنوان گونه‌ای از حملات امنیتی پیچیده شناخته می‌شوند که می‌توان از ابزارهای یادگیری ماشین، به منظور شناسایی و کشف آنها استفاده نمود. شناسایی حملات مذکور از یک سو نیازمند کشف الگوی رفتاری بات‌نت‌ها از طریق پردازش‌های دسته‌ای و با دقت بالا بوده و از سویی دیگر می‌بایست همانند پردازش‌های جریانی، به لحاظ عملیاتی بلادرنگ عمل نموده و وفق‌پذیر باشند. این مسئله، اهمیت بهره‌گیری از تکنیک‌های پردازش ترکیبی دسته‌ای و جریانی را با هدف تشخیص بات‌نت‌ها، بیش از پیش آشکار می‌سازد. از چالش‌های مهم این پردازش‌ها می‌توان به انتخاب ویژگی‌های مناسب و متنوع جهت ساخت مدل‌های پایه و نیز انتخاب هوشمندانه مدل‌های پایه جهت ترکیب و ارائه نتیجه نهایی اشاره نمود. در این مقاله به ارائه راهکاری مبتنی بر ترکیب روش‌های یادگیری جریانی و دسته‌ای با هدف تشخیص ناهنجاری بات‌نت‌ها می‌پردازیم. این راهکار از یک روش انتخاب ویژگی پویا که مبتنی بر الگوریتم ژنتیک بوده و به طور کامل با ماهیت پردازش‌های ترکیبی سازگار است، بهره می‌گیرد و ویژگی‌های مؤثر در فرایند پردازش را در طول زمان و وابسته به جریان ورودی داده‌ها به صورت پویا تغییر می‌دهد. نتایج آزمایش‌ها در مجموعه داده‌ای مشتمل بر دو نوع بات‌نت شناخته‌شده، بیانگر آن است که رویکرد پیشنهادی از یک سو با کاهش تعداد ویژگی‌ها و حذف ویژگی‌های نامناسب موجب افزایش سرعت پردازش‌های ترکیبی و کاهش زمان تشخیص بات‌نت می‌گردد و از سویی دیگر با انتخاب مدل‌های مناسب جهت تجمیع نتایج، دقت پردازش را افزایش می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        22 - انتخاب ویژگی چندبرچسبه با استفاده از راهکار ترکیبی مبتنی بر الگوریتم بهینه‌سازی ازدحام ذرات
        آذر رفیعی پرهام مرادی عبدالباقی قادرزاده
        طبقه‌بندی چندبرچسبی یکی از مسائل مهم در یادگیری ماشین است که کارایی الگوریتم‌های این طبقه‌بندی با افزایش ابعاد مسأله به شدت کاهش می‌یابد. انتخاب ویژگی، یکی از راهکارهای اصلی برای کاهش ابعاد در مسائل چندبرچسبی است. انتخاب ویژگی چندبرچسبی یک راهکار NP Hard است و تا کنون أکثر
        طبقه‌بندی چندبرچسبی یکی از مسائل مهم در یادگیری ماشین است که کارایی الگوریتم‌های این طبقه‌بندی با افزایش ابعاد مسأله به شدت کاهش می‌یابد. انتخاب ویژگی، یکی از راهکارهای اصلی برای کاهش ابعاد در مسائل چندبرچسبی است. انتخاب ویژگی چندبرچسبی یک راهکار NP Hard است و تا کنون تعدادی راهکار مبتنی بر هوش جمعی و الگوریتم‌های تکاملی برای آن ارائه شده است. افزایش ابعاد مسأله منجر به افزایش فضای جستجو و به تبع، کاهش کارایی و همچنین کاهش سرعت همگرایی این الگوریتم‌ها می‌شود. در این مقاله یک راهکار هوش جمعی ترکیبی مبتنی الگوریتم دودویی بهینه‌سازی ازدحام ذرات و استراتژی جستجوی محلی برای انتخاب ویژگی چندبرچسبی ارائه شده است. برای افزایش سرعت همگرایی، در استراتژی جستجوی محلی، ویژگی‌ها بر اساس میزان افزونه‌بودن و میزان ارتباط با خروجی مسأله به دو دسته تقسیم‌بندی می‌شوند. دسته اول را ویژگی‌هایی تشکیل می‌دهند که شباهت زیادی به کلاس مسأله و شباهت کمتری به سایر ویژگی‌ها دارند و دسته دوم هم ویژگی‌های افزونه و کمتر مرتبط است. بر این اساس، یک اپراتور محلی به الگوریتم بهینه‌سازی ازدحام ذرات اضافه شده که منجر به کاهش ویژگی‌های غیر مرتبط و افزونه هر جواب می‌شود. اعمال این اپراتور منجر به افزایش سرعت همگرایی الگوریتم پیشنهادی در مقایسه با سایر الگوریتم‌های ارائه‌شده در این زمینه می‌شود. عملکرد روش پیشنهادی با شناخته‌شده‌ترین روش‌های انتخاب ویژگی، بر روی مجموعه داده‌های مختلف مقایسه گردیده است. نتایج آزمایش‌ها نشان دادند که روش پیشنهادی از نظر دقت، دارای عملکردی مناسب است. تفاصيل المقالة
      • حرية الوصول المقاله

        23 - Application of Machine Learning in the Telecommunications Industry: Partial Churn Prediction by using a Hybrid Feature Selection Approach
        Fatemeh Mozaffari Iman Raeesi Vanani Payam Mahmoudian Babak Sohrabi
        The telecommunications industry is one of the most competitive industries in the world. Because of the high cost of customer acquisition and the adverse effects of customer churn on the company's performance, customer retention becomes an inseparable part of strategic d أکثر
        The telecommunications industry is one of the most competitive industries in the world. Because of the high cost of customer acquisition and the adverse effects of customer churn on the company's performance, customer retention becomes an inseparable part of strategic decision-making and one of the main objectives of customer relationship management. Although customer churn prediction models are widely studied in various domains, several challenges remain in designing and implementing an effective model. This paper addresses the customer churn prediction problem with a practical approach. The experimental analysis was conducted on the customers' data gathered from available sources at a telecom company in Iran. First, partial churn was defined in a new way that exploits the status of customers based on criteria that can be measured easily in the telecommunications industry. This definition is also based on data mining techniques that can find the degree of similarity between assorted customers with active ones or churners. Moreover, a hybrid feature selection approach was proposed in which various feature selection methods, along with the crowd's wisdom, were applied. It was found that the wisdom of the crowd can be used as a useful feature selection method. Finally, a predictive model was developed using advanced machine learning algorithms such as bagging, boosting, stacking, and deep learning. The partial customer churn was predicted with more than 88% accuracy by the Gradient Boosting Machine algorithm by using 5-fold cross-validation. Comparative results indicate that the proposed model performs efficiently compared to the ones applied in the previous studies. تفاصيل المقالة
      • حرية الوصول المقاله

        24 - بهبود تشخیص وبگاه های جعل شده با استفاده از طبقه بندی کننده شبکه عصبی مصنوعی چند لایه با الگوریتم بهینه سازی شیرمورچه
        فرهنگ پدیداران مقدم مهشید صادقی باجگیران
        در حملات فیشینگ یک وبگاه جعلي از روي وبگاه اصلي جعل ميگردد که ظاهر بسیار شبیه به وبگاه اصلي دارد. فیشر یا سارق آنلاین براي هدایت کاربران به این وبگاهها، معمولا لینکهاي جعلي را در ایمیل قرار داده و براي قربانیان خود ارسال نموده و با روشهاي مهندسي اجتماعي سعي در فریب کارب أکثر
        در حملات فیشینگ یک وبگاه جعلي از روي وبگاه اصلي جعل ميگردد که ظاهر بسیار شبیه به وبگاه اصلي دارد. فیشر یا سارق آنلاین براي هدایت کاربران به این وبگاهها، معمولا لینکهاي جعلي را در ایمیل قرار داده و براي قربانیان خود ارسال نموده و با روشهاي مهندسي اجتماعي سعي در فریب کاربران و مجاب نمودن آنها براي کلیک روي لینکهاي جعلي دارد. حملات فیشینگ زیان مالي قابل توجهاي دارند و بیشتر روي بانکها و درگاههاي مالي متمرکز هستند. روشهاي یادگیري ماشین یک روش موثر براي تشخیص حملات فیشینگ است اما این مشروط به انتخاب بهینه ویژگي است. انتخاب ویژگي باعث ميشود فقط ویژگيهاي مهم به عنوان ورودي یادگیري در نظر گرفته شوند و خطاي تشخیص حملات فیشینگ کاهش داده شود. در روش پیشنهادي براي کاهش دادن خطاي تشخیص حملات فیشینگ یک طبقهبندي کننده شبکه عصبي مصنوعي چند لایه استفاده شده که فاز انتخاب ویژگي آن با الگوریتم بهینهسازي شیرمورچه انجام ميشود. ارزیابي و آزمایشها روي مجموعه داده Rami که مرتبط با فیشینگ است نشان ميدهد روش پیشنهادي داراي دقتي در حدود 98.53 % است و نسبت به شبکه عصبي مصنوعي چند لایه خطاي کمتري دارد. روش پیشنهادي در تشخیص حملات فیشینگ از روشهاي یادگیري BPNN ، SVM ، NB ، C4.5 ، RF و kNN با سازوکار انتخاب ویژگي توسط الگوریتم PSO دقت بیشتري دارد. تفاصيل المقالة