• فهرس المقالات Machine Learning

      • حرية الوصول المقاله

        1 - بررسی ابعاد مختلف مسئله شناسایی وب سایت فیشینگ و مرور روش‌های موجود
        نفیسه لنگری
        یکی از جدیدترین تهدیدات امنیتی در فضای مجازی، سرقت اطلاعات شخصی و مالی افراد توسط فیشرها می‌باشد. وجود روش‌های متنوع در شناسایی فیشینگ و عدم وجود مقاله جامع و به روز در این حوزه، نویسندگان این مقاله را برآن داشت تا با مرور، بررسی و تحلیل عملکردی روش‌های ارائه شده در پنج أکثر
        یکی از جدیدترین تهدیدات امنیتی در فضای مجازی، سرقت اطلاعات شخصی و مالی افراد توسط فیشرها می‌باشد. وجود روش‌های متنوع در شناسایی فیشینگ و عدم وجود مقاله جامع و به روز در این حوزه، نویسندگان این مقاله را برآن داشت تا با مرور، بررسی و تحلیل عملکردی روش‌های ارائه شده در پنج گروه، به ارائه مزایا و معایب هر کدام از روش‌های این گروه‌های پنج گانه بپردازند. نتایج این تحقیق گسترده می‌تواند در شناسایی گپ‌های موجود در این حوزه به محققین کمک فراوانی نماید تفاصيل المقالة
      • حرية الوصول المقاله

        2 - Density Measure in Context Clustering for Distributional Semantics of Word Sense Induction
        Masood Ghayoomi
        Word Sense Induction (WSI) aims at inducing word senses from data without using a prior knowledge. Utilizing no labeled data motivated researchers to use clustering techniques for this task. There exist two types of clustering algorithm: parametric or non-parametric. Al أکثر
        Word Sense Induction (WSI) aims at inducing word senses from data without using a prior knowledge. Utilizing no labeled data motivated researchers to use clustering techniques for this task. There exist two types of clustering algorithm: parametric or non-parametric. Although non-parametric clustering algorithms are more suitable for inducing word senses, their shortcomings make them useless. Meanwhile, parametric clustering algorithms show competitive results, but they suffer from a major problem that is requiring to set a predefined fixed number of clusters in advance. Word Sense Induction (WSI) aims at inducing word senses from data without using a prior knowledge. Utilizing no labeled data motivated researchers to use clustering techniques for this task. There exist two types of clustering algorithm: parametric or non-parametric. Although non-parametric clustering algorithms are more suitable for inducing word senses, their shortcomings make them useless. Meanwhile, parametric clustering algorithms show competitive results, but they suffer from a major problem that is requiring to set a predefined fixed number of clusters in advance. The main contribution of this paper is to show that utilizing the silhouette score normally used as an internal evaluation metric to measure the clusters’ density in a parametric clustering algorithm, such as K-means, in the WSI task captures words’ senses better than the state-of-the-art models. To this end, word embedding approach is utilized to represent words’ contextual information as vectors. To capture the context in the vectors, we propose two modes of experiments: either using the whole sentence, or limited number of surrounding words in the local context of the target word to build the vectors. The experimental results based on V-measure evaluation metric show that the two modes of our proposed model beat the state-of-the-art models by 4.48% and 5.39% improvement. Moreover, the average number of clusters and the maximum number of clusters in the outputs of our proposed models are relatively equal to the gold data تفاصيل المقالة
      • حرية الوصول المقاله

        3 - Predicting Student Performance for Early Intervention using Classification Algorithms in Machine Learning
        Kalaivani K Ulagapriya K Saritha A Ashutosh  Kumar
        Predicting Student’s Performance System is to find students who may require early intervention before they fail to graduate. It is generally meant for the teaching faculty members to analyze Student's Performance and Results. It stores Student Details in a database and أکثر
        Predicting Student’s Performance System is to find students who may require early intervention before they fail to graduate. It is generally meant for the teaching faculty members to analyze Student's Performance and Results. It stores Student Details in a database and uses Machine Learning Model using i. Python Data Analysis tools like Pandas and ii. Data Visualization tools like Seaborn to analyze the overall Performance of the Class. The proposed system suggests student performance prediction through Machine Learning Algorithms and Data Mining Techniques. The Data Mining technique used here is classification, which classifies the students based on student’s attributes. The Front end of the application is made using React JS Library with Data Visualization Charts and connected to a backend Database where all student’s records are stored in MongoDB and the Machine Learning model is trained and deployed through Flask. In this process, the machine learning algorithm is trained using a dataset to create a model and predict the output on the basis of that model. Three different types of data used in Machine Learning are continuous, categorical and binary. In this study, a brief description and comparative analysis of various classification techniques is done using student performance dataset. The six different machine learning Classification algorithms, which have been compared, are Logistic Regression, Decision Tree, K-Nearest Neighbor, Naïve Bayes, Support Vector Machine and Random Forest. The results of Naïve Bayes classifier are comparatively higher than other techniques in terms of metrics such as precision, recall and F1 score. The values of precision, recall and F1 score are 0.93, 0.92 and 0.92 respectively. تفاصيل المقالة
      • حرية الوصول المقاله

        4 - A Hybrid Machine Learning Approach for Sentiment Analysis of Beauty Products Reviews
        Kanika Jindal Rajni Aron
        Nowadays, social media platforms have become a mirror that imitates opinions and feelings about any specific product or event. These product reviews are capable of enhancing communication among entrepreneurs and their customers. These reviews need to be extracted and an أکثر
        Nowadays, social media platforms have become a mirror that imitates opinions and feelings about any specific product or event. These product reviews are capable of enhancing communication among entrepreneurs and their customers. These reviews need to be extracted and analyzed to predict the sentiment polarity, i.e., whether the review is positive or negative. This paper aims to predict the human sentiments expressed for beauty product reviews extracted from Amazon and improve the classification accuracy. The three phases instigated in our work are data pre-processing, feature extraction using the Bag-of-Words (BoW) method, and sentiment classification using Machine Learning (ML) techniques. A Global Optimization-based Neural Network (GONN) is proposed for the sentimental classification. Then an empirical study is conducted to analyze the performance of the proposed GONN and compare it with the other machine learning algorithms, such as Random Forest (RF), Naive Bayes (NB), and Support Vector Machine (SVM). We dig further to cross-validate these techniques by ten folds to evaluate the most accurate classifier. These models have also been investigated on the Precision-Recall (PR) curve to assess and test the best technique. Experimental results demonstrate that the proposed method is the most appropriate method to predict the classification accuracy for our defined dataset. Specifically, we exhibit that our work is adept at training the textual sentiment classifiers better, thereby enhancing the accuracy of sentiment prediction. تفاصيل المقالة
      • حرية الوصول المقاله

        5 - The Development of a Hybrid Error Feedback Model for Sales Forecasting
        Mehdi Farrokhbakht Foumani Sajad Moazami Goudarzi
        Sales forecasting is one of the significant issues in the industrial and service sector which can lead to facilitated management decisions and reduce the lost values in case of being dealt with properly. Also sales forecasting is one of the complicated problems in analy أکثر
        Sales forecasting is one of the significant issues in the industrial and service sector which can lead to facilitated management decisions and reduce the lost values in case of being dealt with properly. Also sales forecasting is one of the complicated problems in analyzing time series and data mining due to the number of intervening parameters. Various models were presented on this issue and each one found acceptable results. However, developing the methods in this study is still considered by researchers. In this regard, the present study provided a hybrid model with error feedback for sales forecasting. In this study, forecasting was conducted using a supervised learning method. Then, the remaining values (model error) were specified and the error values were forecasted using another learning method. Finally, two trained models were combined together and consecutively used for sales forecasting. In other words, first the forecasting was conducted and then the error rate was determined by the second model. The total forecasting and model error indicated the final forecasting. The computational results obtained from numerical experiments indicated the superiority of the proposed hybrid method performance over the common models in the available literature and reduced the indicators related to forecasting error. تفاصيل المقالة
      • حرية الوصول المقاله

        6 - Word Sense Induction in Persian and English: A Comparative Study
        Masood Ghayoomi
        Words in the natural language have forms and meanings, and there might not always be a one-to-one match between them. This property of the language causes words to have more than one meaning; as a result, a text processing system faces challenges to determine the precis أکثر
        Words in the natural language have forms and meanings, and there might not always be a one-to-one match between them. This property of the language causes words to have more than one meaning; as a result, a text processing system faces challenges to determine the precise meaning of the target word in a sentence. Using lexical resources or lexical databases, such as WordNet, might be a help, but due to their manual development, they become outdated by passage of time and language change. Moreover, the lexical resources might be domain dependent which are unusable for open domain natural language processing tasks. These drawbacks are a strong motivation to use unsupervised machine learning approaches to induce word senses from the natural data. To reach the goal, the clustering approach can be utilized such that each cluster resembles a sense. In this paper, we study the performance of a word sense induction model by using three variables: a) the target language: in our experiments, we run the induction process on Persian and English; b) the type of the clustering algorithm: both parametric clustering algorithms, including hierarchical and partitioning, and non-parametric clustering algorithms, including probabilistic and density-based, are utilized to induce senses; c) the context of the target words to capture the information in vectors created for clustering: for the input of the clustering algorithms, the vectors are created either based on the whole sentence in which the target word is located; or based on the limited surrounding words of the target word. We evaluate the clustering performance externally. Moreover, we introduce a normalized, joint evaluation metric to compare the models. The experimental results for both Persian and English test data showed that the window-based partitioningK-means algorithm obtained the best performance. تفاصيل المقالة
      • حرية الوصول المقاله

        7 - Deep Learning-based Educational User Profile and User Rating Recommendation System for E-Learning
        Pradnya Vaibhav  Kulkarni Sunil Rai Rajneeshkaur Sachdeo Rohini Kale
        In the current era of online learning, the recommendation system for the eLearning process is quite important. Since the COVID-19 pandemic, eLearning has undergone a complete transformation. Existing eLearning Recommendation Systems worked on collaborative filtering or أکثر
        In the current era of online learning, the recommendation system for the eLearning process is quite important. Since the COVID-19 pandemic, eLearning has undergone a complete transformation. Existing eLearning Recommendation Systems worked on collaborative filtering or content-based filtering based on historical data, students’ previous grade, results, or user profiles. The eLearning system selected courses based on these parameters in a generalized manner rather than on a personalized basis. Personalized recommendations, information relevancy, choosing the proper course, and recommendation accuracy are some of the issues in eLearning recommendation systems. In this paper, existing conventional eLearning and course recommendation systems are studied in detail and compared with the proposed approach. We have used, the dataset of User Profile and User Rating for a recommendation of the course. K Nearest Neighbor, Support Vector Machine, Decision Tree, Random Forest, Nave Bayes, Linear Regression, Linear Discriminant Analysis, and Neural Network were among the Machine Learning techniques explored and deployed. The accuracy achieved for all these algorithms ranges from 0.81 to 0.97. The proposed algorithm uses a hybrid approach by combining collaborative filtering and deep learning. We have improved accuracy to 0.98 which indicate that the proposed model can provide personalized and accurate eLearning recommendation for the individual user. تفاصيل المقالة
      • حرية الوصول المقاله

        8 - شناسایی فعالیت‌های انسانی مبتنی بر سنسورهای متحرک در اینترنت اشیا با استفاده از یادگیری عمیق
        عباس میرزایی فاطمه فرجی
        کنترل محدوده‌ها، اماکن و سنسورهای حرکتی در اینترنت اشیا نیازمند کنترل پیوسته و مستمر برای تشخیص فعالیت‌های انسانی در شرایط مختلف است که این مهم، خود چالشی از جمله نیروی انسانی و خطای انسانی را نیز در بر دارد. کنترل همیشگی توسط انسان نیز بر سنسورهای حرکتی اینترنت اشیا غی أکثر
        کنترل محدوده‌ها، اماکن و سنسورهای حرکتی در اینترنت اشیا نیازمند کنترل پیوسته و مستمر برای تشخیص فعالیت‌های انسانی در شرایط مختلف است که این مهم، خود چالشی از جمله نیروی انسانی و خطای انسانی را نیز در بر دارد. کنترل همیشگی توسط انسان نیز بر سنسورهای حرکتی اینترنت اشیا غیر ممکن به نظر می‌رسد. اینترنت اشیا فراتر از برقراری یک ارتباط ساده بین دستگاه‌ها و سیستم‌ها می‌باشد. اطلاعات سنسورها و سیستم‌های اینترنت اشیا به شرکت‌ها کمک می‌کند تا دید بهتری نسبت به کارایی سیستم داشته باشند. در این پژوهش روشی مبتنی بر یادگیری عمیق و شبکه عصبی عمیق سی‌لایه‌ای برای تشخیص فعالیت‌های انسانی روی مجموعه داده تشخیص فعالیت دانشگاه فوردهام ارائه شده است. این مجموعه داده دارای بیش از یک میلیون سطر در شش کلاس برای تشخیص فعالیت در اینترنت اشیا است. بر اساس نتایج به دست آمده، مدل پیشنهادی ما در راستای تشخیص فعالیت‌های انسانی در معیارهای ارزیابی مورد نظر کارایی 90 درصد و میزان خطای 2/2 درصد را داشت. نتایج به دست آمده نشان از عملکرد خوب و مناسب یادگیری عمیق در تشخیص فعالیت است. تفاصيل المقالة
      • حرية الوصول المقاله

        9 - ماشین یادگیری مفرط عمیق: رویکرد ترکیبی یادگیری افزایشی برای طبقه‌بندی داده‌های جریانی
        جواد حمیدزاده منا مرادی
        داده‌های جریانی متشکل از داده‌هایی است که به ترتیب و با سرعت و حجم زیاد به سیستم وارد می‌شوند. توزیع این داده‌ها ناپایدار بوده و در طول زمان ممکن است تغییر کنند. با توجه به اهمیت این نوع داده‌ها در حوزه‌هایی مهم نظیر اینترنت اشیا، تسریع عملکرد و افزایش توان عملیاتی تحلی أکثر
        داده‌های جریانی متشکل از داده‌هایی است که به ترتیب و با سرعت و حجم زیاد به سیستم وارد می‌شوند. توزیع این داده‌ها ناپایدار بوده و در طول زمان ممکن است تغییر کنند. با توجه به اهمیت این نوع داده‌ها در حوزه‌هایی مهم نظیر اینترنت اشیا، تسریع عملکرد و افزایش توان عملیاتی تحلیل داده‌های بزرگ جریانی به عنوان موضوعی مهم، مورد توجه محققین است. در روش پیشنهادی، از مفهوم یادگیری ترکیبی برخط در مدل بهبودیافته ماشین یادگیر مفرط به منظور طبقه‌بندی داده‌های جریانی استفاده شده است. به دلیل استفاده از رویکرد افزایشی، در هر لحظه تنها یک بلوک داده بدون نیاز به دسترسی به داده‌های پیشین یاد گرفته می‌شود. همچنین با بهره‌گیری از رویکرد آدابوست، وزن‌دهی به طبقه‌بندی‌کننده‌های پایه و تصمیم‌گیری در مورد حفظ و یا حذف آنها بر اساس کیفیت پیش‌بینی‌ها انجام می‌شود. مزیت دیگر روش پیشنهادی، بهره‌گیری از رویکرد مبتنی بر صحت طبقه‌بندی کننده‌ جهت شناسایی رانش مفهوم است که منجر به تسهیل انطباق مدل و افزایش کارایی آن می‌شود. آزمایش‌ها بر روی مجموعه‌ داده‌های استاندارد انجام گردید و روش پیشنهادی به طور میانگین با کسب 90/0% خاص‌بودن، 69/0% حساسیت و 87/0% صحت توانست اختلاف معناداری با دو روش رقیب داشته باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        10 - An Autoencoder based Emotional Stress State Detection Approach by using Electroencephalography Signals
        Jia Uddin
        Identifying hazards from human error is critical for industrial safety since dangerous and reckless industrial worker actions, as well as a lack of measures, are directly accountable for human-caused problems. Lack of sleep, poor nutrition, physical deformities, and wea أکثر
        Identifying hazards from human error is critical for industrial safety since dangerous and reckless industrial worker actions, as well as a lack of measures, are directly accountable for human-caused problems. Lack of sleep, poor nutrition, physical deformities, and weariness are some of the key factors that contribute to these risky and reckless behaviors that might put a person in a perilous scenario. This scenario causes discomfort, worry, despair, cardiovascular disease, a rapid heart rate, and a slew of other undesirable outcomes. As a result, it would be advantageous to recognize people's mental states in the future in order to provide better care for them. Researchers have been studying electroencephalogram (EEG) signals to determine a person's stress level at work in recent years. A full feature analysis from domains is necessary to develop a successful machine learning model using electroencephalogram (EEG) inputs. By analyzing EEG data, a time-frequency based hybrid bag of features is designed in this research to determine human stress dependent on their sex. This collection of characteristics includes features from two types of assessments: time-domain statistical analysis and frequency-domain wavelet-based feature assessment. The suggested two layered autoencoder based neural networks (AENN) are then used to identify the stress level using a hybrid bag of features. The experiment uses the DEAP dataset, which is freely available. The proposed method has a male accuracy of 77.09% and a female accuracy of 80.93%. تفاصيل المقالة
      • حرية الوصول المقاله

        11 - Comparative Study of 5G Signal Attenuation Estimation Models
        Md Anoarul Islam Manabendra Maiti Judhajit Sanyal Quazi Md Alfred
        Wireless networks functioning on 4G and 5G technology offer a plethora of options to users in terms of connectivity and multimedia content. However, such networks are prone to severe signal attenuation and noise in a number of scenarios. Significant research in recent y أکثر
        Wireless networks functioning on 4G and 5G technology offer a plethora of options to users in terms of connectivity and multimedia content. However, such networks are prone to severe signal attenuation and noise in a number of scenarios. Significant research in recent years has consequently focused on establishment of robust and accurate attenuation models to estimate channel noise and subsequent signal loss. The identified challenge therefore is to identify or develop accurate computationally inexpensive models implementable on available hardware for generation of estimates with low error and validate the solutions experimentally. The present work surveys some of the most relevant recent work in this domain, with added emphasis on rain attenuation models and machine learning based approaches, and offers a perspective on the establishment of a suitable dynamic signal attenuation model for high-speed wireless communication in outdoor as well as indoor environments, presenting the performance evaluation of an autoregression-based machine learning model. Multiple versions of the model are compared on the basis of root mean square error (RMSE) for different orders of regression polynomials to find the best-fit solution. The accuracy of the technique proposed in the paper is then compared in terms of RMSE to corresponding moderate and high complexity machine learning techniques implementing adaptive spline regression and artificial neural networks respectively. The proposed method is found to be quite accurate with low complexity, allowing the method to be practically applicable in multiple scenarios. تفاصيل المقالة
      • حرية الوصول المقاله

        12 - ارائه سیستم بازیابی تصاویر مبتنی بر محتوا با بهره‌گیری از یادگیری نیمه¬نظارت‌شده و کاوش الگوهای مکرر انجمنی
        مارال كلاه كج
        بازیابی تصاویر مبتنی بر محتوا که با عنوان پرس وجو بر اساس محتوای تصویر نیز شناخته می شود، یکی از زیرشاخه های بینایی ماشین است که جهت سازمان‌دهی و تشخیص محتوای تصاویر دیجیتال با بهره گیری از ویژگی های بصری به کار می رود. این تکنولوژی، تصاویر مشابه با تصویرپرس وجو را از پ أکثر
        بازیابی تصاویر مبتنی بر محتوا که با عنوان پرس وجو بر اساس محتوای تصویر نیز شناخته می شود، یکی از زیرشاخه های بینایی ماشین است که جهت سازمان‌دهی و تشخیص محتوای تصاویر دیجیتال با بهره گیری از ویژگی های بصری به کار می رود. این تکنولوژی، تصاویر مشابه با تصویرپرس وجو را از پایگاه داده های عظیم تصویری به‌صورت خودکار جستجو می‌کند و با استخراج مستقیمویژگی های بصری از داده های تصویری و نه کلمات کلیدی و حاشیه نویسی های متنی، مشابه‌ترین تصاویر را برای کاربران فراهم می‌آورد؛ بنابراین در این مقاله روشی ارائه‌شده است که جهت کاهش شکاف معنایی میانویژگی‌های بصری سطح پایین و معانی سطح بالای تصاویر از تبدیل موجک و ترکیب ویژگی‌ها با هیستوگرام رنگ استفاده می گردد. در این راستا، خروجی نهایی، از پایگاه داده ی تصویر با بهره گیری از روش استخراج ویژگی از تصاویر ورودی، خواهد بود.در گام بعد، هنگامی‌که تصاویر پرس وجو توسط کاربر هدف به سیستم داده می شود، جهت بازیابی تصاویر مرتبط، از یادگیری نیمه نظارت‌شده که از ترکیب روش‌های خوشه‌بندی و طبقه‌بندی بر اساس کاوش الگوهای مکرر حاصل می شود، مشابه‌ترین تصاویربرای کاربران بازیابی می‌گردد. نتایج آزمایش نشان می‌دهد که سیستم پیشنهادی، بالاترین میزاناثربخشی را در مقایسه با سایر روش‌های مورد مقایسه ارائه نموده است. تفاصيل المقالة
      • حرية الوصول المقاله

        13 - Breast Cancer Classification Approaches - A Comparative Analysis
        Mohan Kumar Sunil Kumar Khatri Masoud Mohammadian
        Cancer of the breast is a difficult disease to treat since it weakens the patient's immune system. Particular interest has lately been shown in the identification of particular immune signals for a variety of malignancies in this regard. In recent years, several methods أکثر
        Cancer of the breast is a difficult disease to treat since it weakens the patient's immune system. Particular interest has lately been shown in the identification of particular immune signals for a variety of malignancies in this regard. In recent years, several methods for predicting cancer based on proteomic datasets and peptides have been published. The cells turns into cancerous cells because of various reasons and get spread very quickly while detrimental to normal cells. In this regard, identifying specific immunity signs for a range of cancers has recently gained a lot of interest. Accurately categorizing and compartmentalizing the breast cancer subtype is a vital job. Computerized systems built on artificial intelligence can substantially save time and reduce inaccuracy. Several strategies for predicting cancer utilizing proteomic datasets and peptides have been reported in the literature in recent years.It is critical to classify and categorize breast cancer treatments correctly. It's possible to save time while simultaneously minimizing the likelihood of mistakes using machine learning and artificial intelligence approaches. Using the Wisconsin Breast Cancer Diagnostic dataset, this study evaluates the performance of various classification methods, including SVC, ETC, KNN, LR, and RF (random forest). Breast cancer can be detected and diagnosed using a variety of measurements of data (which are discussed in detail in the article) (WBCD). The goal is to determine how well each algorithm performs in terms of precision, recall, and accuracy. The variation of each classification threshold has been tested on various algorithms and SVM turned out to be very promising. تفاصيل المقالة
      • حرية الوصول المقاله

        14 - طراحی مدل گروهی تخمین تراوایی مخزن هیدروکربوری با استفاده از نگاره¬هاي پتروفيزيكي بر اساس تفكيك ليتولوژيكي
        عباس سلحشور احمد گائینی علیرضا شاهین مصیب کمری
        تراوايي يا نفوذپذيري، یکی از خصوصیات مهم مخازن نفت و گاز است که پیش بینی آن دشوارمي باشد. در حل حاضر از مدل های تجربی و رگرسیوني برای پیش بینی نفوذپذیری استفاده مي شود كه شامل صرف زمان و هزينه هاي زياد مرتبط با اندازه گیری آزمایشگاهی است. در چند وقت اخیر، به دلیل قابلیت أکثر
        تراوايي يا نفوذپذيري، یکی از خصوصیات مهم مخازن نفت و گاز است که پیش بینی آن دشوارمي باشد. در حل حاضر از مدل های تجربی و رگرسیوني برای پیش بینی نفوذپذیری استفاده مي شود كه شامل صرف زمان و هزينه هاي زياد مرتبط با اندازه گیری آزمایشگاهی است. در چند وقت اخیر، به دلیل قابلیت پیش بینی بهتر، از الگوریتم های یادگیری ماشین برای پیش بینی تراوايي استفاده شده است. در این مطالعه، مدل یادگیری ماشین گروهي جدیدي برای پیش بینی تراوايي در مخازن نفت و گاز معرفی شده است. در این روش ، داده های ورودي با استفاده از اطلاعات ليتولوژي لاگ ها برچسب گذاري شده و به تعدادي از دسته ها تفكيك مي شوند و هر دسته توسط الگوریتم یادگیری ماشین مدل سازی شد. برخلاف مطالعات قبلی که به صورت مستقل روي مدل ها كار مي كردند در اينجا ما ضمن طراحي يك مدل گروهي با استفاده از الگوريتم هاي ETR وDTR و GBR و داده هاي پتروفيزيكي، توانستيم صحت و دقت پيش بيني همچينين خطاي ميانگين مربعات را به طرز چشم گيري بهبود ببخشيم و تراوايي را با دقت 99.82 درصد پيش بيني كنيم. نتایج نشان داد که مدل های گروهي در بهبود دقت پیش بینی تراوايي در مقایسه با مدل های انفرادي تاثير فراواني دارند و همچنين تفكيك نمونه ها بر اساس اطلاعات ليتوژي دليلي بر بهينه نمودن تخمين تروايي نسبت به تحقيقات گذشته بود. تفاصيل المقالة
      • حرية الوصول المقاله

        15 - SQ-PUF: پروتکل احراز هویت مبتنی برPUF مقاوم در برابر حملات یادگیری ماشین
        سید ابوالفضل سجادی هزاوه بیژن  علیزاده
        توابع غیرهمسان فیزیکی (PUF) سخت‌افزاری را برای تولید الگویی منحصربه‌فرد از چالش- پاسخ با اهداف احراز هویت و رمزگذاری ارائه می‌دهند. یکی از ویژگی‌های مهم در این مدارها غیرقابل پیش‌بینی‌بودن است؛ به این معنی که یک مهاجم نمی‌تواند پاسخ‌های آینده را از مشاهدات قبلی پیش‌بینی أکثر
        توابع غیرهمسان فیزیکی (PUF) سخت‌افزاری را برای تولید الگویی منحصربه‌فرد از چالش- پاسخ با اهداف احراز هویت و رمزگذاری ارائه می‌دهند. یکی از ویژگی‌های مهم در این مدارها غیرقابل پیش‌بینی‌بودن است؛ به این معنی که یک مهاجم نمی‌تواند پاسخ‌های آینده را از مشاهدات قبلی پیش‌بینی کند. با این حال نشان داده شده که الگوریتم‌های یادگیری ماشین، تهدیدی قابل توجه برای PUF ها هستند؛ زیرا آنها قادر به مدل‌سازی دقیق رفتار PUF می‌باشند. در این مقاله، ما تهدیدات امنیتیPUF را تحلیل و یک روش احراز هویت مبتنی بر PUF به نام SQ-PUF را ارائه می‌کنیم که می‌تواند در برابر حملات یادگیری ماشین مقاومت خوبی از خود نشان دهد. توانایی شبیه‌سازی یا پیش‌بینی آن را با مبهم‌سازی همبستگی بین جفت‌های چالش- پاسخ‌ها دشوار کردیم. نتایج تجربی نشان می‌دهند که برخلاف PUFهای موجود، حتی با مجموعه‌ای از داده‌های بزرگ هم نمی‌توان به مدل SQ-PUF حمله موفقی داشت و بیشترین دقت پیش‌بینی %۵۳ است که نشان‌دهنده غیرقابل پیش‌بینی‌بودن این مدل می‌باشد. علاوه بر این، یکنواختی و یکتایی در این مدل تقریباً با مقدار ایده‌آل در A-PUF یکسان باقی مانده است. تفاصيل المقالة
      • حرية الوصول المقاله

        16 - An Analysis of Covid-19 Pandemic Outbreak on Economy using Neural Network and Random Forest
        Md. Nahid  Hasan Tanvir  Ahmed Md.  Ashik Md. Jahid  Hasan Tahaziba  Azmin Jia Uddin
        The pandemic disease outbreaks are causing a significant financial crisis affecting the worldwide economy. Machine learning techniques are urgently required to detect, predict and analyze the economy for early economic planning and growth. Consequently, in this paper, w أکثر
        The pandemic disease outbreaks are causing a significant financial crisis affecting the worldwide economy. Machine learning techniques are urgently required to detect, predict and analyze the economy for early economic planning and growth. Consequently, in this paper, we use machine learning classifiers and regressors to construct an early warning model to tackle economic recession due to the cause of covid-19 pandemic outbreak. A publicly available database created by the National Bureau of Economic Research (NBER) is used to validate the model, which contains information about national revenue, employment rate, and workers' earnings of the USA over 239 days (1 January 2020 to 12 May 2020). Different techniques such as missing value imputation, k-fold cross validation have been used to pre-process the dataset. Machine learning classifiers- Multi-layer Perceptron- Neural Network (MLP-NN) and Random Forest (RF) have been used to predict recession. Additionally, machine learning regressors-Long Short-Term Memory (LSTM) and Random Forest (RF) have been used to detect how much recession a country is facing as a result of positive test cases of covid-19 pandemic. Experimental results demonstrate that the MLP-NN and RF classifiers have exhibited average 88.33% and 85% of recession (where 95%, 81%, 89% and 85%, 81%, 89% for revenue, employment rate and workers earnings, respectively) and average 90.67% and 93.67% of prediction accuracy for LSTM and RF regressors (where 92%, 90%, 90%, and 95%, 93%, 93% respectively). تفاصيل المقالة
      • حرية الوصول المقاله

        17 - Application of Machine Learning in the Telecommunications Industry: Partial Churn Prediction by using a Hybrid Feature Selection Approach
        Fatemeh Mozaffari Iman Raeesi Vanani Payam Mahmoudian Babak Sohrabi
        The telecommunications industry is one of the most competitive industries in the world. Because of the high cost of customer acquisition and the adverse effects of customer churn on the company's performance, customer retention becomes an inseparable part of strategic d أکثر
        The telecommunications industry is one of the most competitive industries in the world. Because of the high cost of customer acquisition and the adverse effects of customer churn on the company's performance, customer retention becomes an inseparable part of strategic decision-making and one of the main objectives of customer relationship management. Although customer churn prediction models are widely studied in various domains, several challenges remain in designing and implementing an effective model. This paper addresses the customer churn prediction problem with a practical approach. The experimental analysis was conducted on the customers' data gathered from available sources at a telecom company in Iran. First, partial churn was defined in a new way that exploits the status of customers based on criteria that can be measured easily in the telecommunications industry. This definition is also based on data mining techniques that can find the degree of similarity between assorted customers with active ones or churners. Moreover, a hybrid feature selection approach was proposed in which various feature selection methods, along with the crowd's wisdom, were applied. It was found that the wisdom of the crowd can be used as a useful feature selection method. Finally, a predictive model was developed using advanced machine learning algorithms such as bagging, boosting, stacking, and deep learning. The partial customer churn was predicted with more than 88% accuracy by the Gradient Boosting Machine algorithm by using 5-fold cross-validation. Comparative results indicate that the proposed model performs efficiently compared to the ones applied in the previous studies. تفاصيل المقالة
      • حرية الوصول المقاله

        18 - روشی نوین برای تشخیص بیماری مبتنی بر زیرساخت اینترنت اشیاء با استفاده از الگوریتم ژنتیک و طبقه بندی کننده های مختلف
        سیدابراهیم دشتی رحمت آبادی مریم نیکپور مهدی نیکپور محبوبه جوهری
        فناوری اطلاعات پزشکی و خدمات بهداشتی و درمانی با رفاه ملی و معیشت مردم ارتباط دارد. ادغام پردازش ابری و اینترنت اشیا یک پیشرفت بزرگ در کاربرد پزشکی مدرن خواهد بود. در این تحقیق تمرکز بر روی بیماری‌ مزمن‌ دیابت می‌باشد که‌ یکی‌ از عوامل‌ اصلی‌ مرگ و میر در سراسر جهان محس أکثر
        فناوری اطلاعات پزشکی و خدمات بهداشتی و درمانی با رفاه ملی و معیشت مردم ارتباط دارد. ادغام پردازش ابری و اینترنت اشیا یک پیشرفت بزرگ در کاربرد پزشکی مدرن خواهد بود. در این تحقیق تمرکز بر روی بیماری‌ مزمن‌ دیابت می‌باشد که‌ یکی‌ از عوامل‌ اصلی‌ مرگ و میر در سراسر جهان محسوب می‌شود. این تحقیق تکنولوژی اطلاعات پزشکی را در زمینه اینترنت اشیا، به ویژه در زمینه کاربرد نظارت و مدیریت پزشکی بکار گرفته است. این مطالعه یک روش مبتکرانه مبتنی بر اینترنت اشیا را برای تشخیص دیابت معرفی می‌کند. یک معماری برای نظارت از راه دور و مدیریت پلت فرم ابر اطلاعات بهداشتی پیشنهاد و تحلیل می‌شود ، اطلاعات بیماران از طریق ابزارهای اینترنت اشیاء پوشیدنی و تعبیه شده بر حسب نیاز استفاده و جمع آوری می‌شود و در نهایت از طریق اینترنت شخص ارسال می‌شود. در این مقاله الگوریتم مبتنی بر الگوریتم ژنتیک و طبقه بندی ترکیبی برای تشخیص دیابت در راستای کمک به نظارت پزشکی ارائه شده است. از الگوریتم‌های ژنتیک برای انتخاب ویژگی‌های مرتبط بر اساس همبستگی آنها با وضعیت دیابت و وابستگی‌های بین ویژگی‌ها استفاده می‌کند. متعاقباً، یک مدل یادگیری مجموعه‌ای انباشته، با ادغام طبقه‌بندی‌کننده‌های SVM، KNN، ANN، درختان و GNB برای دقت بیشتر استفاده می‌شود. نتایج نشان‌دهنده عملکرد برتر رویکرد ما است و پتانسیل آن را برای بهبود مدیریت دیابت و نتایج مراقبت‌های بهداشتی برجسته می‌کند. روش پیشنهادی از سه روش ارزیابی شده است و نتایج‌ حاصل‌ نشان می‌دهد روش پیشنهادی‌ از عملکرد بالاتری به میزان 9 تا 57 درصد‌ نسبت‌ بـه‌ روشهای‌ پایه برخوردار بوده و به‌ دقت‌ ٩٣ درصد رسیده است‌ تفاصيل المقالة
      • حرية الوصول المقاله

        19 - تخصیص منابع امنیتی برای مقابله با حملات در اینترنت اشیا با استفاده از یادگیری ماشین
        نسیم نوائی وصال حکمی
        امروزه شبکه‌های اینترنت اشیا (IoT) با توجه به محدودیت منابع پردازشی، ناهمگونی و محدودیت انرژی در اشیا‌ و همچنین عدم وجود استانداردی واحد برای پیاده‌سازی سازوکارهای امنیتی به کانون و مرکز توجه حملات امنیتی تبدیل شده‌اند. در این مقاله، یک راهکار برای مسئله تخصیص منابع امن أکثر
        امروزه شبکه‌های اینترنت اشیا (IoT) با توجه به محدودیت منابع پردازشی، ناهمگونی و محدودیت انرژی در اشیا‌ و همچنین عدم وجود استانداردی واحد برای پیاده‌سازی سازوکارهای امنیتی به کانون و مرکز توجه حملات امنیتی تبدیل شده‌اند. در این مقاله، یک راهکار برای مسئله تخصیص منابع امنیتی به جهت مقابله با حملات در اینترنت اشیا ارائه خواهد شد. مسئله تخصیص منابع امنیتی در شبکه IoT (SRAIoT) به جای‌گذاری امن‌افزارها در زیرساخت IoT اشاره دارد. برای حل این مسئله نیاز است که شرایط پویای محیط ارتباطی و عدم قطعیت در مورد عملکرد مهاجمان لحاظ شود. در رویکرد‌های سنتی تخصیص منابع امنیتی در IoT، مهاجم بر اساس مفروضات خود از شرایط سیستم، دست به حمله زده و در مقابل، مدافع نیز در سیستم با شناخت قبلی از رفتار مهاجم و گره‌های مورد حمله به مقابله می‌پردازد. برخلاف رویکردهای پیشین در این پژوهش از رویکردی واقع‌بینانه برای تخصیص پویای منابع امنیتی در شبکه IoT جهت مقابله با مهاجمانی با رفتار ناشناخته استفاده شده‌ است. در مسئله مطرح‌شده به این علت که در بازه‌های یادگیری در مورد استقرار چند منبع امنیتی نیاز به اتخاذ تصمیم وجود دارد، فضای حالت راهبردها به صورت ترکیبیاتی بیان‌ می‌شود. همچنین مسئله SRAIoT در چارچوب یک مسئله قمار چندبازویی ترکیبیاتی- تخاصمی مطرح می‌شود. از آنجا که در شرایط واقعی، جابه‌جایی منابع امنیتی استقرار‌یافته دارای هزینه‌ بالایی است، هزینه مذکور در تابع سودمندی مسئله لحاظ شده و بنابراین چارچوب پیشنهادی به‌صورت توأمان هزینه جابه‌جایی و پاداش کسب‌شده را مد نظر قرار می‌دهد. نتایج شبیه‌سازی نشان‌دهنده همگرایی سریع‌تر معیار پشیمانی ضعیف الگوریتم‌های پیشنهادی نسبت به الگوریتم ترکیبیاتی پایه است. علاوه بر این به‌منظور شبیه‌سازی شبکه IoT در بستری واقع‌بینانه، شبیه‌سازی سناریوی حمله با استفاده از شبیه‌ساز Cooja نیز انجام شده است. تفاصيل المقالة
      • حرية الوصول المقاله

        20 - تشخيص موضع به زبان فارسی مبتنی بر طبقه بندهای چندگانه
        مژگان فرهودی عباس طلوعی اشلقی
        <p><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-l أکثر
        <p><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">تشخيص موضع (که با عناوبن طبقه</span><span style="font-size: 12.0pt; font-family: 'Arial',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">&zwnj;</span><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">بندي موضع، تحليل موضع يا پيش</span><span style="font-size: 12.0pt; font-family: 'Arial',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">&zwnj;</span><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">بيني موضع نيز شناخته شده است) يک موضوع تحقيقاتي اخير است که به يک پارادايم نوظهور تبديل شده است. هدف از تشخيص موضع، شناسايي موضع نويسنده نسبت به يک موضوع يا ادعاي خاص بوده که به جزء کليدي کاربردهايي مانند تشخيص اخبار جعلي، اعتبارسنجي ادعا يا جستجوي استدلال تبديل شده است. در اين مقاله از سه رويکرد يادگيري ماشين، يادگيري عميق و يادگيري انتقالي براي تشخيص موضع فارسي استفاده شده و سپس با بکارگيری طبقه</span><span dir="RTL" lang="AR-SA" style="font-size: 12.0pt; font-family: 'Times New Roman',serif; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">&zwnj;</span><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">بندهای چندگانه، مدلی برای اخذ تصميم نهايي در مورد نتايج خروجي پيشنهاد گرديده است. برای اين منظور از روش اکثريت آرا مبتنی بر صحت طبقه&zwnj;بند</span><span style="font-size: 12.0pt; font-family: 'Arial',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">&zwnj;</span><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">های انفرادی براي ترکيب نتايج آنها استفاده گرديد. نتايج آزمايش</span><span style="font-size: 12.0pt; font-family: 'Arial',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">&zwnj;</span><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">ها نشان داد که عملکرد مدل پيشنهادي نسبت به عملکرد طبقه</span><span style="font-size: 12.0pt; font-family: 'Arial',sans-serif; mso-fareast-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">&zwnj;</span><span dir="RTL" lang="FA" style="font-size: 12.0pt; font-family: Nazanin; mso-ascii-font-family: 'Times New Roman'; mso-fareast-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'; mso-ansi-language: EN-US; mso-fareast-language: EN-US; mso-bidi-language: FA;">بندهای انفرادی پيشرفت مناسبی داشته است.</span></p> تفاصيل المقالة
      • حرية الوصول المقاله

        21 - تشخیص نفوذ مبتنی بر همکاری در بستر زنجیره‌ی‌بلوکی دارای مجوز در اینترنت‌اشیاء به روش یادگیری ماشین
        محمد مهدی   عبدیان مجید غیوری ثالث سید احمد  افتخاری
        در سیستم‌های تشخیص نفوذ؛ افزایش نرخ تشخیص‌های درست و کاهش زمان آموزش و تشخیص، کاهش بار پردازشی، نگهداشت مناسب مدل تشخیص دهنده و لاگ‎های حاصل، به طوری که توسط افراد غیر مجاز قابل دستکاری یا پاک شدن نباشند حائز اهمیت می‎باشد. بنابراین در این پژوهش، با بهره‎مندی از مزایای أکثر
        در سیستم‌های تشخیص نفوذ؛ افزایش نرخ تشخیص‌های درست و کاهش زمان آموزش و تشخیص، کاهش بار پردازشی، نگهداشت مناسب مدل تشخیص دهنده و لاگ‎های حاصل، به طوری که توسط افراد غیر مجاز قابل دستکاری یا پاک شدن نباشند حائز اهمیت می‎باشد. بنابراین در این پژوهش، با بهره‎مندی از مزایای زنجیره‎بلوکی و قابلیت‎ ماندگاری آن و با بهره‎مندی از معماری IDS مبتنی بر همکاری چند گره به دنبال رفع مشکلات مطرح شده می‎باشیم. مدل بر اساس الگوریتم درخت تصمیم است که در گره‎های معماری به عنوان موتور تشخیص نفوذ فعالیت می‎کند. معماری متشکل از چندین گره مرتبط در بستر زنجیره‎بلوکی می‎باشد، مدل و لاگ‎های ایجاد شده در بستر زنجیره‎بلوکی ذخیره شده و لذا به راحتی قابل دستکاری یا پاک شدن نیستند. کنار مزایای حاصل از به کارگیری زنجیره‌بلوکی، مساله ی میزان حافظه اشغالی و سرعت و زمان انجام تراکنش‌ها توسط زنجیره‌بلوکی نیز مطرح می‌باشند. در این پژوهش مدل‌های ارزیابی برای معماری تک گره و چند گره در بستر زنجیره‌بلوکی، مطرح شده است. در نهایت اثبات معماری و تهدیدات احتمالی نسبت به معماری و راه‌های دفاع تشریح می‎شود. مهمترین مزایای طرح شامل؛ حذف نقطه ی شکست واحد، حفظ اعتماد بین گره‌ها و اطمینان از جامعیت مدل و لاگ‌های کشف شده می‌باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        22 - طراحی و جمع‌آوری دادگان گفتاری به‌عنوان گام نخست بومی‌سازی تشخیص هوشمند اوتیسم در کودکان ایرانی
        مریم علیزاده شیما طبیبیان
        اختلال طیف اوتیسم، نوعی اختلال رشدی به شمار می‌آید که از طریق علائمی مانند ناتوانی در برقراری ارتباط اجتماعی، خود را نشان می‌دهد. بنابراین بارزترین نشانه افراد مبتلا به اوتیسم، اختلال گفتار است. این مقاله در بخش اول به بررسی و مرور مطالعات انجام‌شده برای تشخیص خودکار او أکثر
        اختلال طیف اوتیسم، نوعی اختلال رشدی به شمار می‌آید که از طریق علائمی مانند ناتوانی در برقراری ارتباط اجتماعی، خود را نشان می‌دهد. بنابراین بارزترین نشانه افراد مبتلا به اوتیسم، اختلال گفتار است. این مقاله در بخش اول به بررسی و مرور مطالعات انجام‌شده برای تشخیص خودکار اوتیسم بر اساس پردازش گفتار افراد مشکوک به ابتلا می‌پردازد. با توجه به بررسی‌های انجام‌شده، رویکردهای اصلی پردازش گفتار برای تشخیص اوتیسم به دو گروه تقسیم می‌شوند. گروه اول با پردازش پاسخ‌ها یا احساسات افراد مورد آزمایش در پاسخ به سؤالات یا داستان پرسشگر، افراد مبتلا به اوتیسم را تشخیص می‌دهند. گروه دوم، افراد مبتلا به اوتیسم را از طریق میزان نرخ دقت بازشناسی گفتارشان در سیستم‌های تشخیص خودکار گفتار از افراد سالم تفکیک می‌کنند. علی‌رغم پژوهش‌های زیاد انجام‌شده در این حوزه در خارج از ایران، پژوهش‌های اندکی داخل ایران انجام شده‌اند که مهم‌ترین دلیل آن، عدم وجود دادگان غنی متناسب با نیازمندی‌های تشخیص اوتیسم مبتنی بر پردازش گفتار افراد مبتلا است. در بخش دوم پژوهش حاضر به روند طراحی، جمع‌آوری و ارزیابی یک مجموعه دادگان گفتاری مستقل از گوینده برای تشخیص اوتیسم در کودکان ایرانی به‌عنوان گام نخست بومی‌سازی حوزه مذکور پرداخته‌ایم. تفاصيل المقالة
      • حرية الوصول المقاله

        23 - ترکیب تکنیک‌های انتخاب نمونه و داده‌افزایي برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن
        پرستو محقق سميرا نوفرستی مهری رجائی
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌ب أکثر
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌بندی به‌طور معمول بر روی مجموعه داده‌های متوازن به‌خوبی عمل می‌کنند. با وجود این، یکی از مشکلاتی که الگوریتم‌های طبقه‌بندی با آن مواجه هستند، پیش‌بینی صحیح برچسب نمونه‌های جدید بر اساس یادگیری بر روی مجموعه داده‌های نامتوازن است. در این نوع از مجموعه داده‌ها، توزیع ناهمگونی که داده‌ها در کلاس‌های مختلف دارند باعث نادیده گرفته‌شدن نمونه‌های کلاس با تعداد نمونه کمتر در یادگیری طبقه‌بند می‌شوند؛ در حالی که این کلاس در برخی مسائل پیش‌بینی دارای اهمیت بیشتری است. به‌منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل‌سازی مجموعه داده‌های نامتوازن ارائه می‌شود که با متعادل‌نمودن تعداد نمونه‌های کلاس‌های مختلف در مجموعه داده‌ای نامتوازن، پیش‌بینی صحیح برچسب کلاس نمونه‌های جدید توسط الگوریتم یادگیری ماشین را بهبود می‌بخشد. بر اساس ارزیابی‌های صورت‌گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه‌بندی مجموعه داده‌های نامتوازن به نام‌های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش‌های دیگر دارد. تفاصيل المقالة
      • حرية الوصول المقاله

        24 - شناسایی برنامه از طریق طبقه بندی هوشمند ترافیک شبکه
        شقایق  نادری
        طبقه بندی و تحلیل ترافیک، یکی از چالش های بزرگ در حوزه داده کاوی و یادگیری ماشین است که نقش مهمی در تأمین امنیت، تضمین کیفیت و مدیریت شبکه دارد. امروزه حجم زیادی از ترافیک انتقالی در بستر شبكه‏ توسط پروتكلهای ارتباطي امن مانند HTTPS رمز می‌شوند. ترافیک رمز، امکان نظارت أکثر
        طبقه بندی و تحلیل ترافیک، یکی از چالش های بزرگ در حوزه داده کاوی و یادگیری ماشین است که نقش مهمی در تأمین امنیت، تضمین کیفیت و مدیریت شبکه دارد. امروزه حجم زیادی از ترافیک انتقالی در بستر شبكه‏ توسط پروتكلهای ارتباطي امن مانند HTTPS رمز می‌شوند. ترافیک رمز، امکان نظارت و تشخیص ترافيک مشکوک و مخرب در زيرساخت‏هاي ارتباطي را (در قبال افزایش امنيت و حريم خصوصي کاربر) کاهش مي‏دهد و طبقه‌بندی آن بدون رمزگشايي ارتباطات شبكه‏اي كار دشواري است، چرا که اطلاعات payload از دست مي‏رود و تنها اطلاعات سرآيند كه بخشي از آن هم در نسخه‌هاي جدید پروتكلهاي ارتباطي شبكه (نظيرTLS1.03) رمز مي‏شود، قابل دسترس است. از اينرو رويكردهاي قدیمی تحلیل ترافیک مانند روشهاي مختلف مبتني بر پورت و Payload کارآمدی خود را از دست داده، و رویکردهای جدید مبتنی بر هوش مصنوعی و یادگیری ماشین در تحلیل ترافیک رمز مورد استفاده قرار می‌گیرند. در این مقاله پس از بررسی روش‌های تحلیل ترافیک، چارچوب معماري عملیاتی برای تحلیل و طبقه‌بندی هوشمند ترافیک طراحی شده است. سپس یک مدل هوشمند با رویکرد شناسایی ترافیک برنامه‌‌ها مبتنی بر معماری پیشنهادی ارائه گردیده و با استفاده از روشهای یادگیری ماشین روی پایگاه داده ترافیکی Kaggle141 مورد ارزیابی قرار گرفته است. نتایج بدست آمده نشان می‌دهد که مدل مبتنی بر جنگل تصادفی، علاوه بر قابلیت تفسیرپذیری بالا در مقایسه با روشهای یادگیری عمیق، توانسته است دقت بالایی در طبقه‌بندی هوشمند ترافیک (95 درصد) در مقایسه با سایر روشهای یادگیری ماشین ارائه دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        25 - بررسی تغییرات زمانی و مکانی کاربری اراضی با استفاده از سنجش از دور، مطالعه موردی: مراتع جیرانسو، خراسان شمالی
        محبت  نداف رضا امیدی پور حسین سبحانی
        <p>اطلاع از روند تغییرات و همچنین مدیریت صحیح کاربری&not;های اراضی در اکوسیستم های طبیعی اهمیت بالایی در حفاظت از منابع طبیعی دارد. در این راستا، استفاده از سنجش از دور به دلیل فراهم کردن اطلاعات مکانی و زمانی گسترده به یک رویه مرسوم تبدیل شده است. در تحقیق حاضر به منظو أکثر
        <p>اطلاع از روند تغییرات و همچنین مدیریت صحیح کاربری&not;های اراضی در اکوسیستم های طبیعی اهمیت بالایی در حفاظت از منابع طبیعی دارد. در این راستا، استفاده از سنجش از دور به دلیل فراهم کردن اطلاعات مکانی و زمانی گسترده به یک رویه مرسوم تبدیل شده است. در تحقیق حاضر به منظور تهیه نقشه کاربری اراضی، ابتدا دقت سه روش مرسوم پیکسل پایه (حداکثر احتمال)، یادگیری ماشینی (ماشین بردار پشتیبان) و شیءگرا با یکدیگر مقایسه شدند. سپس روند تغییرات زمانی و مکانی کاربری های اراضی در یک دوره 26 ساله (1997-2023) با استفاده از شش تصویر ماهواره های لندست انجام شد. ارزیابی دقت طبقه بندی با استفاده از شاخص های ضریب کاپا و صحت کلی و ارزیابی روند تغییرات با استفاده از روش ارزیابی متقاطع و ارزیابی مکانی صورت گرفت. بر اساس نتایج، روش ماشین بردار پشتیبان دارای بالاترین ضریب کاپا (71/0 تا 98/0) و صحت کلی (86 تا 99 درصد) برای دوره&not;های مورد مطالعه بود. بر اساس نتایج، مراتع با وضعیت فقیر دارای روند کلی کاهشی و کاربری&not;های مراتع خیلی فقیر، اراضی بدون پوشش و زراعت دیم دارای روندهای افزایشی بودند. مساحت اراضی مرتعی فقیر از 962 هکتار (36/44 درصد) در سال 1997 به 489 هکتار (57/22 درصد) در سال 2023 کاهش یافتند، در حالی که مراتع خیلی فقیر در مدت مشابه از 1138 هکتار (48/52 درصد) به 1606 هکتار (05/74 درصد) افزایش داشته است. نتایج این تحقیق نشان داد که روند تغیرات کاربری اراضی در مرتع جیرانسو به سمت تخریب مراتع بوده و با گذشت زمان این روند در حال تشدید شدن است. همچنین، بر اساس نتایج بدست آمده از این تحقیق پیشنهاد می شود در تحقیقات آتی از روش های طبقه بندی مبتنی بر یادگیری ماشینی برای تهیه نقشه کاربری اراضی استفاده شود.</p> تفاصيل المقالة
      • حرية الوصول المقاله

        26 - تعیین محل اصابت صاعقه به کمک روش معکوس زمانی الکترومغناطیسی(EMTR) و یادگیری ماشین
        عباس  همدونی اصلی محمدحسن مرادی
        <p>تعیین محل اصابت صاعقه (LLS) از چالش&zwnj;های امروزی در حوزه&zwnj;های مختلف و به&zwnj;ویژه حوزه برق و الکترونیک است. برای تعیین محل اصابت صاعقه، استفاده از روش&zwnj;های کلاسیک مرسوم بود؛ ولی اخیراً استفاده از روش معکوس زمانی الکترومغناطیسی (EMTR) نیز رواج &zwnj;یافته أکثر
        <p>تعیین محل اصابت صاعقه (LLS) از چالش&zwnj;های امروزی در حوزه&zwnj;های مختلف و به&zwnj;ویژه حوزه برق و الکترونیک است. برای تعیین محل اصابت صاعقه، استفاده از روش&zwnj;های کلاسیک مرسوم بود؛ ولی اخیراً استفاده از روش معکوس زمانی الکترومغناطیسی (EMTR) نیز رواج &zwnj;یافته است. با توجه به محاسبه شکل موج کامل میدان با استفاده از روش EMTR، دقت در تعیین محل اصابت صاعقه به&zwnj;طور قابل توجهی نسبت به روش&zwnj;های پیشین افزایش یافته است. در روش معکوس زمانی الکترومغناطیسی به کمک تفاضل محدود حوزه زمان (FDTD)، ابتدا میدان الکترومغناطیسی گذرای تولیدشده توسط کانال صاعقه محاسبه شده و پس از معکوس&zwnj;کردن زمانی موج، از محل حسگر یا حسگرها به منبع خود بازانتشار می&zwnj;گردد و مجدداً با کمک FDTD، میدان الکترومغناطیسی بازانتشاری در محیط مورد نظر محاسبه می&zwnj;شود. با داشتن میدان الکترومغناطیسی محیط با استفاده از معیارهایی مانند حداکثر دامنه میدان، حداکثر انرژی و آنتروپی و ...، محل اصابت صاعقه تعیین می&zwnj;گردد. در این مقاله روشی بر اساس ترکیب یادگیری ماشین و EMTR برای تعیین محل اصابت صاعقه پیشنهاد شده است. ابتدا روش تفاضل محدود حوزه زمان سه&zwnj;بعدی(D-FDTD3) در محاسبه میدان الکترومغناطیسی محیط به&zwnj;کار گرفته شد و با استفاده از EMTR میدان الکترومغناطیسی بازانتشاری مجدداً با کمک (D-FDTD3) در کل محیط محاسبه گردید. بدین طریق داده&zwnj;های لازم برای تولید پروفایل&zwnj;های سه&zwnj;بعدی تصاویر RGB آماده گردید. سپس برای یادگیری ماشین از VGG19، یک شبکه عصبی کانولوشنی (CNN) از پیش آموزش&zwnj;دیده، برای استخراج ویژگی&zwnj;های تصاویر استفاده شد. در آخر برای تعیین محل اصابت صاعقه، لایه برازش&zwnj;کننده&zwnj;ای به بالای 19VGG اضافه شد. روش پیشنهادی در MATLAB و Python شبیه&zwnj;سازی و اجرا گردید که نتایج، کارایی آن را برای تعیین محل اصابت صاعقه در محیط سه&zwnj;بعدی نشان می&zwnj;دهند.</p> تفاصيل المقالة
      • حرية الوصول المقاله

        27 - پیش بینی ریسک نقدینگی با استفاده از تحلیل تمایلات خبری
        حامد میرشک امیر البدوی مهرداد کارگری محمد علی رستگار محمد طالبی
        یکي از م شکلات ا سا س ي بانکهاي ایراني نبود فرآیند مدیریت ری سک با رویکردي آیندهنگر ا ست . از مهمترین این ری سک ها در بانک، ميتوان به ری سک نقدینگي ا شاره کرد ؛ بنابراین پيشبيني ری سک نقدینگي به مو ضوع ي مهم براي بانکها تبدیل شده ا س ت. روشهاي مرسوم اندازه گيري ریسک ن أکثر
        یکي از م شکلات ا سا س ي بانکهاي ایراني نبود فرآیند مدیریت ری سک با رویکردي آیندهنگر ا ست . از مهمترین این ری سک ها در بانک، ميتوان به ری سک نقدینگي ا شاره کرد ؛ بنابراین پيشبيني ری سک نقدینگي به مو ضوع ي مهم براي بانکها تبدیل شده ا س ت. روشهاي مرسوم اندازه گيري ریسک نقدینگي پيچيده، زمانبر و پرهزینه هستند که پيشبيني آن را نيز غير قابل دسترس نموده اس ت. پيشبيني ریسک نقدینگي در زمان مناسب ميتواند از بروز مشکلات یا بحرانهاي جدي در بانک جلوگيري نماید. در این مطالعه سعي شده است تا راهحلي نوآورانه براي پيشبيني ریسک نقدینگي بانک و سناریوهاي پيشرو با استفاده از رویکرد تحليل تمایلات خبري ارائه شود . از رویکرد تحليل تمایل اخبار پيرامون یکي از بانکهاي ایراني در را ستاي شنا سایي متغيرهاي کيفي پ ویا و مؤثر در ریسککک نقدینگي بهره برده شده تا روشي سادهتر و با کارایي بالاتر براي پيشبيني روند ریسک نقدینگي ارائه نماید. روش پيشنهادي سناریوهاي عملي را براي تص ميمگيرندگان ریسک بانکي در دنياي واقعي فراهم ميکند. س کناریوهاي ریسک نقدینگي به د ست آمده در مقای سه با سنار یوهاي رخ داده در بانک طبق د ستورالعمل کم يته بازل و نظر کار شنا سان بانک ي ارزیابي مي شوند تا از صحت پ يشبينيها و همسو یي آن اطمينان حاصل شود. نتيجه ارزیابي سنار یوهاي موردمطالعه بهصورت دورهاي حاکي از دقت نسبتاً بالا است. معيار دقت 1 پيشبيني در سککناریوهاي محتمل اسککتاراش شده از کميته بازل، 95.5 % و در سککناریوهاي برگرفته از نظرات خبرگان، 75 % است تفاصيل المقالة
      • حرية الوصول المقاله

        28 - ارائه یک سیستم توصیه گر وب برای پیش بینی صفحات مورد علاقه کاربر با استفاده از الگوریتم خوشه بندی DBSCAN و روش SVM یادگیری ماشین
        رضا  مولایی فرد محمد مصلح
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد أکثر
        سیستم‌های توصیه گر می‌توانند درخواست‌های آینده کاربر را پیش‌بینی و سپس لیستی از صفحات موردعلاقه کاربر را تولید کند. به‌عبارت‌دیگر سیستم های توصیه گر می توانند نمایه ایی دقیق از رفتار کاربران را به دست آورده و صفحه ایی پیش‌بینی شود که کاربر درحرکت بعدی آن را انتخاب خواهد کرد که این کار می‌تواند مشکل شروع سرد سیستم را حل و باعث کیفیت بخشیدن به جستجو شود. در این تحقیق به ارائه روش جدیدی به‌منظور بهبود سیستم‌های توصیه گر در زمینه وب پرداخته می‌شود که از الگوریتم خوشه‌بندی DBSCAN جهت خوشه‌بندی داده‌ها استفاده می‌شود که این الگوریتم امتیاز کارایی ۹۹٪ را به دست آورد. سپس با استفاده از الگوریتم Page rank، صفحات موردعلاقه کاربر وزن دهی می‌شوند. سپس با استفاده از روش SVM، داده‌ها را دسته‌بندی و جهت تولید پیش‌بینی به کاربر به یک سیستم توصیه گر ترکیبی داده می‌دهیم که درنهایت این سیستم توصیه گر لیستی از صفحات را در اختیار کاربر قرار خواهد داد که می‌تواند موردعلاقه وی باشند. ارزیابی نتایج حاصل از تحقیق حاکی از آن بود که استفاده از این روش پیشنهادی می‌تواند امتیاز ۹۵% را در قسمت فراخوانی و امتیاز ۹۹% را در قسمت دقت به دست آورد که این نتایج اثبات می‌کند که این سیستم توصیه گر تا بیش از ۹۰٪ می‌تواند صفحات موردنظر کاربر را به‌درستی تشخیص داده و تا حدود زیادی نقاط ضعف سایر سیستم های پیشین را برطرف سازد. تفاصيل المقالة
      • حرية الوصول المقاله

        29 - سکوی ساخت و تولید هوشمند پلیمرها: مهندسی ژنوم مواد پلیمری
        زینب سادات  حسینی
        مواد پلیمری با کارایی عالی، پایه و اساس توسعه فناوری سطح بالا و ساخت و تولید پیشرفته است. اخیراً، مهندسی ژنوم مواد پلیمری(Polymeric material genome engineering) (PMGE) به عنوان سکویی اساسی برای ساخت و تولید هوشمند مواد پلیمری مطرح شده است. PMGE یک رشته نوظهور است که اص أکثر
        مواد پلیمری با کارایی عالی، پایه و اساس توسعه فناوری سطح بالا و ساخت و تولید پیشرفته است. اخیراً، مهندسی ژنوم مواد پلیمری(Polymeric material genome engineering) (PMGE) به عنوان سکویی اساسی برای ساخت و تولید هوشمند مواد پلیمری مطرح شده است. PMGE یک رشته نوظهور است که اصول طرح ژنوم مواد را با علم پلیمر ترکیب می کند تا کشف و توسعه مواد پلیمری جدید را تسریع بخشد. مفهوم PMGE ایجاد یک پایگاه داده جامع از خواص پلیمر است که از هر دو روش محاسباتی و تجربی به دست آمده است. سپس می توان از این پایگاه داده برای آموزش مدل های یادگیری ماشینی استفاده کرد که می تواند خواص پلیمرهای جدید را پیش بینی کند. به طور کلی، PMGE نشان دهنده یک گام مهم به سمت تولید هوشمند مواد پلیمری با پتانسیل ایجاد انقلاب در این زمینه همراه با امکان توسعه سریعتر و کارآمدتر مواد جدید است. با این حال، توسعه PMGE هنوز در ابتدای راه است و بسیاری از مسائل، باقی مانده که باید مورد توجه قرار گیرد. در این بررسی، مفاهیم بنیادی PMGE و خلاصه ای از تحقیقات و دستاوردهای پیشرفت های اخیر ارائه می شود، سپس مهمترین چالش‌ها به همراه چشم‌انداز آینده ترسیم می‌شود. به‌طور‌خاص، این مطالعه بر رویکردهای پیش‌بینی خواص، از جمله رویکرد پروکسی و یادگیری ماشین متمرکز است و کاربردهای بالقوه PMGE یعنی کامپوزیت های پیشرفته، مواد پلیمری مورد استفاده در سامانه های ارتباطی و ساخت مدارهای یکپارچه الکتریکی را مورد بحث قرار خواهد داد. تفاصيل المقالة
      • حرية الوصول المقاله

        30 - تخمین لاگ صوتی برشی با استفاده از روش‌های یادگیری ماشین، و مقایسه با داده‌های حاصل از مغزه
        هوشنگ مهرابی ابراهیم سفیداری سیده سپیده میرربیع صادق براتی بلداجی سید محمد زمانزاده
        امروزه استفاده از روش‌‌های یادگیری ماشین در تخمین داده‌‌های پتروفیزیکی کاربرد فراوانی دارد. در این مطالعه سعی شده لاگ صوتی برشی از دیگر داده‌های پتروفیزیکی با روش‌های یادگیری ماشین محاسبه و با داده‌‌های صوتی حاصل از مغزه مقایسه شوند. برای این منظور در ابتدا برای نرم أکثر
        امروزه استفاده از روش‌‌های یادگیری ماشین در تخمین داده‌‌های پتروفیزیکی کاربرد فراوانی دارد. در این مطالعه سعی شده لاگ صوتی برشی از دیگر داده‌های پتروفیزیکی با روش‌های یادگیری ماشین محاسبه و با داده‌‌های صوتی حاصل از مغزه مقایسه شوند. برای این منظور در ابتدا برای نرمال‌سازی داده‌‌ها روش‌‌های محاسباتی انحراف معیار، جنگل انزوا، حداقل کوواریانس و فاکتور پرتی استفاده و مورد مقایسه قرار گرفتند. با توجه به مقدار داده‌‌های حذفی و نمودارهای جعبه‌‌ای رسم شده، روش انحراف معیار برای نرمال‌سازی انتخاب شد. روش‌‌های یادگیری ماشین استفاده شده شامل جنگل تصادفی، رگرسیون چندگانه، رگرسیون تقویت شده، رگرسیون بردار پشتیبان، K نزدیک‌ترین همسایه و پرسپترون چندلایه می‌‌باشند. رگرسیون چندگانه پایین‌ترین اندیس ارزیابی (94/0 = R2) را داشت درحالی‌که رگرسیون جنگل تصمیم‌گیری با اندیس ارزیابی برابر 98/0، بالاترین همبستگی بین لاگ‌‌های صوتی برشی تخمین زده شده و لاگ صوتی اصلی را داشتند. بنابراین برای تخمین نهایی از رگرسیون جنگل تصادفی استفاده شد و برای جلوگیری از کلیت بخشی یا بیش برازش داده‌‌ها، از تابع GridSearchCV هایپرپارامترهای بهینه محاسبه و تخمین نهایی انجام شد. لاگ صوتی برشی تخمینی، با داده‌‌های صوتی حاصل از مغزه قرابت بسیار بالایی را نشان دادند. تفاصيل المقالة
      • حرية الوصول المقاله

        31 - تشخیص نفوذ مبتنی بر همکاری در بستر زنجیره‌ی‌بلوکی دارای مجوز در اینترنت‌اشیاء به روش یادگیری ماشین
        محمد مهدی   عبدیان مجید غیوری ثالث سید احمد  افتخاری
        در سیستم‌های تشخیص نفوذ، افزایش نرخ تشخیص‌های درست و کاهش زمان آموزش و تشخیص، کاهش بار پردازشی، نگهداشت مناسب مدل تشخیص‌دهنده و لاگ‎های حاصل، به طوری که توسط افراد غیرمجاز قابل دستکاری یا پاک شدن نباشند حائز اهمیت می‎باشد. بنابراین در این پژوهش، با بهره‎مندی از مزایای ز أکثر
        در سیستم‌های تشخیص نفوذ، افزایش نرخ تشخیص‌های درست و کاهش زمان آموزش و تشخیص، کاهش بار پردازشی، نگهداشت مناسب مدل تشخیص‌دهنده و لاگ‎های حاصل، به طوری که توسط افراد غیرمجاز قابل دستکاری یا پاک شدن نباشند حائز اهمیت می‎باشد. بنابراین در این پژوهش، با بهره‎مندی از مزایای زنجیره‎بلوکی و قابلیت‎ ماندگاری آن و با بهره‎مندی از معماری IDS مبتنی بر همکاری چند گره به دنبال رفع مشکلات مطرح شده می‎باشیم. مدل بر اساس الگوریتم درخت تصمیم است که در گره‎های معماری به عنوان موتور تشخیص نفوذ فعالیت می‎کند. معماری متشکل از چندین گره مرتبط در بستر زنجیره‎بلوکی می‎باشد، مدل و لاگ‎های ایجاد شده در بستر زنجیره‎بلوکی ذخیره شده و لذا به راحتی قابل دستکاری یا پاک شدن نیستند. کنار مزایای حاصل از به کارگیری زنجیره‌بلوکی، مسالهی میزان حافظه اشغالی و سرعت و زمان انجام تراکنش‌ها توسط زنجیره‌بلوکی نیز مطرح می‌باشند. در این پژوهش مدل‌های ارزیابی برای معماری تک گره و چند گره در بستر زنجیره‌بلوکی، مطرح شده است. در نهایت اثبات معماری و تهدیدات احتمالی نسبت به معماری و راه‌های دفاع تشریح می‎شود. مهمترین مزایای طرح شامل حذف نقطهی شکست واحد، حفظ اعتماد بین گره‌ها و اطمینان از جامعیت مدل و لاگ‌های کشف شده می‌باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        32 - شناسایی برنامه با طبقه‌بندی هوشمند ترافیک شبکه
        شقایق  نادری
        طبقه‌بندی و تحلیل ترافیک، یکی از چالش‌های بزرگ در حوزه داده کاوی و یادگیری ماشین است که نقش مهمی در تأمین امنیت، تضمین کیفیت و مدیریت شبکه دارد. امروزه حجم زیادی از ترافیک انتقالی در بستر شبكه‏ توسط پروتكلهای ارتباطي امن مانند HTTPS رمز می‌شوند. ترافیک رمز، امکان نظارت أکثر
        طبقه‌بندی و تحلیل ترافیک، یکی از چالش‌های بزرگ در حوزه داده کاوی و یادگیری ماشین است که نقش مهمی در تأمین امنیت، تضمین کیفیت و مدیریت شبکه دارد. امروزه حجم زیادی از ترافیک انتقالی در بستر شبكه‏ توسط پروتكلهای ارتباطي امن مانند HTTPS رمز می‌شوند. ترافیک رمز، امکان نظارت و تشخیص ترافيک مشکوک و مخرب در زيرساخت‏هاي ارتباطي را (در قبال افزایش امنيت و حريم خصوصي کاربر) کاهش مي‏دهد و طبقه‌بندی آن بدون رمزگشايي ارتباطات شبكه‏اي كار دشواري است، چرا که اطلاعات payload از دست مي‏رود و تنها اطلاعات سرآيند كه بخشي از آن هم در نسخه‌هاي جدید پروتكلهاي ارتباطي شبكه (نظيرTLS1.03) رمز مي‏شود، قابل دسترس است. از اينرو رويكردهاي قدیمی تحلیل ترافیک مانند روش‌هاي مختلف مبتني بر پورت و Payload کارآمدی خود را از دست داده، و رویکردهای جدید مبتنی بر هوش مصنوعی و یادگیری ماشین در تحلیل ترافیک رمز مورد استفاده قرار می‌گیرند. در این مقاله پس از بررسی روش‌های تحلیل ترافیک، چارچوب معماري عملیاتی برای تحلیل و طبقه‌بندی هوشمند ترافیک طراحی شده است. سپس یک مدل هوشمند با رویکرد شناسایی ترافیک برنامه‌‌ها مبتنی بر معماری پیشنهادی ارائه گردیده و با استفاده از روش‌های یادگیری ماشین روی مجموعه داده ترافیکی Kaggle141 و مجموعه داده محلی مورد ارزیابی قرار گرفته است. نتایج بدست آمده نشان می‌دهد که مدل مبتنی بر جنگل تصادفی، علاوه بر قابلیت تفسیرپذیری بالا در مقایسه با روش‌های یادگیری عمیق، توانسته است دقت بالایی در طبقه‌بندی هوشمند ترافیک (به ترتیب 95% و 97%) نسبت به سایر روش‌های یادگیری ماشین روی مجموعه داده Kaggle141 و ترافیک محلی ارائه دهد. تفاصيل المقالة