• فهرس المقالات Opinion Mining

      • حرية الوصول المقاله

        1 - Opinion Mining in Persian Language Using Supervised Algorithms
        Saeedeh Alimardani عبداله  آقايي
        Rapid growth of Internet results in large amount of user-generated contents in social media, forums, blogs, and etc. Automatic analysis of this content is needed to extract valuable information from these contents. Opinion mining is a process of analyzing opinions, sent أکثر
        Rapid growth of Internet results in large amount of user-generated contents in social media, forums, blogs, and etc. Automatic analysis of this content is needed to extract valuable information from these contents. Opinion mining is a process of analyzing opinions, sentiments and emotions to recognize people’s preferences about different subjects. One of the main tasks of opinion mining is classifying a text document into positive or negative classes. Most of the researches in this field applied opinion mining for English language. Although Persian language is spoken in different countries, but there are few studies for opinion mining in Persian language. In this article, a comprehensive study of opinion mining for Persian language is conducted to examine performance of opinion mining in different conditions. First we create a Persian SentiWordNet using Persian WordNet. Then this lexicon is used to weight features. Results of applying three machine learning algorithms Support vector machine (SVM), naive Bayes (NB) and logistic regression are compared before and after weighting by lexicon. Experiments show support vector machine and logistic regression achieve better results in most cases and applying SO (semantic orientation) improves the accuracy of logistic regression. Increasing number of instances and using unbalanced dataset has a positive effect on the performance of opinion mining. Generally this research provides better results comparing to other researches in opinion mining of Persian language. تفاصيل المقالة
      • حرية الوصول المقاله

        2 - An Improved Sentiment Analysis Algorithm Based on Appraisal Theory and Fuzzy Logic
        Azadeh Roustakiani Neda Abdolvand Saeideh Rajaei Harandi
        Millions of comments and opinions are posted daily on websites such as Twitter or Facebook. Users share their opinions on various topics. People need to know the opinions of other people in order to purchase consciously. Businesses also need customers’ opinions and big أکثر
        Millions of comments and opinions are posted daily on websites such as Twitter or Facebook. Users share their opinions on various topics. People need to know the opinions of other people in order to purchase consciously. Businesses also need customers’ opinions and big data analysis to continue serving customer-friendly services, manage customer complaints and suggestions, increase financial benefits, evaluate products, as well as for marketing and business development. With the development of social media, the importance of sentiment analysis has increased, and sentiment analysis has become a very popular topic among computer scientists and researchers, because it has many usages in market and customer feedback analysis. Most sentiment analysis methods suffice to split comments into three negative, positive and neutral categories. But Appraisal Theory considers other characteristics of opinion such as attitude, graduation and orientation which results in more precise analysis. Therefore, this research has proposed an algorithm that increases the accuracy of the sentiment analysis algorithms by combining appraisal theory and fuzzy logic. This algorithm was tested on Stanford data (25,000 comments on the film) and compared with a reliable dictionary. Finally, the algorithm reached the accuracy of 95%. The results of this research can help to manage customer complaints and suggestions, marketing and business development, and product testing. تفاصيل المقالة
      • حرية الوصول المقاله

        3 - ارائه ی مدلی برای عقیده کاوی در سطح ویژگی برای نظرات کاربران هتل ها
        الهام  خلج شهریار  محمدی
        امروزه بررسی نظرات و عقاید کاربران در بستر اینترنت بخش مهمی از فرآیند تصمیم گیری مردم در رابطه با انتخاب یک محصول یا استفاده از خدمات ارایه شده را شامل می شود. با وجود بستر اینترنت و دسترسی ساده به وبلاگ های مربوط به نظرات در زمینه صنعت گردشگری و هتلداری، منابع غنی و ع أکثر
        امروزه بررسی نظرات و عقاید کاربران در بستر اینترنت بخش مهمی از فرآیند تصمیم گیری مردم در رابطه با انتخاب یک محصول یا استفاده از خدمات ارایه شده را شامل می شود. با وجود بستر اینترنت و دسترسی ساده به وبلاگ های مربوط به نظرات در زمینه صنعت گردشگری و هتلداری، منابع غنی و عظیمی از عقاید بصورت متن موجود می باشد که افراد می‌توانند از روش های متن کاوی برای کشف عقاید دیگران استفاده کنند. با توجه به اهمیت نظر و عقاید کاربران در صنایع و بویژه صنعت گردشگری و هتلداری، مباحث عقیده‌کاوی و تحلیل احساسات و کاوش متون نوشته شده توسط کاربران مورد توجه متصدیان امور قرار گرفته است . در این مقاله یک روش ترکیبی و جدید بر اساس یک رویکرد رایج در تحلیل احساسات، استفاده از واژگان برای تولید ویژگی هایی برای طبقه بندی بار احساسی نظرات ارائه شده است. بدین صورت که دو روش ساخت فهرست واژگان یکی با استفاده از روش های آماری و دیگری با استفاده از الگوریتم ژنتیکی ارائه شده است. واژگان فوق الذکر با فرهنگ واژگان احساس عمومی و استاندارد لیو بینگ آمیخته می شوند تا دقت طبقه بندی افزایش یابد. تفاصيل المقالة
      • حرية الوصول المقاله

        4 - استخراج ویژگی‌ها و بسط لغت‌نامه در اندیشه‌کاوی مورد استفاده در متون فارسی
        عفت گلپر رابوکی ساقی‌السادات ضرغامی‌فر جلال رضايي نور
        اندیشه‌کاوی به تحلیل اظهار نظرات کاربران جهت استخراج نظرات، احساسات و خواسته‌های کاربران در یک حوزه خاص می‌پردازد. دانستن نظرات افراد در یک حوزه خاص می‌تواند نقش مهمی در تصمیم‌گیری‌های کلان آن حوزه ایفا کند. به طور کلی اندیشه‌کاوی در سه سطح سند، جمله و ویژگی به استخراج أکثر
        اندیشه‌کاوی به تحلیل اظهار نظرات کاربران جهت استخراج نظرات، احساسات و خواسته‌های کاربران در یک حوزه خاص می‌پردازد. دانستن نظرات افراد در یک حوزه خاص می‌تواند نقش مهمی در تصمیم‌گیری‌های کلان آن حوزه ایفا کند. به طور کلی اندیشه‌کاوی در سه سطح سند، جمله و ویژگی به استخراج نظرات کاربران می‌پردازد. اندیشه‌کاوی در سطح ویژگی به دلیل تحلیل جهت‌گیری جنبه‌های مختلف یک حوزه از دو سطح دیگر بیشتر مورد توجه قرار دارد. در این مقاله روشی به منظور استخراج ویژگی‌ها و بسط لغت‌نامه اندیشه‌کاوی ارائه شده است. این لغت‌نامه به منظور تعیین جهت‌گیری نظرات کاربران مورد استفاده قرار می‌گیرد. روش پیشنهادی شامل چهار گام اصلی است. در گام نخست لغت‌نامه اندیشه‌کاوی برای زبان فارسی ایجاد می‌شود. گام دوم مرحله پیش‌پردازش شامل تقطیع، ایجاد برچسب‌های ادات سخن و برچسب وابستگی نحوی اسناد است. گام سوم استخراج ویژگی‌ها و بسط لغت‌نامه با استفاده از روش انتشار دوگانه است و در گام چهارم ویژگی‌ها و قطبیت کلمات حاوی نظر استخراج‌شده در مرحله قبلی اصلاح شده و در نهایت قطبیت ویژگی‌ها تعیین می‌گردد. برای ارزیابی روش‌ پیشنهادی، نتایج حاصل را با روش استخراج ویژگی بر اساس تکرار در متون فارسی که قبلاً ارائه شده است مقایسه خواهیم نمود. نتايج به دست آمده نشان مي‌دهد كه روش ارائه‌شده در اين مقاله نسبت به روش استخراج ویژگی بر اساس تکرار در متون فارسی عملكرد بهتري دارد. تفاصيل المقالة
      • حرية الوصول المقاله

        5 - نظرکاوی افزايشی با استفاده از یادگيری فعال بر روی جريان متون
        سیدفخرالدین نوربهبهانی
        نظرکاوی امروزه به عنوان یکی از کاربردهای پراهمیت پردازش زبان طبیعی مطرح است که به دلیل بالابودن حجم و نرخ نظرات تولیدشده نیاز به روش‌های ويژه‌ای برای پردازش دارد. امروزه با توجه به ماهيت جريان داده‌ای نظرات کاربران در شبکه‌‌های اجتماعی و سایت‌های تجارت الکترونيکی، استفا أکثر
        نظرکاوی امروزه به عنوان یکی از کاربردهای پراهمیت پردازش زبان طبیعی مطرح است که به دلیل بالابودن حجم و نرخ نظرات تولیدشده نیاز به روش‌های ويژه‌ای برای پردازش دارد. امروزه با توجه به ماهيت جريان داده‌ای نظرات کاربران در شبکه‌‌های اجتماعی و سایت‌های تجارت الکترونيکی، استفاده از الگوريتم‌های دسته‌بندی غير افزايشی باعث می‌گردد به مرور زمان کارايي مدل يادگرفته‌شده برای کاوش نظرات کاهش یافته و عملاً غير قابل استفاده شود. علاوه بر این به دليل نامحدودبودن تعداد نظرات، امکان برچسب‌گذاری تمام نظرات برای ایجاد نمونه‌های آموزشی جديد و به روزرسانی مدل یادگرفته‌شده وجود ندارد. از آنجا که ممکن است نظرات جديد دارای واژگان جديد بوده و یا توزيع دسته‌های قطبيت تغيير کند، رانش مفهوم نيز می‌بايست در نظرکاوی افزايشی پشتيبانی گردد. در اين مقاله یک روش جدید برای یادگيری قطبيت متون به صورت افزايشی ارائه می‌گردد که با استفاده از یادگيری فعال جریان‌ داده‌ای، متون ارزشمند برای به‌روز رسانی مدل دسته‌بندی را انتخاب می‌کند و پس از تعيين برچسب آنها توسط متخصص انسانی، از آنها برای بهبود مدل دسته‌بندی بهره می‌گيرد. روش پيشنهادی به صورت برخط و بدون نياز به ذخيره متون، با استفاده از تعداد محدودی متون برچسب‌خورده آموزش می‌بیند و قادر به تشخيص و پشتيبانی از رانش مفهوم می‌باشد. روش پيشنهادی با روش‌های شاخص افزايشی و غير افزايشی، با استفاده از مجموعه داده‌های معتبر و معيارهای ارزيابی استاندارد مقايسه و ارزيابی می‌شود. تفاصيل المقالة
      • حرية الوصول المقاله

        6 - انتساب خطاهای شناسایی شده در نظرات کاربران در مورد برنامک‌های همراه به توسعه‌دهندگان
        مریم یونسی عباس حیدرنوری فاطمه قنادی
        نظراتی که کاربران در فروشگاه‌های برنامک‌های همراه می‌نویسند و خطای برنامک‌ها را گزارش می‌کنند، می‌تواند در بهبود کیفیت نرم‌افزار‌ها تأثیر به‌سزایی داشته باشد. بنابراین در این پژوهش رویکردی بر اساس نظرات کاربران برای انتساب خطای برنامه به توسعه‌دهندگان برنامک‌ها بیان خوا أکثر
        نظراتی که کاربران در فروشگاه‌های برنامک‌های همراه می‌نویسند و خطای برنامک‌ها را گزارش می‌کنند، می‌تواند در بهبود کیفیت نرم‌افزار‌ها تأثیر به‌سزایی داشته باشد. بنابراین در این پژوهش رویکردی بر اساس نظرات کاربران برای انتساب خطای برنامه به توسعه‌دهندگان برنامک‌ها بیان خواهد شد. این رویکرد با استفاده از داده‌های کامیت‌های برنامه تاریخچه‌ای از عملکرد توسعه‌دهندگان به دست می‌آورد و همچنین با استفاده از ایراداتی که توسعه‌دهندگان از قبل در برنامه رفع کرده‌اند در مورد سوابق آنها در رفع خطاهای برنامه اطلاعاتی کسب می‌کند. سپس با استفاده از ترکیب این دو معیار به هر توسعه‌دهنده آن نرم‌افزار برای رسیدگی به هر نظر امتیازی اختصاص می‌دهد تا فهرستی از توسعه‌دهندگان ارائه کند که به ترتیب اولویت برای رسیدگی به نظر مناسب هستند. ارزیابی این پژوهش از جنبه‌های مختلف در نهایت نشان می‌دهد که روش پیشنهادی با دقت ۷۴% قادر به شناخت توسعه‌دهنده مناسب برای رسیدگی به نظرات خواهد بود. هدف این پژوهش یک موضوع جدید است که پژوهش‌ دیگری حول آن انجام نگرفته و صرفاً باقی پژوهش‌ها راجع به دسته‌بندی نظرات کاربران بوده‌اند. بنابراین دقت ارزیابی این پژوهش نشان می‌دهد که انتساب اتوماتیک خطاهایی که در نظرات کاربران ذکر شده‌اند می‌تواند مفید واقع شود تا فرایند شناسایی و حل خطا بهبود یابد. تفاصيل المقالة
      • حرية الوصول المقاله

        7 - تشخیص عددی قطبیت با کاربست شبکه‌های عمیق بازگشتی و یادگیری بانظارت در نظرکاوی بر روی مرورهای فارسی کاربران حوزه تجارت الکترونیک‌
        سپیده جمشیدی نژاد فاطمه احمدی آبکناری پیمان بیات
        نظرکاوی، زیرشاخه‌ای از داده‌کاوی است که به حوزه پردازش زبان طبیعی وابسته بوده و با گسترش تجارت الکترونیکی، به یکی از زمینه‌های محبوب در بازیابی اطلاعات تبدیل شده است. این حوزه بر زیرمجموعه‌های مختلفی مانند تشخیص قطبیت، استخراج جنبه و تشخیص هرزنظر تمرکز دارد. اگرچه وابست أکثر
        نظرکاوی، زیرشاخه‌ای از داده‌کاوی است که به حوزه پردازش زبان طبیعی وابسته بوده و با گسترش تجارت الکترونیکی، به یکی از زمینه‌های محبوب در بازیابی اطلاعات تبدیل شده است. این حوزه بر زیرمجموعه‌های مختلفی مانند تشخیص قطبیت، استخراج جنبه و تشخیص هرزنظر تمرکز دارد. اگرچه وابستگی نهانی بین این زیرمجموعه‌ها وجود دارد اما طراحی یک چارچوب جامع شامل تمامی این موارد، بسیار چالش‌برانگیز است. پژوهش‌های موجود در این حوزه اکثراً بر روی زبان انگلیسی بوده و برای تحلیل احساس، بدون توجه به زیرمجموعه‌های تأثیرگذار، فقط بر روی حالت باینری تمرکز داشته‌اند. همچنین استفاده از یادگیری ماشینی برای دسته‌بندی نظرات بسیار رایج است و در سال‌های اخیر، اغلب پژوهش‌ها از یادگیری عمیق با اهداف متفاوت استفاده کرده‌اند. از آنجا که در ادبیات پژوهشی به چارچوبی جامع با تمرکز بر زیرمجموعه‌های تأثیرگذار کمتر پرداخته شده است، از این رو در مقاله حاضر با استفاده از راهکارهای نظرکاوی و پردازش زبان طبیعی، چارچوب جامع مبتنی بر یادگیری عمیق با نام RSAD که پیشتر توسط نویسندگان این مقاله در حوزه نظرکاوی کاربران فارسی زبان توسعه داده شده بود برای تشخیص قطبیت در دو حالت باینری و غیر باینری جملات با تمرکز بر سطح جنبه بهبود داده شده که تمام زیرمجموعه‌های لازم برای تحلیل احساس را پوشش می‌دهد. مقایسه و ارزیابی RSAD با رویکردهای موجود، نشان‌دهنده استحکام آن است. تفاصيل المقالة
      • حرية الوصول المقاله

        8 - بهبود شناسایی قطبش در تحلیل احساسات به کمک طعنه کاوی و الگوریتمهای یادگیری ماشین در توییت های فارسی
        شقايق حاجی عبدالله ميترا  ميرزارضايي Mir Mohsen Pedram
        تحلیل احساسات یا نظرکاوی شاخه ای از علوم کامپیوتر و پردازش زبان طبیعی است که سعی دارد ماشین و هوش مصنوعی را با احساس و عواطف انسانی آشنا سازد.طعنه کاوی نیز از زیرشاخه های تحلیل احساسات است و هر دو بدنبال تشخیص صحیح احساسات مثبت و منفی نهفته در متن هستند. استفاده از طعنه أکثر
        تحلیل احساسات یا نظرکاوی شاخه ای از علوم کامپیوتر و پردازش زبان طبیعی است که سعی دارد ماشین و هوش مصنوعی را با احساس و عواطف انسانی آشنا سازد.طعنه کاوی نیز از زیرشاخه های تحلیل احساسات است و هر دو بدنبال تشخیص صحیح احساسات مثبت و منفی نهفته در متن هستند. استفاده از طعنه در شبکه های اجتماعی بسیار مرسوم است، زیرا به این طریق می-توان انتقاد را با زبان طنز انجام داد. آشکارسازی طعنه در تشخیص درستی قطبش یک نظر، تاثیر به خصوصی دارد و می تواند به فهم متن توسط ماشین کمک کند و منظور نویسنده متن، شفاف تر فهمیده شود. به اين هدف، 8000 توییت فارسی که بر چسب احساس دارند و از لحاظ وجود يا عدم وجود طعنه بررسی شده‌اند، مورد استفاده قرار گرفته است. نوآوری اين پژوهش در استخراج کلمات کلیدی از جملات طعنه دار است که باعث ایجاد طعنه و کنایه شده اند. در اين پژوهش دسته‌بند مجزايي برای شناسايي طعنه در متن‌ طراحی و اموزش داده شده است و سپس خروجی های اين رده‌بند به عنوان ويژگی افزوده در اختيار دسته‌بند شناسايي احساس متن قرار می گيرد. همچنین علاوه بر بقيه کلمات کليدی استخراج شده از متن از شکلک ها و هشتگ های موجود در متن نیز به عنوان ویژگی استفاده شده است. دسته‌بندهای بیز، ماشین بردار پشتیبان و شبکه عصبی به عنوان دسته‌بندهای پايه استفاده شده‌اند و در نهايت از ترکيب دسته‌بندها در شناسايي احساس متن استفاده شد. نتايج اين پژوهش نشان می‌دهد که شناسايي طعنه موجود در متن و استفاده از آن در شناسايي احساس دقت نتايج را افزايش می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        9 - یک مدل تشخیص احساسات معنایی مبتنی بر آنتولوژی و آتوماتای یادگیر عمیق سلولی
        هوشنگ صالحی رضا قائمی مریم خیرآبادی
        امروزه شبکه های اجتماعی و رسانه های ارتباطی نقش به سزایی را در زندگی روزمره کاربران دارند. کاربران در زمینه های مختلف در شبکه های اجتماعی اقدام به گفتگو و تبادل اطلاعات می نمایند. در جملات و کامنت های کاربران احساسات منفی و مثبت در رابطه با اخبار روز، اتفاقات موجود و غی أکثر
        امروزه شبکه های اجتماعی و رسانه های ارتباطی نقش به سزایی را در زندگی روزمره کاربران دارند. کاربران در زمینه های مختلف در شبکه های اجتماعی اقدام به گفتگو و تبادل اطلاعات می نمایند. در جملات و کامنت های کاربران احساسات منفی و مثبت در رابطه با اخبار روز، اتفاقات موجود و غیره وجود دارد که تشخیص این احساسات با چالش های زیادی مواجه است. تاکنون روش های مختلفی مانند یادگیری ماشین، رویکردهای آماری، هوش مصنوعی و غیره به منظور تشخیص احساسات مطرح شده است که علی رغم کاربردهای فراوانی که داشته اند؛ اما هنوز نتوانسته دقت، شفافیت و صحت قابل قبولی داشته باشند. بنابراین در این مقاله، یک مدل نظرکاوی معنایی مبتنی بر آنتولوژی با استفاده از آتوماتای یادگیر عمیق سلولی مبتنی بر شبکه عصبی عمیق GMDH ارائه شده است. از رویکرد آنتولوژی برای انتخاب ویژگی های برجسته مبتنی بر قوانین تولید و از آتوماتای یادگیر عمیق سلولی برای طبقه بندی احساسات کاربران استفاده می‌‌شود. نوآوری اصلی این مقاله الگوریتم پیشنهادی آن است که یک روش یادگیری عمیق جهت پردازش تنها یک عبارت توسعه داده شده و سپس با انتقال آن به حوزه آتوماتای سلولی، پردازش موازی و یا توزیع شده آن فراهم می شود. در این مقاله، از مجموعه داده های مشتریان آمازون، توئیتر، فیس بوک، اخبار جعلی COVID-19، آمازون و شبکه اخبار جعلی استفاده شده است. با شبیه سازی روش پیشنهادی مشاهده گردید که روش پیشنهادی نسبت به سایر روش های دیگر به طور میانگین 3% بهبود داشته است تفاصيل المقالة
      • حرية الوصول المقاله

        10 - بهبود استخراج جنبه های متن با استفاده از دانش دامنه و گراف کلمات
        محمدرضا شمس احمد براآنی مهدی هاشمی
        با گسترش روزافزون علم و فناوري، تحلیل نظرات کاربران و تعیین نحوه نگرش کاربر به موضوعهاي مختلف به یک امر مهم تبدیل شده است. نظرکاوي فرایند استخراج نگرش افراد از روي نظرات نوشته شده است که در سه سطح سند، جمله و جنبه قابل انجام است. در سطح جنبه، نظر افراد در خصوص جنبههاي م أکثر
        با گسترش روزافزون علم و فناوري، تحلیل نظرات کاربران و تعیین نحوه نگرش کاربر به موضوعهاي مختلف به یک امر مهم تبدیل شده است. نظرکاوي فرایند استخراج نگرش افراد از روي نظرات نوشته شده است که در سه سطح سند، جمله و جنبه قابل انجام است. در سطح جنبه، نظر افراد در خصوص جنبههاي مختلف یک موضوع بررسي ميشود. مهمترین زیر بخش نظرکاوي جنبهگرا، استخراج جنبه است که موضوع اصلي این پژوهش ميباشد. در بسیاري از روشهاي ارائه شده براي استخراج جنبه، راه حل مورد نظر نیاز به مجموعه یادگیري اولیه و یا منابع زباني وسیع دارند که تهیه چنین دادههایي بسیار زمانبر و پرهزینه است. در این مقاله، رویکردي بدون نظارت براي استخراج جنبه مبتني بر مدل موضوعي و بردار کلمات پیشنهاد ميشود که از ایجاد گراف کلمات براي ادغام اطلاعات معنایي و دانش دامنه استفاده ميکند. نتایج ارزیابيها نشان از این دارد که روش پیشنهادي نه تنها باعث بهبود دقت استخراج جنبه در مقایسه با سایر روشهاي پیشین شده است، بلکه تمامي مراحل به صورت خودکار و بدون دخالت کاربر انجام ميشود و بدلیل عدم وابستگي به منابع زباني، در زبانهاي مختلف قابل اجرا ميباشد. تفاصيل المقالة