مولفه های اصلی ارزیابی اعتبار کاربران با توجه به اهداف سازمانی در چرخۀ حیات کلان داده
الموضوعات :سوگند دهقان 1 , شهریار محمدی 2 , روجیار پیرمحمدیانی 3
1 - دانشکده مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، ایران
2 - دانشکده مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، ایران
3 - عضو هیئت علمی دانشگاه کردستان
الکلمات المفتاحية: اعتبار اطلاعات, کاربران معتبر, منابع اطلاعاتي معتبر, چرخه حیات کلان داده, اهداف سازماني, شبکههاي اجتماعي,
ملخص المقالة :
شبکههاي اجتماعي بهدلیل سرعت انتشار رویدادها و نیز حجم زیاد اطلاعات، به یکي از مهمترین منابع تصمیمگیري در سازمانها تبدیل شدهاند. ولي پیش از استفاده، صحت، قابلیت اطمینان و ارزش اطلاعات تولید شده توسط آنها، باید مورد ارزیابي قرار گیرد. به این منظور، بررسي اعتبار اطلاعات با توجه به ویژگيهاي شبکههاي اجتماعي در سه سطح کاربر، محتوا و رویداد امکانپذیر ميباشد. سطح کاربر، قابل اطمینانترین سطح این حوزه ميباشد، زیرا کاربر معتبر، معمولا اقدام به انتشار محتواي معتبر مينماید. از این رو، ارزیابي سطح کاربر مورد توجه این پژوهش ميباشد. بیشتر مقالات مرتبط به حوزۀ ارزیابي اعتبار کاربران شبکههاي اجتماعي به ارزیابي اعتبار کاربران در حالت کلي پرداختهاند و از اهداف سازماني مانند ارزیابي اعتبار کاربران به منظور یافتن افراد خلاق چشم پوشي نمودهاند. همچنین چرخه حیات کلان داده و مولفههاي مهم در فرآیند ارزیابي اعتبار کاربران کمتر مورد توجه قرار گرفتهاند. از این رو، این تحقیق با بررسي 50 مقاله مهم در این حوزه، مولفههاي مهم را به سه مولفه اصلي )تعیین موضوع محتوا، انتخاب ویژگيها و ارزیابي اعتبار( دسته بندي مينماید و روشها و ویژگيهاي مربوط به هر یک را مورد بحث قرار ميدهد. نهایتا یک چارچوب اولیه ارزیابي اعتبار کاربران شبکههاي اجتماعي با توجه به اهداف سازماني و چرخه حیات کلان داده ارائه گردید. هدف این چارچوب، ارائه یک راهنما مناسب به سازمانها، براي محاسبۀ میزان اعتبار کاربران در فرآیند تصمیمگیري ميباشد.
1] Pasi, G., Viviani, M. and Carton, A., 2019. A Multi-Criteria Decision Making approach based on the Choquet integral for assessing the credibility of User-Generated Content. Information Sciences, 503, pp.574-588. #
[2] Tabassum, S., Pereira, F.S., Fernandes, S. and Gama, J., 2018. Social network analysis: An overview. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(5), p.e1256. #
[3] Erl, T., Khattak, W. and Buhler, P., 2016. Big data fundamentals: concepts, drivers & techniques (Vol. 1). Boston: Prentice Hall. #
]4[ روجیار پیرمحمدیانی ، شهریار محمدی ، معیارهای ارزیابی ارزش اثرگذاری کاربران رسانه های اجتماعی چارچوبی براساس کاوش رسانه های اجتماعی ، فناوری اطلاعات و ارتباطات ایران ، سال یازدهم شماره ی 39 و 40 ، صفحه 109-125،1398 #
[5] Abu-Salih, B., Bremie, B., Wongthongtham, P., Duan, K., Issa, T., Chan, K.Y., Alhabashneh, M., Albtoush, T., Alqahtani, S., Alqahtani, A. and Alahmari, M., 2019, March. Social credibility incorporating semantic analysis and machine learning: a survey of the state-of-the-art and future research directions. In Workshops of the International Conference on Advanced Information Networking and Applications (pp. 887-896). Springer, Cham. #
[6] Alrubaian, M., Al-Qurishi, M., Alamri, A., Al-Rakhami, M., Hassan, M.M. and Fortino, G., 2018. Credibility in online social networks: A survey. IEEE Access, 7, pp.2828-2855. #
[7] Abbasimehr, H., Nourani, E. and Shabani, M., 2020. A hybrid framework for ranking reviewers based on interval type-2 fuzzy AHP and VIKOR. International Journal of Intelligent Engineering Informatics, 8(2), pp.95-116. #
[8] Morris, M.R., Counts, S., Roseway, A., Hoff, A. and Schwarz, J., 2012, February. Tweeting is believing? Understanding microblog credibility perceptions. In Proceedings of the ACM 2012 conference on computer supported cooperative work (pp. 441-450). #
[9] Al-Garadi, M.A., Varathan, K.D., Ravana, S.D., Ahmed, E., Mujtaba, G., Khan, M.U.S. and Khan, S.U., 2018. Analysis of online social network connections for identification of influential users: Survey and open research issues. ACM Computing Surveys (CSUR), 51(1), pp.1-37. #
[10] Keller, J., Wong, S.S. and Liou, S., 2020. How social networks facilitate collective responses to organizational paradoxes. Human Relations, 73(3), pp.401-428. #
[11]Olszak, C.M., Bartuś, T. and Lorek, P., 2018. A comprehensive framework of information system design to provide organizational creativity support. Information & Management, 55(1), pp.94-108. #
[12] Siciliano, M.D. and Thompson, J.R., 2018. If you are committed, then so am I: The role of social networks and social influence on organizational commitment. Administration & Society, 50(7), pp.916-946. #
[13] Pasi, G., De Grandis, M. and Viviani, M., 2020, July. Decision making over multiple criteria to assess news credibility in microblogging sites. In 2020 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE) (pp. 1-8). IEEE. #
[14] Evans, L., Owda, M., Crockett, K. and Vilas, A.F., 2021. Credibility assessment of financial stock tweets. Expert Systems with Applications, 168, p.114351. #
[15] Abu-Salih, B., Wongthongtham, P., Chan, K.Y. and Zhu, D., 2019. CredSaT: Credibility ranking of users in big social data incorporating semantic analysis and temporal factor. Journal of Information Science, 45(2), pp.259-280. #
[16] Weerkamp, W. and de Rijke, M., 2012. Credibility-inspired ranking for blog post retrieval. Information retrieval, 15(3-4), pp.243-277. #
[17] Peng, S., Zhou, Y., Cao, L., Yu, S., Niu, J. and Jia, W., 2018. Influence analysis in social networks: A survey. Journal of Network and Computer Applications, 106, pp.17-32. #
[18] Afify, E., Sharaf Eldin, A., E Khedr, A. and Kamal Alsheref, F., 2019. User-generated content (UGC) credibility on social media using sentiment classification. النشرة المعلوماتیة فی الحاسبات والمعلومات, 1(1), pp.1-19. #
[19] Boididou, C., Papadopoulos, S., Zampoglou, M., Apostolidis, L., Papadopoulou, O. and Kompatsiaris, Y., 2018. Detection and visualization of misleading content on Twitter. International Journal of Multimedia Information Retrieval, 7(1), pp.71-86. #
[20] Hershkovitz, A. and Hayat, Z., 2020. The role of tie strength in assessing credibility of scientific content on facebook. Technology in Society, 61, p.101261 #
[21] Maes, F., Peters, S., Denoyer, L. and Gallinari, P., 2009, September. Simulated iterative classification a new learning procedure for graph labeling. In Joint European Conference on Machine Learning and Knowledge Discovery in Databases (pp. 47-62). Springer, Berlin, Heidelberg. #
[22] Saikaew, K.R. and Noyunsan, C., 2015. Features for measuring credibility on facebook information. International Scholarly and Scientific Research & Innovation, 9(1), pp.174-177. #
[23] Alrubaian, M., Al‐Qurishi, M., Al‐Rakhami, M., Hassan, M.M. and Alamri, A., 2017. Reputation‐based credibility analysis of Twitter social network users. Concurrency and Computation: Practice and Experience, 29(7), p.e3873. #
[24] Arora, A., Bansal, S., Kandpal, C., Aswani, R. and Dwivedi, Y., 2019. Measuring social media influencer index-insights from Facebook, Twitter and Instagram. Journal of Retailing and Consumer Services, 49, pp.86-101. #
[25] bin Baharudin, B. and bin Md Said, A., 2018. Trust blog ranking using multi-criteria decision analysis AHP and TOPSIS. In IT Convergence and Security 2017 (pp. 68-76). Springer, Singapore. #
[26] Cano, A.E., Mazumdar, S. and Ciravegna, F., 2014. Social influence analysis in microblogging platforms–a topic-sensitive based approach. Semantic Web, 5(5), pp.357-372. #
[27] Devi, P.S. and Karthika, S., 2019. # CycloneGaja-rank based credibility analysis system in social media during the crisis. Procedia Computer Science, 165, pp.684-690. #
[28] Embar, V.R., Bhattacharya, I., Pandit, V. and Vaculin, R., 2015, August. Online topic-based social influence analysis for the wimbledon championships. In Proceedings of the 21th ACM SIGKDD international conference on knowledge discovery and data mining (pp. 1759-1768). #
[29] Gupta, S., Sachdeva, S., Dewan, P. and Kumaraguru, P., 2018, December. CbI: Improving Credibility of User-Generated Content on Facebook. In International Conference on Big Data Analytics (pp. 170-187). Springer, Cham. #
[30] Hamzehei, A., Wong, R.K., Koutra, D. and Chen, F., 2019. Collaborative topic regression for predicting topic-based social influence. Machine Learning, 108(10), pp.1831-1850 #
[31] Setiawan, E.B., Widyantoro, D.H. and Surendro, K., 2020. Measuring information credibility in social media using combination of user profile and message content dimensions. International Journal of Electrical & Computer Engineering (2088-8708), 10(4). #
[32] Son, J., Lee, J., Oh, O., Lee, H.K. and Woo, J., 2020. Using a Heuristic-Systematic Model to assess the Twitter user profile’s impact on disaster tweet credibility. International Journal of Information Management, 54, p.102176. #
[33] Zhao, L., Hua, T., Lu, C.T. and Chen, R., 2016. A topic-focused trust model for Twitter. Computer Communications, 76, pp.1-11. #
[34] Sicilia, R., Giudice, S.L., Pei, Y., Pechenizkiy, M. and Soda, P., 2018. Twitter rumour detection in the health domain. Expert Systems with Applications, 110, pp.33-40 #
[35] O'Brien, K., Simek, O. and Waugh, F., 2019, January. Collective classification for social media credibility estimation. In Proceedings of the 52nd Hawaii International Conference on System Sciences. #
[36] Zarrinkalam F, Kahani M, Bagheri E. Mining user interests over active topics on social networks. Information Processing & Management. 2018 Mar 1;54(2):339-57. #
[37] Viviani, M. and Pasi, G., 2017. Credibility in social media: opinions, news, and health information—a survey. Wiley interdisciplinary reviews: Data mining and knowledge discovery, 7(5), p.e1209. #
[38] Momen Bhuiyan, M., Horning, M., Lee, S.W. and Mitra, T., 2021. NudgeCred: Supporting News Credibility Assessment on Social Media Through Nudges. arXiv e-prints, pp.arXiv-2108. #
[39] Daud, N.N., Ab Hamid, S.H., Saadoon, M., Sahran, F. and Anuar, N.B., 2020. Applications of link prediction in social networks: A review. Journal of Network and Computer Applications, 166, p.102716
دو فصلنامه علمي فناوري اطلاعات و ارتباطات ایران | سال پانزدهم، شمارههاي 55 و 56، بهار و تابستان 1402 صفحات:141 الی 164 |
|
The main components of evaluating the credibility of users according to organizational goals in the life cycle of big data
Sogand Dehghan*, Shahriyar Mohammadi**, Rojyar Pirmohammadiani***
*Master's student, Faculty of Industrial Engineering, Khajeh Nasiruddin Toosi University of Technology, Iran
**Associate Professor, Faculty of Industrial Engineering, Khajeh Nasiruddin Toosi University of Technology, Iran
Assistant Professor, Faculty of Computer Engineering, University of Kurdistan, Iran***
Abstract
Social networks have become one of the most important decision-making factors in organizations due to the speed of publishing events and the large amount of information. For this reason, they are one of the most important factors in the decision-making process of information validity. The accuracy, reliability and value of the information are clarified by these networks. For this purpose, it is possible to check the validity of information with the features of these networks at the three levels of user, content and event. Checking the user level is the most reliable level in this field, because a valid user usually publishes valid content. Despite the importance of this topic and the various researches conducted in this field, important components in the process of evaluating the validity of social network information have received less attention. Hence, this research identifies, collects and examines the related components with the narrative method that it does on 30 important and original articles in this field. Usually, the articles in this field are comparable from three dimensions to the description of credit analysis approaches, content topic detection, feature selection methods. Therefore, these dimensions have been investigated and divided. In the end, an initial framework was presented focusing on evaluating the credibility of users as information sources. This article is a suitable guide for calculating the amount of credit of users in the decision-making process.
Keywords: information validity, valid users, valid information sources, big data life cycle, organizational goals, social networks
مولفههای اصلی ارزیابی اعتبار کاربران با توجه به اهداف سازمانی در چرخۀ حیات کلان داده
سوگند دهقان*، شهریارمحمدی**1، روجیار پیرمحمدیانی***
*دانشجوی کارشناسی ارشد، دانشگاه صنعتی خواجه نصیرالدین طوسی، ایران
** دانشیار، دانشکده مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، ایران
*** استادیار، دانشکده مهندسی کامپیوتر، دانشگاه کردستان، ایران
تاریخ دریافت: 31/04/1401 تاریخ پذیرش: 24/06/1401
نوع مقاله: پژوهشی
چكیده
شبکههای اجتماعی بهدلیل سرعت انتشار رویدادها و نیز حجم زیاد اطلاعات، به یکی از مهمترین منابع تصمیمگیری در سازمانها تبدیل شدهاند. ولی پیش از استفاده، صحت، قابلیت اطمینان و ارزش اطلاعات تولید شده توسط آنها، باید مورد ارزیابی قرار گیرد. به این منظور، بررسی اعتبار اطلاعات با توجه به ویژگیهای شبکههای اجتماعی در سه سطح کاربر، محتوا و رویداد امکانپذیر میباشد. سطح کاربر، قابل اطمینانترین سطح این حوزه میباشد، زیرا کاربر معتبر، معمولا اقدام به انتشار محتوای معتبر مینماید. از این رو، ارزیابی سطح کاربر مورد توجه این پژوهش میباشد.
بیشتر مقالات مرتبط به حوزۀ ارزیابی اعتبار کاربران شبکههای اجتماعی به ارزیابی اعتبار کاربران در حالت کلی پرداختهاند و از اهداف سازمانی مانند ارزیابی اعتبار کاربران به منظور یافتن افراد خلاق چشم پوشی نمودهاند. همچنین چرخه حیات کلان داده و مولفههای مهم در فرآیند ارزیابی اعتبار کاربران کمتر مورد توجه قرار گرفتهاند. از این رو، این تحقیق با بررسی 50 مقاله مهم در این حوزه، مولفههای مهم را به سه مولفه اصلی (تعیین موضوع محتوا، انتخاب ویژگیها و ارزیابی اعتبار) دسته بندی مینماید و روشها و ویژگیهای مربوط به هر یک را مورد بحث قرار میدهد. نهایتا یک چارچوب اولیه ارزیابی اعتبار کاربران شبکههای اجتماعی با توجه به اهداف سازمانی و چرخه حیات کلان داده ارائه گردید. هدف این چارچوب، ارائه یک راهنما مناسب به سازمانها، برای محاسبۀ میزان اعتبار کاربران در فرآیند تصمیمگیری میباشد.
واژگان کلیدی: اعتبار اطلاعات، کاربران معتبر، منابع اطلاعاتی معتبر، چرخه حیات کلان داده، اهداف سازمانی، شبکههای اجتماعی
[1] نویسنده مسئول:شهریار محمدیmohammadi@kntu.ac.ir
1.مقدمه
شبکههای اجتماعی بستری بر روی اینترنت میباشند،که افراد
با طرز فکر مشابه یا افراد علاقمند به موضوعات خاص به یکدیگر مرتبط میشوند و ارتباطات را برای کاربران ارزان و سریع میسازند ]1[ و ]2[. این شبکهها براساس عملکردشان به دستههای متفاوت تقسیم میشوند. نمونهای از محبوبترین آنها فیسبوک، اینستاگرام و توییتر میباشند، که با سرعت زیاد اطلاعات را منتشر میسازند. به طور مثال در توئیتر، در هر ثانیه 350 هزار پیام، تولید میگردد ]3[. از این رو، حجم عظیم و روبهرشد اطلاعات، اهمیت این شبکهها را برای سازمانها افزایش داده است و تعداد کاربران هر شبکه، بیانگر ارزش تجاری آنها میباشد] 1[. بنابراین، این شبکهها به یکی از مهمترین منابع تصمیمگیری در سازمانها تبدیل شدهاند و سازمانها برای اهدافی متفاوتی از این شبکهها استفاده مینمایند ] 4[، ]5[، ]6[، ]7[ ،]8[ و]9[.
ارزیابی اعتبار اطلاعات، عامل مهم دیگری در فرایند تصمیمگیری میباشد، که بیان کنندۀ میزان صحت و ارزش اطلاعات میباشد] 4[، ]5[. اعتبار کاربران نیز ، میزان قابلیت اطمینان به آنها را به عنوان منابع اطلاعاتی نشان میدهد. ارزیابی اعتبار اطلاعات شبکههای اجتماعی، با بررسی ویژگیهای آنها، در سه سطح محتوا، کاربر و رویداد امکانپذیر شده است. در سطح رویداد، ویژگیهای مرتبط به یک رویداد مانند رخدادهای طبیعی، بررسی میگردند. در سطح محتوا، ویژگیهای مرتبط به محتوا ارزیابی میشوند. در سطح کاربر، ویژگیهای یک کاربر به عنوان منبع اطلاعاتی و محتوای تولید شده توسط آن نیز بررسی میگردد. از این رو، در سطح کاربر، علاوه بر ویژگیهای مرتبط به رویداد و محتوا، ویژگیهای مرتبط به کاربر نیز بررسی میشود ]5[. بنابراین بین سطح کاربر و محتوا همبستگی وجود دارد و یک کاربر معتبر، معمولا محتوا معتبر ارائه میدهد. به این منظور، بررسی اعتبار کاربران به عنوان منابع اطلاعاتی، بهترین گزینه جهت ارزیابی اعتبار اطلاعات شبکههای اجتماعی میباشد] 10[، ]11[، ]12[.
مقالات این حوزه بهدلایل ذیل بسیار متنوع و پراکنده میباشند:
- اهداف متفاوت ارزیابی اعتبار اطلاعات مانند اهداف سیاسی و رخدادهای طبیعی که منجر به تنوع در انتخاب و اولویتبندی ویژگیهای میشود.
- ارزیابی اعتبار اطلاعات در سه سطح کاربر، رویداد و محتوا امکانپذیر میباشد.
- از رویکردهای متنوعی، برای تحلیل اعتبار مانند سیستم تصمیمگیری چند معیاره1 و یادگیری ماشین استفاده میشود.
- هر شبکه اجتماعی شامل ویژگیهای منحصر به فردی میباشد.
- ساختارهای شبکههای اجتماعی مانند فیسبوک، اینستاگرام و توئیتر متفاوت میباشد.
- با توجه به سرعت رشد شبکههای اجتماعی، عدم وجود یک راه حل جامع برای ارزیابی اعتبار اطلاعات و تغییر سریع استراتژی کاربران اسپم در مقابل راهحلهای متنوع ارزیابی اعتبار اطلاعات، تعداد مقالات مرتبط به حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی روبه افزایش میباشد ]12[.
با توجه به تنوع زیاد مقالات مربوط به این حوزه، تعیین مولفه های اصلی مربوط به فرآیند ارزیابی کاربران برای سازمان ها دشوار می باشد. علاوه بر مورد مذکور، اهمیت اهداف سازمانی در ارزیابی اعتبار اطلاعات نادیده گرفته شده است و معمولا مقالات این حوزه به بررسی اعتبار اطلاعات براساس اهداف سیاسی، رخدادهای طبیعی، بازاریابی و یا به صورت عمومی (بدون توجه به موضوع) پرداختهاند، این در حالی میباشد، که سازمانها براساس اهداف و ماموریتهایی که در نظر میگیرند، مانند بازاریابی، افزایش شهرت تجاری، تشویق به پذیرش خلاقیت، تغییر عقیده، افزایش خلاقیت، حل مشکلات در برابر پارادوکس، بهبود وفاداری مشتری، استخدام و ارتقا کارکنان و مدیریت بحران از شبکههای اجتماعی بهرهمند میشوند و براین اساس، تعاریف متفاوتی از کاربران معتبر ارائه میدهند. از این رو، فقدان یک چارچوب برای ارزیابی اعتبار کاربران با توجه به اهداف سازمانی، وجود دارد. در این راستا، این پژوهش به بررسی مقالات حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی در ژورنالهای مختلف پرداخته است. از مقالات بررسی شده، 50 مقاله مهم و اصلی با تعداد استناد بالا انتخاب شدهاند و بر این اساس در قدم اول مولفههای مرتبط به این حوزه شناسایی، جمعآوری و بررسی میشوند و در قالب 3 مولفه اصلی: 1. تعیین موضوع محتوا، 2. انتخاب ویژگی و 3. ارزیابی اعتبار معرفی شدهاند و مقالات مرتبط به این حوزه براساس این زیرمولفه آنها بررسی میشوند. درنهایت پس از شناسایی مولفههای مهم این حوزه، یک چارچوب اولیۀ ارزیابی اعتبار کاربران طراحی گردید و باتوجه به اینکه شبکههای اجتماعی پویا میباشند و با سرعت و حجم بالا داده تولید مینمایند و تحلیل اعتبار کاربر حساس به زمان و گذارا است ]3[، ]12[، از این رو، این چارچوب براساس چرخۀ حیات کلان داده2 طراحی گردیده است. در این چارچوب، یک ساختار برای انتخاب ویژگیها پیشنهاد شد، زیرا انتخاب و اولویتبندی ویژگیها باید با اهداف متعدد سازمانی سازگار باشد. سهم اصلی این تحقیق براساس مرور روایتی ادبیات حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی به شرح ذیل میباشد:
1. دسته بندی زیرمولفههای حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی در 3 مولفه تعیین موضوع، انتخاب ویژگی و ارزیابی اعتبار
2. زیرمولفههای مهم ارزیابی اعتبار شامل، تشخیص موضوع صریح، تشخیص موضوع ضمنی، سیستم انتخاب ویژگی بر اساس هدف ارزیابی اعتبار، پیشبینی اعتبار کاربران در آینده، بررسی اعتبار کاربران در گذر زمان و قابلیت فهم آسان نتایج میباشند و براین اساس چارچوب اولیه طراحی گردیده است.
3. ارائه یک ساختار سلسله مراتبی برای انتخاب ویژگیهای شبکههای اجتماعی متناسب با اهداف سازمانی.
سازمانها با اهداف متفاوت، با استفاده از چارچوب اولیۀ این پژوهش میتوانند، اعتبار کاربران شبکههای اجتماعی را اندازهگیری نمایند. نمونۀ این چارچوب در کارهای پیشین دیده نشده است. مولفههای پیشنهادی این مقاله جهت ارزیابی اعتبار کاربران مثمرثمر میباشد و این پژوهش با طبقهبندی آکادمیک مقالات گذشته و استخراج مولفههای اصلی ارزیابی اعتبار اطلاعات سعی دارد تا به این پرسش باسخ دهد، که کاربران معتبر شبکههای اجتماعی براساس اهداف سازمانی چه نوع کاربرانی خواهند بود؟ و فرآیند صحیح برای ارزیابی اعتبار کاربران در جهت اهداف سازمانی به چه شکل میباشد؟
این پژوهش در 6 بخش سازماندهی شد. بخش 2 مبانی پژوهش میباشد. بخش 3 مقالات پیشین را براساس مولفهها بررسی مینماید. در بخش 4 چارچوب اولیه پیشنهادی ارائه گردید. بخش 5 به بحث در ارتباط با چارچوب پیشنهادی پرداخته است، بخش 6 نتیجه پژوهش را ارائه میدهد.
2. مبانی پژوهش
بهدلیل تنوع زیاد مقالات حوزۀ ارزیابی اعتبار اطلاعات ، این پژوهش زیرمولفههای ارزیابی اعتبار کاربران را به سه مولفه اصلی طبقهبندی نموده است، که شامل کل فرآیند ارزیابی اعتبار کاربران از ابتدا تا انتها میباشد. این مولفهها و فرآیند کلی ارزیابی اعتبار اطلاعات در شکل 1 نمایش داده شده است.
تعیین موضوع محتوا در شبکه اجتماعی، جهت ارزیابی اعتبار اطلاعات بسیار مهم میباشد، بهخصوص، اگر بررسی اعتبار کاربران هدف ارزیابی اعتبار اطلاعات باشد. زیرا کاربران به عنوان منابع اطلاعاتی، تنها در موضوعات خاصی توانایی کسب اعتبار را دارند ]4[. ]15[. به این منظور در برخی از مقالات، با توجه به موضوع فعالیت کاربران، اعتبار آنها مورد بررسی قرار گرفته است. اما در برخی دیگر، به صورت عمومی اعتبار کاربران بررسی شده است. آنها به اشتباه تصور کردهاند، که یک کاربر توانایی کسب اعتبار را در تمام موضوعات دارد ]4[. در ادامه، این مقالات تعدادی از ویژگیهای شبکه اجتماعی را انتخاب مینمایند و با استفاده از رویکردهای متنوع، اعتبار اطلاعات را محاسبه مینمایند. هر یک از این 3 مولفه (تعیین موضوع محتوا، انتخاب ویژگی، رویکردهای تحلیل اعتبار) در این بخش توضیح داده میشوند.
2. 1 تعیین موضوع محتوا
مقالات حوزۀ ارزیابی اعتبار اطلاعات براساس مولفه تعیین موضوع محتوا، به دو دسته عام و خاص قابل تقسیم میباشند، در مقالات عام، اعتبار بدون توجه به موضوع محتوا و به صورت کلی بررسی میگردد، این مقالات از زیرمولفههای تعیین موضوع محتوا چشم پوشی نمودهاند ]10[،] 11[،]14[، ]16[،] 17[، ]18[،]19[،] 20[، ]21[. اما در مقالات خاص اعتبار با توجه به موضوع محتوا، بررسی میشود] 15[، ]22[،] 23[، ]24[، ]25[، ]26[، ]27[، ]28[،]29[، ]30[،]31[، ]32[، ]33[، ]34[، ]35[، ]36[، ]37[، ]38[.
کاربران تنها در موضوعاتی که به آن علاقمند باشند و یا در آن فعالیت داشته باشند، امکان دریافت اعتبار را دارند. هیچ کاربری قادر به دریافت اعتبار در همۀ موضوعات نیست ]4[، ]15[. همچنین سازمانها به جهت اهداف متنوع، پیش از بهرهبرداری از اطلاعات شبکههای اجتماعی و ارزیابی اعتبار آنها، باید موضوع فعالیت کاربران را تشخیص دهند، به عنوان مثال شرکتهای فعال در طراحی و ساخت تلفنهای همراه، جهت افزایش خلاقیت در محصولات، به بررسی کاربران فعال در این زمینه پرداختهاند ]8.[ از این رو، یکی از مهمترین مولفهها در ارزیابی اعتبار کاربران شبکه اجتماعی، تعیین موضوع فعالیت آنها میباشد و مقالات خاص به منظور توجه به روشهای تشخیص موضوع فعالیت نسبت به مقالات عمومی برتری دارند، اما مقالات عمومی فاقد ارزش نیستند و پایه و اساس این حوزه میباشند ]2[. موضوع فعالیت کاربران، براساس محتوا منتشر شده توسط آنها، قابل تشخیص میباشند. از این رو، پستها و پاسخها منابع ارزشمندی جهت تعیین موضوع فعالیت در شبکههای اجتماعی میباشند ]9[.
مولفه تعیین موضوع محتوا، شامل دو زیرمولفه صریح (C1) و ضمنی (C2) میباشد. موضوعاتی که کاربران در آنها به صورت آشکار فعالیت دارند، به گروه صریح تعلق دارند و موضوعات که کاربران تنها به آنها علاقمند میباشند و یا غیرمستقیم در آنها فعالیت دارند، از گروه ضمنی میباشند ]41[. بیشتر مقالات به زیرمولفۀ تعیین موضوع بهصورت صریح توجه نمودهاند و از زیرمولفه تعیین موضوع ضمنی چشم پوشی شده است. این پژوهش در شکل 2 با استفاده از مرور ادبیات به طبقهبندی روشهای مولفه صریح پرداخته است.
2. 2 انتخاب ویژگی
شبکههای اجتماعی شامل ویژگیهای متنوعی میباشند، تعدادی از آنها در بین انواع مختلف این شبکهها، مشترک هستند و برخی دیگر منحصر به یک نوع از شبکههای اجتماعی میباشند. معمولا این ویژگیها به دو دسته فردی و رابطهای تقسیم میشوند، ویژگیهای فردی، به طور مستقل قابل محاسبه میباشند، مانند تعداد کلمات پستها و ویژگیهای رابطهای از تعامل گرهها (گرهها میتوانند کاربران، محتوا و یا رویدادها باشند.) در شبکهها محاسبه میشوند، مانند تعیین مرکزیت کاربران. به طور کلی با استفاده از 4 روش به شرح اندازهگیری محلی، محاسبات بازگشتی، محاسبه براساس هسته و مبتنی برمسیر کوتاه، ویژگیهای رابطهای محاسبه میگردند]2[.
این پژوهش، براساس اهداف ارزیابی اعتبار، ویژگیها را به 7 گروه به شرح ذیل تقسیم نموده است و ویژگیهای هر گروه در پیوست الف معرفی شدهاند.
[1] 2 Multiple-criteria decision-making (MCDM)
[2] Big Data (BD)
.
شکل 1 مولفههای اصلی و فرآیند کلی ارزیابی اعتبار کاربران |
- محبوبیت (F1): ویژگیهایی که توانایی کاربران را در تحت تاثیر قراردادن، سایر افراد نمایش میدهد.
- محتوا (F2): ویژگیهایی که نشاندهندۀ کیفیت محتوا میباشند.
- اطلاعات کلی (F3): ویژگیهایی که کاربر را بهصورت کلی معرفی مینمایند.
- انتشار (F4): کاربر با استفاده از این ویژگیها، بازدید از حساب خود را افزایش میدهد.
- فعالیت (F5): میزان فعالیت کاربران در شبکههای اجتماعی را نشان میدهد.
- پشتیبانی (F6): نشان دهندۀ حمایت کاربر از سایر افراد میباشد.
- تخصص (F7): میزان تخصص افراد در موضوعات مختلف را مشخص مینماید.
لزوما ویژگیهای انتخاب شده در این مرحله، برای ارزیابی اعتبار اطلاعات مناسب نمیباشند. از این رو، باید پیش از تحلیل اعتبار اطلاعات، تاثیر آنها با زیرمولفه سیستم انتخاب ویژگی (C3) بررسی گردد. بنابراین انتخاب و اولویتبندی ویژگیها از دیگر چالشهای مهم این حوزه میباشد. انتخاب ناصحیح این ویژگیها، موجب بررسی اعتبار اطلاعات با دقت پایین میگردد ]20[، ]26[، ]33[. از طرف دیگر، بیشتر مقالات این حوزه به وسیلۀ مرور ادبیات و بدون تحلیل تاثیر ویژگیها بر نتایج ارزیابی اعتبار اطلاعات، آنها را انتخاب نمودهاند و تعداد اندکی از مقالات، قبل از ارزیابی اعتبار اطلاعات، به بررسی تاثیر ویژگیها با استفاده از MCDM، آمار و یا یادگیری ماشین، پرداختهاند ]10[، ]11[،]20[، ]24[، ]26[، ]28[، ]36[، ]37[، ]38[.
متدهای انتخاب ویژگی یادگیری ماشین: این متدها شامل 3 نوع متد، متد پوشه1، فیلتر و تعبیه شده2 میباشد. این متد انتخاب ویژگی، وابسته به داده میباشد و هریک شامل چندین الگوریتم میباشند.
متدهای انتخاب ویژگی MCDM: این متدها، به دادهها وابستگی ندارند و تعامل بین ویژگیها را بهتر محاسبه مینمایند ]37[. نمونهای از آنها شامل فرآیند تحلیل سلسله مراتبی (AHP)3 ، AHP فازی و آنتروپی میباشد.
2. 3 ارزیابی اعتبار
پس از انتخاب ویژگیهای شبکه اجتماعی، با استفاده از رویکردهای تحلیلی معرفی شده در این بخش، میزان اعتبار اطلاعات محاسبه میگردد. این مجموعه شامل 4 زیرمولفه به شرح ذیل میباشد:
- محاسبه اعتبار (C4): این مولفه با توجه به ویژگیهای شبکه اجتماعی به محاسبه اعتبار کاربران میپردازد.
- پیشبینی اعتبار در آینده :(C5) با توجه به اینکه ممکن است، در آینده ارتباطات جدیدی بین کاربران شکل بگیرد و یا به فعالیت در موضوع جدیدی علاقمند شوند، به پیشبینی میزان اعتبار کاربران در آینده میپردازند.
- بررسی اعتبار در گذر زمان (C6): بهدلیل ماهیت ناشناس و سریع ارتباطات آنلاین، اعتماد به کاربران پویا و گذرا میباشد ]12[.به این منظور، این زیرمولفه با در نظر گرفتن پارامتر زمان، اعتبار کاربران را در بازههای زمانی متفاوت محاسبه مینماید ]15[.
- قابلیت فهم آسان نتایج (C7): این مولفه با تعیین نقطه آستانه و گروهبندی کاربران براساس این نقطه، نتایج ارزیابی اعتبار اطلاعات را برای عموم قابل فهم مینمایند.
در این پژوهش با بررسی ادبیات رویکردهای حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی، مطابق شکل 2، به دو گروه اتوماتیک و انسانی تقسیم گردیده است. گروه اتوماتیک به دو گروه مستقل و وابسته به داده قابل تقسیم میباشد.
رویکردهای انسانی: با استفاده از نظرسنجی و روشهای آماری، مقدار نهایی اعتبار اطلاعات محاسبه میگردد. این رویکردها بخاطر دخالتهای انسانی، معمولا با خطا همراه میباشند و شامل ناسازگاری و عدم اطمینان در قضاوت و ارزیابی میباشند ]1[.
مستقل از داده: به دادهها وابستگی ندارند، با استفاده از عملگرهای تجمیع و یا روشهای رتبه بندی MCDM مقدار نهایی اعتبار اطلاعات محاسبه میگردد ]10[، ]14[، ]15[،]20[ ]35[، ]36[، ]37[. برخی از روشهای این رویکرد شامل تاپسیس4، انتگرال فازی چکیت5، ویکور6/ ویکور فازی میباشد.
وابسته به داده: همان روشهای یادگیریماشین و یادگیری عمیق میباشند که به پیشبینی میپردازند و جهت ارائه نتایج دقیق، نیازمند ویژگیهای قدرتمندی میباشند. به سه شیوۀ یادگیری باناظارت، بدونناظر و نیمهنظارت تقسیم میشوند.
باناظارت: به نمونهها با حجم زیاد و برچسب خورده نیاز دارند و بیشتر مقالات از این رویکرد استفاده نمودهاند ]16[، ]17[، ]18[، ]22[، ]23[، ]24[، ]25[، ]26[، ]27[، ]28[، ]33[. برخی از روشهای این دسته شامل: ماشینبردار پشتیبانی (SVM)7، بیز ساده (NB)8، جنگل تصادفی (RF)9، رگرسیون لجستیک10، درخت تصمیمگیری (DT) 11، K نزدیکترین همسایه (KNN)12، اکس جی باست13، رگرسیون خطی(LR)14، پرسپترون چند لایه15
بدوننظارت: ناتوانی در تشخیص خروجی مورد انتظار برای دادههای ورودی معین دارند ]29[، ]30[، ]31[، ]32[، ]34[. روشهای این دسته شامل: آیتیپیتوئیتر16، رتبهبندی صفحه17، فاکتورسازی ماتریسی، خوشهبندی، قوانین تداعی18، تخصیص دیریکله نهفته19، حافظه کوتاه مدت بلند مدت20، نمایش رمزگذار دو طرفه از ترانسفورماتورها21
نیمهنظارت : این روشها به دو گروه نیمهنظارت و نیمهنظارتی مبتنی بر گراف22 قابل تقسیم میباشند ]19[،] 33[. روشهای این دسته شامل: الگوریتمهای طبقهبندی تکراری 23 و به کارگیری روشهای یادگیریماشین بانظارت به شیوۀ خاص
3. پیشینۀ تحقیق با توجه به مولفهها
کارها زیادی در حوزۀ ارزیابی اعتبار اطلاعات انجام شده است. از 50 مقاله بازنگری شده، 28 مقاله انتخاب شد و بهصورت کامل براساس زیرمولفهها، اهداف و توجه آنها به چرخه حیات BD در جدول 1 بررسی شدهاند. معیار انتخاب مقالات این پژوهش به شرح ذیل میباشد:
- مقالات منتشر شده در ژورنالها و کنفرانسهای مربوط به هوش تجاری، علوم کامپیوتر، تحلیل شبکههای اجتماعی و مدیریت مشتری
- مقالاتی که بهطور واضح مولفهها و تکنیکهای بهکار گرفته شده را، بیان کردهاند.
-مقالاتی که تعداد استناد بالایی دارند.
براساس جدول 1، شکافهای تحقیقاتی به شرح ذیل میباشد:
- به دلیل تنوع و نیز پراکندگی مقالات این حوزه، کارهای پیشین به زیرمولفههای مهم تحلیل اعتبار اطلاعات توجه کمتری داشتهاند. و نگاه جامع و ترکیبی از کلیه زیرمولفهها در نظر گرفته نشده است.
- اعتبار اطلاعات معمولا در زمینههای سیاسی، رخدادهای طبیعی، بازاریابی و یا بهصورت عمومی ارزیابی شده است. از طرف دیگر، ارزیابی اعتبار اطلاعات شبکههای اجتماعی در سازمانها بسیار مهم میباشد، که معمولا از اهداف سازمانی چشمپوشی شده است.
- با توجه به این که سازمانها براساس اهداف و ماموریتهایی که در نظر میگیرند. تعاریف متفاوتی از کاربران معتبر ارائه میدهند. بنابراین، ویژگیهای شبکههای اجتماعی باید براساس این اهداف و ماموریتها، انتخاب و اولویتبندی شوند. اما معمولا یک روش مناسب جهت اولویتبندی ویژگیهای صحیح، متناسب با هدف ارزیابی اعتباراطلاعات در این حوزه ارائه نگردیده است و بیشتر کارها، ویژگیها را براساس مرور ادبیات و بدون تحلیل تاثیر آنها بر نتایج ارزیابی اعتبار اطلاعات انتخاب کردهاند.
- علیرغم آن که، شبکههای اجتماعی پویا میباشند و با سرعت و حجم بالا داده تولید مینمایند و تحلیل اعتبار کاربر حساس به زمان و گذارا است ]3[، ]12[. تعداد مقالات کمی به زیرمولفه C6 و چرخه حیات BD توجه نمودهاند.
[1] wrap
[2] Embedded method
[3] Analytic hierarchy process (AHP)
[4] Topsiss
[5] choquet
[6] Vikor
[7] Support vector machines
[8] Naive Bayes (NB)
[9] Random Forest (RF)
[10] Logistic regression
[11] Decision Tree (DT)
[12] k-nearest neighbors algorithm (k-NN)
[13] XGBoost
[14] Linear Regression (LR)
[15] Multi-layer perceptron (MLP)
[16] ITPTWITTER
[17] Page Rank
[18] association rules
[19] Latent Dirichlet Allocation (LDA)
[20] Long short-term memory (LSTM)
[21] Bidirectional Encoder Representations from Transformers (BERT)
[22] Graph-based semi-supervise d learning (G-SSL)
[23] Iterative Classification Algorithm (ICA)
شکل 2. طبقه بندی 3 مولفه ارزیابی اعتبار اطلاعات در شبکه های اجتماعی |
مرجع | شبکه اجتماعی | زیر مولفهها | ویژگیها | رویکردها | BD | اهداف مقالات |
]11[ | توئیتر | C3, C4 | F3, F7 | C3: آمار – C4: انسانی | × | تاثیر اهمیت ویژگیها در حوزۀ ارزیابی اعتبار محتوا |
]16[ | فیسبوک | C7, C4 | F1, F7 | :C4 / C7 بانظارت ( SVM) | × | برای درک آسانتر اعتبار محتوا، به محتوا امتیاز بین 1 تا 10 اختصاص میدهد. |
]22[ | فیسبوک | C1, C4, C7 | F1, F2, F3,F5, F7 | C1: با استفاده از هشتگهای محتوا – :C4 / C7 رویکردهای بانظارت ( NB, SVM, RF ، رگرسیون لجستیک) | × | ارزیابی اعتبار محتوای خبری |
]17[ | فیسبوک | C4, C7 | F1, F2,F3, F4, F5, F6,F7 | :C4 / C7 بانظارت ( SVM) | × | ارزیابی اعتبار کاربران |
]23[ | توئیتر | C1, C4, C7 | F2 | C1: با استفاده از هشتگهای محتوا – :C4 / C7 رویکردهای بانظارت ( NB, SVM, RF) | × | بررسی اعتبار محتوا |
]18[ | توئیتر ، فیسبوک و اینستاگرام | C4, C7 | F1,F2, F7 | :C4 / C7 بانظارت ( لاسوLR, SVR, KNN, ) | × | با استفاده از نتایج ارزیابی کاربران بانفوذ با روشهای مختلف، تاثیر ویژگیها را در شبکههای اجتماعی مختلف محاسبه مینماید. |
]24[ | توئیتر و فیس بوک | C1, C3, C4 | F1, F2, F3, F4, F5 | C1: الگوریتمهای طبقهبندی – C3: افزودن ویژگیها یکی یکی به صورت دستی- C4: الگوریتمهای بانظارت ( NB, SVM ، DT رگرسیون لجستیک) | × | بررسی اعتبار محتوا |
]25[ | توئیتر | C1, C4 | F1, F2, F4, F7 | C1: بدون نظارت ( LDA) – C4: روشهای بانظارت ( رگرسیون لجستیک) | × | آنها به بررسی چگونگی تاثیراعتبار پروفایل بر اعتبار محتوا و بازنشر در هنگام رخدادهای طبیعی پرداختهاند. |
]26[ | توئیتر | C1, C3, C4, C7 | F3,F5, F7, F2,F1, F6, F4 | C1: بررسی دستی - C3: یادگیری ماشین (فیلتر، پوشه) – C4/C7: بانظارت (DT، KNN، RF، LR، NB) | × | بررسی اعتبار محتوا در حوزۀ بورس و اوراق بهادار |
]27[ | توئیتر | C1, C4 | F2, F7 | C1: بررسی دستی – C4: بانظارت (DT) | × | تعیین اعتبار کاربران در حوزۀ خبری |
جدول 1 بررسی مقالات مرتبط به ارزیابی اعتبار اطلاعات شبکههای اجتماعی |
مرجع | شبکه اجتماعی | زیر مولفهها | ویژگیها | رویکردها | BD | اهداف مقالات |
]28[ | توییتر | C1, C3, C4 | F1,F2, F3, F4, F5,F6, F7 | C1: بدون نظارت (TF-IDF) C3: یادگیری ماشین ( پوشه(هریس هاکس1)) :C4 بانظارت (اکسجیباست، SVM، RF، LR، DT، KNN، NB) | × | تعیین اعتبار محتوا عربی |
]29[ | توئیتر | C1, C4 | F1, F6 | C1: ابزار وب معنایی آماده C4: بدون نظارت (مشابه رتبهبندی صفحه ) | × | رتبهبندی کاربران بانفوذ |
]30[ | توئیتر | C1, C2, C4,C5 | F1, F6 | C1: مدل موضوع بیترم (BTM)2 – :C4 رتبهبندی صفحه – C2/ C5: FM, CRT | × | رتبهبندی کاربران بانفوذ |
]31[ | توئیتر | C1, C4 | F1, F6, F7 | C1: ترکیب منایع :C4 بدون نظارت مبتنی بر گراف (آیتیپیتوئیتر) | × | ارزیابی اعتبار کاربران و محتوا خبری |
]32[ | توئیتر | C1, C4 | F1, F3, F6, F7 | C1: ورد2وک – :C4 بدون نظارت (LDA، خوشهبندی، قوانین تداعی) | ü | بررسی اعتبار کاربران در حوزه کرونا و انتخابات ایالت متحده |
]33[ | توئیتر | C1, C4, C7 | F1, F2, F3, F4, F5, F6, F7
| C1: هشتگ C4/C7: بانظارت ( لاجستیک رگرسیونKNN, SVM, RF, DT)، بدون نظارت (ابتکاری) | × | هدف این مقاله کاهش زمان محاسبه ارزیابی اعتبار کاربران و محتوا مرتبط به رخدادهای طبیعی میباشد. |
]34[ | توئیتر | C1, C4 | F1, F2, F4, F5, F6, F7
| C1: عبارتهای منظم – C4: G-SSL (ICA) | × | بررسی اعتبار محتوا، کاربران و لینکها |
]39[ | توئیتر | C3, C4, C7 | F1, F3, F5, F7 | C3: آماری (ضریب پیرسون)، C4: بانظارت (KNN, RF, NB, SVM)، بدون نظارت (LSTM, BERT) | × | بررسی اعتبار کاربر |
]19[ | توئیتر | C4, C7 | F1, F2, F3, F4, F5, F7
| C4/ C7: نیمه نظارت (رگرسیون لجستیک، DT) | × | ارزیابی اعتبار محتوا چند رسانهای |
مرجع | شبکه اجتماعی | زیر مولفهها | ویژگیها | رویکردها | BD | اهداف مقالات |
]40[ | توئیتر | C4, C7 | F1, F2, F3, F5 | C4/ C7: نیمه نظارت (RF، SVM، MLP) | × | ارزیابی اعتبار کاربران در حوزۀ سیاست |
]35[ | توئیتر | C1, C4, C5 | F1, F4, F7
| C1: عبارتهای منظم - C4: مستقل از داده (میانگین وزنی ویژگیها) – C5: توزیع نمایی | × | ارزیابی اعتبار کاربران در حوزه ورزشی |
]14[ | وبلاگ | C4, C6 | F1, F2, F5, F7 | C4: مستقل از داده (میانگین ویژگیها)، C6: روشهای آماری | × | بررسی اعتبار کاربران |
]36[ | وبلاگ | C1, C3, C4 | F1, F5 | C1: دستی C3: مستقل از داده (AHP) :C4 مستقل از داده (تاپسیس) | × | تعیین اعتبار کاربران در حوزۀ گردشگری |
]15[ | توئیتر | C1, C4, C6, C7 | F1, F2, F5, F6, F7 | C1: ابزار وب معنایی آماده C4/ C6: مستقل از داده (جمعوزنی ویژگیها) | ü | تعیین اعتبار کاربران در 7 گروه |
]37[ | یلپ | C1, C3, C4 | F1, F2, F3, F4, F6, F7 | C1: بررسی دستی – C3/ C4: مستقل از داده (انتگرال فازی چکیت) | × | ارزیابی اعتبار محتوا |
]10[ | اپینیِز3 | C3, C4 | F1, F3, F5, F7 | C3: AHP فازی :C4 ویکور فازی | × | ارزیابی اعتبار کاربران |
]20 [ | توئیتر | C1, C3, C4, C7 | F1, F2, F5 | C1: هشتگها – :C3 یراساس مرور ادبیات، بانظارت (RF) – C4/ C7: مستقل از داده (عملگر تجمیع میانگین وزنی مرتب شده (OWA)4) | × | بررسی اعتبار کاربران |
]38[ | توئیتر | C1, C3, C4 | F1, F2, F4
| C1: هشتگ - C3: روشهای آماری C4: وابسته به داده (ابتکاری) | × | ارزیابی اعتبار کاربران |
[1] Harris Hawks
[2] Biterm Topic Model (BTM)
[3] Epinions
[4] Ordered Weighted Averaging (OWA)
با توجه به شکافهای تحقیقاتی مذکور، در این پژوهش سعی شده است، از طریق ارائۀ یک چارچوب اولیه برای اهداف سازمانی، مولفههای اصلی ارزیابی اعتبار کاربران )منابع اطلاعاتی( معرفی شوند و فرآیند صحیح ارزیابی اعتبار کاربران روشن گردد. به این منظور، در قدم اول، با استفاده از مرور ادبیات، مولفههای ارزیابی اعتبار اطلاعات شناسایی، جمعآوری و بررسی گردیده است. در قدم دوم، چارچوب پیشنهادی براساس زیرمولفهها، چرخۀ BDو اهداف سازمانی شکل گرفته است، زیرا این شبکهها پویا میباشند و با سرعت و حجم بالا، داده تولید مینمایند و تحلیل اعتبار اطلاعات حساس به زمان میباشد. همچنین، در کنار چارچوب پیشنهادی، یک ساختار جهت انتخاب ویژگیها براساس اهداف متفاوت ارزیابی اعتبار کاربران ارائه شد.
4. چارچوب اولیه پیشنهادی جهت تحلیل اعتبار کاربران شبکه های اجتماعی بر اساس اهداف سازمانی
همانطور که اشاره شد، علیرغم اهمیت ارزیابی اعتبار اطلاعات شبکههای اجتماعی، بهدلیل تنوع و پراکندگی زیاد این حوزه، به مولفههای مهم توجه کمی داشتهاند. از این رو، این پژوهش براساس مرور ادبیات صورت گرفته، به شناسایی مولفههای مهم در این حوزه میپردازد. درنهایت براساس زیرمولفهها (موضوع فعالیت صریح، موضوع فعالیت ضمنی، سیستم انتخاب ویژگی، محاسبه اعتبار، پیشبینی اعتبار در آینده، بررسی اعتبار در گذر زمان، قابلیت فهم آسان نتایج) و اهداف متفاوت سازمانی یک چارچوب اولیه جهت ارزیابی اعتبار کاربران پیشنهاد میشود و با توجه به اینکه، تحلیل اعتبار کاربران بهدلیل سرعت و حجم بالا اطلاعات، حساس به زمان میباشند، این چارچوب براساس چرخه حیات BD، در شکل 3 در 9 مرحله طراحی گردیده است. براساس کتاب ایرل و همکاران (2016)، چرخه حیات BD شامل 9 گام ارزیابی پرونده تجاری، شناسایی دادهها، جمع آوری و فیلتر کردن دادهها، استخراج دادهها، اعتبارسنجی و پاکسازی دادهها، جمع آوری و نمایش دادهها، تجزیه و تحلیل دادهها، تجسم دادهها و استفاده از نتایج تجزیه و تحلیل میباشد ]3[. چارچوب اولیه این مقاله برای ارزیابی اعتبار کاربران شبکههای اجتماعی به عنوان منابع اطلاعاتی، در فرآیند تصمیمگیری سازمانها مورد استفاده قرار میگیرد. از طرف دیگر، در این حوزه روش مناسبی جهت انتخاب ویژگی شبکههای اجتماعی ارائه نگردیده است. از این رو، در کنار این چارچوب، یک ساختار سلسله مراتب در 4 سطح برای انتخاب ویژگی، با توجه به هدف ارزیابی اعتبار کاربران در سازمانها ارائه گردید.
شکل 3. چارچوب پیشنهادی تحلیل اعتبار کاربران در شبکه های اجتماعی براساس اهداف سازمانی
4. 1 ارزیابی اعتبار براساس اهداف متنوع
یک سازمان براساس اهدافش، کاربران معتبر را تعریف مینماید، به این منظور، پیش از ارزیابی اعتبار کاربران، باید اهداف ارزیابی به روشنی بیان شود. پنج سوال در فاز برنامهریزی استراتژیک سازمان مطرح میباشد ]3[. هر سازمان باید در مراحل متفاوت از این چارچوب، به این سوالات پاسخ دهد. تا براساس اهداف سازمانی، کاربران معتبر را انتخاب نماید. در هر بخش از این چارچوب، راهنمایی جهت پاسخ به این سوالات ارائه شده است.
Q1: هدف از ارزیابی اعتبار کاربران شبکههای اجتماعی چیست؟
Q2: نتیجۀ این ارزیابی تا چه اندازه برای سازمان مفید میباشد؟ آیا سود آن بیشتر از هزینهها میباشد؟
Q3: کدام یک از شبکههای اجتماعی متناسب با اهداف سازمان میباشند؟
Q4: چه نوع کاربران معتبری (بانفوذ، پشتیبان، متخصص) برای رسیدن به هدف سازمان مناسب میباشند؟
Q5: چه ویژگیهایی از شبکههای اجتماعی براساس نوع کاربر مناسب میباشند؟
در صورتی که جواب سوال Q1 و Q2 قانعکننده باشد، فرآیند ارزیابی اعتبار کاربران در شبکههای اجتماعی شروع خواهد شد.
مقالات ارزیابی اعتبار کاربران شبکههای اجتماعی، براساس اهداف متفاوت، تعاریف متنوعی از کاربران معتبر ارائه نمودهاند. این پژوهش به استناد تعاریف موجود در این حوزه، کاربران معتبر را به سه نوع مختلف تقسیم نموده است:
بانفوذ: در بین سایر کاربران محبوبیت فراوانی دارند و دیگران را تحت تاثیر قرار میدهند ]12[، ]13[، ]29[، ]30[. جهت اهدافی مانند بازاریابی، افزایش شهرت تجاری سازمان و بهبود وفاداری به برند مناسب میباشند.
پشتیبان: مصرف کنندۀ واقعی خدمات میباشند]12[، ]13[، ]14[. این کاربران با ارائه بازخورد نسبت به موضوعات مورد نظر سازمان، جهت اهدافی مانند حل مشکلات سازمان در برابر پارادوکسها و بهبود خدمات، مناسب میباشند.
متخصص: کاربرانی که در موضوعات خاص متخصص میباشند]12[، ]26[، ]31[، ]32[. آنها جهت اهدافی مانند استخدام نیرو، افزایش آگاهی سازمان و مدیریت بحران مناسب هستند.
پاسخ به سوال Q4 براساس این سه نوع کاربرمیباشد و احتمالا ترکیبی از آنها، برای دستیابی به اهداف سازمان مناسب باشد، به طور مثال، جهت افزایش خلاقیت، هر سه نوع کاربر مورد توجه سازمان میباشد، اما میزان اهمیت هر یک از آنها متفاوت میباشد ]8[.
4. 2 شناسایی و اکتساب داده
با توجه به شبکه اجتماعی انتخاب شده در سوال Q3 با رابط برنامهنویسی کاربردی1 آن شبکه، دادهها در یک بازۀ زمانی خاص استخراج میشوند. این مرحله نشان دهندۀ ویژگی سرعت و تنوع BD میباشد. از این رو، در یک بازۀ زمانی کوتاه حجم زیادی از دادهها با فرمتهای متفاوت (تصویر، فیلم، محتوا و صوت) جمعآوری میشود ]3[.
4. 3 پیشپردازش
به ویژگی صحت BD اشاره دارد. دادهها به دو دسته سیگنال و نویز قابل تقسیم میباشند. نویزها توانایی تبدیل به اطلاعات را ندارند. از این رو، برای ایجاد ارزش بیشتر و افزایش صحت اطلاعات، نویزها باید حذف شوند ]3[. حذف کلمات توقف (ضمایر، حروف ربطی و ...)، حذف زبانهایی که مورد مطالعه نیستند، ریشهیابی کلمات2 و ریشهیابی کلمات عطف3 جز این مراحل میباشند ]17[.
4. 4 اعتبار کاربر
پس از جمعآوری، پیشپردازش و ذخیرهسازی موقت دادهها، نوبت به تجزیه و تحلیل آنها برای محاسبه اعتبار کاربر میرسد. این مرحله به ویژگی ارزش BD اشاره دارد، یعنی تبدیل دادهها به اطلاعات معنادار ]3[. اعتبار کاربر در این بخش طی 2 مرحله، تعیین فعالیت صریح و امتیاز در هر ویژگی، محاسبه میگردد.
4. 4. 1 تعیین موضوعات صریح
اعتبار کاربران شبکههای اجتماعی، باید با توجه به موضوع فعالیت آنها بررسی گردد. زیرا کاربران، در تعداد محدودی از موضوعات معتبر میباشند ]4[. از طرف دیگر، موضوع فعالیت کاربران در این شبکهها نامشخص میباشد. به این دلیل، پیش از ارزیابی اعتبار کاربران باید موضوع فعالیت آنها مشخص گردد. تعیین موضوع فعالیت کاربران پایه و اساس این چارچوب میباشد و به دو زیرمولفه صریح و ضمنی قابل تقسیم میباشد. جهت تشخیص صحیح موضوع فعالیت کاربران، باید هر دو گروه بررسی شوند. موضوع فعالیت صریح کاربران با بررسی موضوع محتوای تولید شده توسط آنها، مشخص میگردد. روشهای تشخیص موضوعات فعالیت صریح براساس مرور ادبیات، در شکل 2 معرفی گردید، که انتخاب این روشها به نوع شبکه اجتماعی وابسته میباشد ]5[.
4. 4. 2 محاسبه امتیاز کاربران برای هر ویژگی
قبل از شروع عملیات این بخش، تعدادی از ویژگیهای شبکه اجتماعی جهت ارزیابی اعتبار کاربران انتخاب میشوند و امتیاز کاربران برای هر یک از این ویژگیها محاسبه میگردد. از طرف دیگر، جعل برخی از این ویژگیها برای کاربران اسپم راحت میباشد، اما جعل تعداد زیادی از آنها تقریبا غیرممکن است ]25[. از این رو، انتخاب صحیح تعداد زیادی از ویژگیهای موثر، متناسب با هدف ارزیابی اعتبار کاربران بسیار مهم میباشد. بنابراین قبل از انجام عملیات این بخش، سیستم دقیقی جهت انتخاب و اولویتبندی ویژگیهای شبکه اجتماعی ارائه گردیده است.
شکل 4. معماری سیستم انتخاب و اولویتبندی به ویژگیها |
انتخاب ویژگی از الزامات پایه این چارچوب میباشد، عدم انتخاب صحیح ویژگیهای شبکههای اجتماعی، مانع از ارزیابی اعتبار کاربران با دقت بالا میگردد. علاوهبر این، جعل نیز امکان پذیر میشود و حتی ممکن است، برخی ویژگیها در موضوعات متفاوت نشاندهندۀ اعتبار یا اسپم باشند ]25[. براساس مرور ادبیات، سیستم انتخاب ویژگی، جهت ارائه بهترین ویژگیها به سه ورودی به شرح اهداف سازمان، شبکه اجتماعی و موضوع فعالیت کاربران نیاز دارد. در شکل 4 معماری این سیستم مشاهده میشود. ورودی اول، اهداف سازمان میباشد، که براساس پاسخ به سوال Q1، مشخص میشود. ورودی دوم، شبکه اجتماعی میباشد. ویژگیها به نوع شبکه اجتماعی وابسته میباشند، یعنی ویژگیهای اعتبار در توئیتر با ویژگیهای اعتبار در فیسبوک یکسان نمیباشند [18]. ورودی سوم موضوع فعالیت کاربران میباشد. به طور مثال در برخی از موضوعات نرخ بازنشر پستها، ویژگی قدرتمندی برای ارزیابی اعتبار کاربران میباشد. اما در سایر موضوعات این ویژگی فاقد اهمیت میباشد ]29[.
با توجه به تنوع بالاء ویژگیهای شبکههای اجتماعی، برای انتخاب و اولویتبندی سادهتر آنها، یک ساختار سلسله مراتب در شکل 5 براساس 4 سطح پیشنهاد گردیده است. در این ساختار، امتیاز هر سطح با توجه به سطح بالاتر، محاسبه میشود. سطح صفر، هدف این سیستم یعنی انتخاب بهترین ویژگیها میباشد. سطح اول به بررسی هدف ارزیابی اعتبار کاربران میپردازد. سطح دوم شامل سه نوع کاربر معتبر (بانفوذ، پشتیبان، متخصص) میباشد و امتیاز هر کاربر براساس سطح اول تعیین میگردد. سطح سوم، شامل گروههای ویژگی شبکه
شکل 5. ساختار سلسله مراتبی انتخاب و اولویتبندی به ویژگیها |
[1] Application Programming Interface (API)
[2] Stemmer
[3] Lemmatizer
4. 7 نرمالسازی اعتبار
|
| |
الف) شباهت معنایی | ب) تئوری هموفیلی | |
شکل 6. پیشبینی اعتبار کاربران براساس شباهت معنایی و تئوری هموفیلی
|
نرمالسازی اعتبار، به معنی تبدیل میزان اعتبار کاربران به مقادیر قابل فهم، برای عموم افراد میباشد. به این منظور، یک سازمان برای تحلیل نتایج به نیروی متخصص نیاز نخواهد داشت ]35[.
8.4 ذخیرهسازی
ذخیرهسازی از الزامات پایهای چارچوب میباشد، که جهت حفظ صحت و ذخیرۀ حجم عظیمی از دادهها باید انبار داده مناسب استفاده شود .
4. 9 بهروزرسانی اعتبار
بهدلیل ماهیت ناشناس و سریع ارتباطات آنلاین، اعتماد به کاربران پویا و گذرا میباشد ]12[. همچنین، معمولا کاربران اسپم، در بازۀ زمانی کوتاهی، خود را معتبر معرفی مینمایند. به این منظور، باید اطلاعات کاربران در بازههای زمانی متفاوت، جمعآوری و تحلیل گردد و براین اساس نتایج ارزیابی آنان، بهروزرسانی خواهد شد ]15[.
5. بحث
شبکههای اجتماعی، بهدلیل سرعت انتشار و نیز حجم بالا اطلاعات به عنوان یکی از مهمترین منابع اطلاعاتی خارجی در سازمانها استفاده میشوند. این شبکهها به دلیل عدم نظارت، احتمالا شامل اطلاعات ناصحیح و نامعتبر میباشند. به این منظور پیش از بهرهبرداری از اطلاعات شبکههای اجتماعی، ارزیابی اعتبار آنها بسیار پراهمیت میباشد. اعتبار اطلاعات در این شبکهها با بررسی ویژگیهای آنها مانند تعداد فالورها و سن حساب کاربری قابل ارزیابی میباشد. بهترین نوع ارزیابی اعتبار اطلاعات در این شبکهها، بررسی اعتبار کاربران است، زیرا علاوه بر ویژگیهای کاربران، ویژگیهای محتوای منتشر شده نیز، بررسی میگردد.
بهدلیل اهمیت روز افزون شبکههای اجتماعی و نیز تمایل سریع کاربران نامعتبر به تغییر استراتژیها در پاسخ به اقدامات دفاعی، تحقیقات مرتبط به حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی در حال افزایش میباشد، که این تنوع تحقیقاتی، موجب پراکندگی در مقالات حوزۀ ارزیابی اعتبار اطلاعات گردیده است. از این رو، مقالات این حوزه از برخی از مولفههای اساسی ارزیابی اعتبار اطلاعات، چشم پوشی نمودهاند. همچنین فرآیند درک اعتبار اطلاعات در این شبکهها مبهم میباشند ]12[. براساس مرور ادبیات صورت گرفته در این پژوهش، این مولفهها به 3 مولفۀ اصلی تعیین موضوع محتوا، روشهای انتخاب ویژگی، ارزیابی اعتبار قابل تقسیم میباشند. براساس یافتههای این پژوهش نکاتی که باید در فرآیند ارزیابی اعتبار اطلاعات شبکههای اجتماعی توجه کرد، به شرح ذیل میباشد:
- چارچوب ارزیابی اعتبار کاربران باید براساس چرخۀ حیات BD باشد. زیرا تحلیل اعتبار اطلاعات به صورت آنلاین جهت تحقق اهداف سازمانی، امکانپذیر میگردد ]4[، ]12[، ]15[، ]32[. چارچوب پیشنهادی، این پژوهش براساس چرخه حیات کلان داده، ]3[ طراحی شده است. به صورت کلی این چرخه، شامل 9 گام ارزیابی پرونده تجاری، شناسایی دادهها، جمع آوری و فیلتر کردن دادهها، استخراج دادهها، اعتبارسنجی و پاکسازی دادهها، جمع آوری و نمایش دادهها، تجزیه و تحلیل دادهها، تجسم دادهها و استفاده از نتایج تجزیه و تحلیل میباشد ]3[.
- ارائه یک تعریف روشن از هدف ارزیابی اعتبار اطلاعات، بخصوص در هنگام اعتبارسنجی کاربران به عنوان منابع اطلاعاتی، مهم میباشد. زیرا براساس هدف ارزیابی، تعاریف متفاوتی از کاربران معتبر در ادبیات این حوزه ارائه شده است. این تعاریف منجر به انتخاب و اولویتبندی متفاوت ویژگیهای شبکههای اجتماعی میشود. در تعدادی از مقالات، بررسی اعتبار کاربران و میزان نفوذ آنها، بهعنوان دو حوزۀ تحقیقاتی متفاوت از یکدیگر معرفی شدهاند. از طرفی دیگر، در برخی از مقالات، کاربران معتبر به دو گروه بانفوذ و پشتیبان تقسیم میشوند و تعدادی دیگر، کاربران معتبر را افراد متخصص یک حرفه، میدانند ]12[، ]13[، ]15[، ]25[، ]32[، ]40[. در این راستا، پژوهش فعلی معتقد است، که کاربران معتبر براساس اهداف متنوع ارزیابی اعتبار کاربران در سازمانها تعریف میشود. به این منظور کاربران معتبر به سه گروه بانفوذ، پشتیبان و متخصص قابل تقسیم میباشند.
- با توجه به حجم زیاد اطلاعات، انتخاب یک انبارداده مناسب، جهت حفظ صحت دادهها ضروری میباشد ]4[، ]15[.
- کاربران در تعداد محدودی از موضوعات معتبر میباشند ]4[، ]15[. همچنین برخی از کاربران معتبر، علاقه به تولید محتوا در این شبکهها ندارند] 41[. به این منظور، استفاده از یک روش مناسب، جهت تعیین موضوع فعالیت آنان به صورت صریح و ضمنی، مهم میباشد.
- شبکههای اجتماعی شامل ویژگیهای متنوعی مانند تعداد بازخوردهای مثبت به محتوا، سن حساب کاربری و تعداد فالورها میباشند. انتخاب و اولویتبندی این ویژگیها با توجه به اهداف سازمانی به سه عامل، هدف ارزیابی اعتبار کاربران، موضوع فعالیت آنها و نوع شبکههای اجتماعی مرتبط میباشد ]18[، ]20[، ]28[، ]29[، ]35[. بنابراین، در این پژوهش با توجه به این 3 عامل یک ساختار سلسله مراتبی، برای انتخاب و اولویتبندی ویژگیها پیشنهاد گردیده است. عدم انتخاب صحیح ویژگیها، موجب ارزیابی نادرست کاربران شبکههای اجتماعی میشود ]25[.
- زمان عامل مهمی در فرآیند ارزیابی اعتبار کاربران میباشد. معمولا کاربران اسپم، در یک بازه زمانی محدود، معتبر میباشند ]25[. به این منظور اعتبار کاربران باید در طی گذر زمان محاسبه گردد ]12[، ]15[، ]35[.
- برخی از کاربران، در حال حاضر در تعدادی از موضوعات فعالیتی ندارند، اما در آینده به افراد تاثیرگذاری در آن موضوعات تبدیل خواهند شد ]30[، ]41[. در این راستا، پیشبینی اعتبار کاربران در آینده، در موضوعات متنوع مهم میباشد.
- نتایج ارزیابی اعتبار اطلاعات در شبکههای اجتماعی، باید برای عموم قابل فهم باشد. زیرا معمولا در سازمانها افراد غیرمتخصص، نتایج را مورد بررسی قرار میدهند ]35[.
چارچوب پیشنهادی این مقاله، با تمرکز بر ارزیابی اعتبار کاربران، براساس نکات مذکور ارائه گردیده است. شکل 7 میزان استفاده از زیر مولفههای را نمایش میدهد. براساس این شکل، مقالات این حوزه، به زیرمولفه تعیین موضوع فعالیت کاربران به صورت صریح، بیشترین توجه را داشتهاند. به این منظور نتیجه گیری میشود، که بیشتر مقالات این حوزه، به این آگاهی دست یافتهاند، که تعیین اعتبار کاربران بدون در نظر گرفتن موضوع فعالیت آنان فاقد ارزش میباشد. همچنین این مقالات به پیشبینی اعتبار کاربر در آینده، تعیین موضوع فعالیت کاربر به صورت ضمنی و بررسی اعتبار در گذر زمان توجه کمتری داشتهاند. همچنین، انتخاب ویژگی یکی از مولفههای مهم ارزیابی اعتبار اطلاعات میباشد. از طرف دیگر، بیشترمقالات این حوزه، با استفاده از مرور ادبیات و بدون تحلیل تاثیر ویژگیها بر نتایج ارزیابی اعتبار اطلاعات، ویژگیها را انتخاب نمودهاند و تعداد مقالات کمی اشاره داشتهاند، که انتخاب ویژگی به موضوع فعالیت کاربران، هدف سازمان از ارزیابی اعتبار اطلاعات و نوع شبکه اجتماعی وابسته میباشد ]14[،]18[، ]20[، ]28[، ]29[، ]35[. از این رو، در کنار چارچوب اولیه، یک ساختار جهت انتخاب و اولویتبندی ویژگیها پیشنهاد گردید.
به این ترتیب، منبع استخراج مولفههای چارچوب پیشنهادی و روش توسعه آن معرفی گردید. این مقاله با بازنگری مختصری از مقالات حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی به یک چارچوب اولیه جهت ارزیابی اعتبار کاربران در جهت اهداف سازمانی دست یافت. به این منظور، این پژوهش راهنمای مناسب برای اندازهگیری اعتبار کاربران (منابع اطلاعاتی) در فرآیند تصمیمگیری سازمانها میباشد.
شکل 7. اهمیت زیرمولفهها در مقالات |
6. نتیجهگیری
در این پژوهش تلاش شد، که براساس روشها و مفاهیم موجود در ادبیات حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی در سطوح متفاوت، یک چارچوب اولیه جهت ارزیابی اعتبار کاربران براساس چرخه حیات کلان داده و اهداف متنوع سازمانی ارائه شود، که نمونۀ این چارچوب در کارهای پیشین دیده نشده است. برای این منظور 50 مقاله مرتبط به حوزۀ ارزیابی اعتبار اطلاعات شبکههای اجتماعی در سطوح متفاوت، بررسی شد. براساس یافتههای این پژوهش:
- فرآیند ارزیابی اعتبار کاربران شبکههای اجتماعی، تابعی از مولفههای مهم میباشند، که این مولفهها به 3 مولفه اصلی (تعیین موضوع محتوا، انتخاب ویژگی و ارزیابی اعتبار اطلاعات) قابل تقسیم میباشند، که شامل کل فرآیند ارزیابی اعتبار کاربران از ابتدا تا انتها میباشد.
- مولفۀ تعیین موضوع شامل صریح و ضمنی میباشد. مولفه انتخاب ویژگی شامل زیرمولفه، سیستم انتخاب ویژگی است و مولفه ارزیابی اعتبار شامل زیرمولفههای، محاسبه اعتبار، پیشبینی اعتبار در آینده، بررسی اعتبار در گذر زمان، قابلیت فهم آسان نتایج میباشد.
- کاربران معتبر شبکههای اجتماعی، متناسب با اهداف سازمانی شامل کاربران متخصص، پشتیبان و بانفوذ میباشند و ویژگیهای آنها براساس این اهداف به 7 گروه به شرح اطلاعات کلی، فعالیت، محتوا، انتشار، پشتیبان، محبوبیت و تخصص قابل تقسیم میباشد. از این رو، در این چارچوب، یک ساختار برای انتخاب ویژگیها پیشنهاد شده است، زیرا انتخاب و اولویتبندی ویژگیها باید با اهداف متعدد سازمانی سازگار باشد.
- شبکههای اجتماعی پویا میباشند و با سرعت و حجم بالا داده تولید مینمایند و تحلیل اعتبار کاربر حساس به زمان و گذارا است. از این رو، چارچوب ارزیابی اعتبار کاربران باید براساس چرخۀ حیات کلان داده طراحی شود.
از آن جهت که هر کار پژوهشی محدودیتهایی دارد، در این مقاله نیز امکان پیادهسازی تمام مولفهها در سازمانها با اهداف متفاوت غیرممکن میباشد، بنابراین تنها مفروضات براساس مرورادبیات در نظر گرفته شده است. اما پیشنهاد میگردد تا در پژوهش های آتی چارچوب پیشنهادی بر روی یک شبکه اجتماعی پویا در دنیای واقعی با تمرکز بر روی یک هدف سازمانی پیادهسازی شود. همچنین با استفاده از ترکیب ابزارهای هوش مصنوعی و سیستم تصمیمگیری چند معیاره یک سیستم انتخاب ویژگی ارزیابی اعتبار کاربران براساس اهداف متفاوت سازمانی پیادهسازی گردد. نتایج این چارچوب پیشنهادی میتواند، به سازمانها کمک نماید از طریق شناسایی و مدیریت کاربران معتبر، به منابع معتبر اطلاعاتی قابل اطمینان دست یابند و تصمیمات بهتری اتخاذ نمیاند. همچنین نتایج این مقاله به عنوان پایهای برای تحقیقات آتی میباشد و فرآیند درک اعتبار اطلاعات در این شبکهها را روشن مینماید.
مراجع
]1[روجیار پیرمحمدیانی ، شهریار محمدی ، معیارهای ارزیابی ارزش اثرگذاری کاربران رسانه های اجتماعی چارچوبی براساس کاوش رسانه های اجتماعی ، فناوری اطلاعات و ارتباطات ایران ، سال یازدهم شماره ی 39 و 40 ، صفحه 109-125،1398
[2] Peng, S., Zhou, Y., Cao, L., Yu, S., Niu, J. and Jia, W., 2018. Influence analysis in social networks: A survey. Journal of Network and Computer Applications, 106, pp.17-32.
[3] Erl, T., Khattak, W. and Buhler, P., 2016. Big data fundamentals: concepts, drivers & techniques (Vol. 1). Boston: Prentice Hall.
[4] Abu-Salih, B., Bremie, B., Wongthongtham, P., Duan, K., Issa, T., Chan, K.Y., Alhabashneh, M., Albtoush, T., Alqahtani, S., Alqahtani, A. and Alahmari, M., 2019, March. Social credibility incorporating semantic analysis and machine learning: a survey of the state-of-the-art and future research directions. In Workshops of the International Conference on Advanced Information Networking and Applications (pp. 887-896). Springer, Cham.
[5] Alrubaian, M., Al-Qurishi, M., Alamri, A., Al-Rakhami, M., Hassan, M.M. and Fortino, G., 2018. Credibility in online social networks: A survey. IEEE Access, 7, pp.2828-2855.
[6] Al-Garadi, M.A., Varathan, K.D., Ravana, S.D., Ahmed, E., Mujtaba, G., Khan, M.U.S. and Khan, S.U., 2018. Analysis of online social network connections for identification of influential users: Survey and open research issues. ACM Computing Surveys (CSUR), 51(1), pp.1-37.
[7] Keller, J., Wong, S.S. and Liou, S., 2020. How social networks facilitate collective responses to organizational paradoxes. Human Relations, 73(3), pp.401-428.
[8] Olszak, C.M., Bartuś, T. and Lorek, P., 2018. A comprehensive framework of information system design to provide organizational creativity support. Information & Management, 55(1), pp.94-108.
[9] Siciliano, M.D. and Thompson, J.R., 2018. If you are committed, then so am I: The role of social networks and social influence on organizational commitment. Administration & Society, 50(7), pp.916-946.
[10] Abbasimehr, H., Nourani, E. and Shabani, M., 2020. A hybrid framework for ranking reviewers based on interval type-2 fuzzy AHP and VIKOR. International Journal of Intelligent Engineering Informatics, 8(2), pp.95-116.
[11] Morris, M.R., Counts, S., Roseway, A., Hoff, A. and Schwarz, J., 2012, February. Tweeting is believing? Understanding microblog credibility perceptions. In Proceedings of the ACM 2012 conference on computer supported cooperative work (pp. 441-450).
[12] Alkhamees, M., Alsaleem, S., Al-Qurishi, M., Al-Rubaian, M. and Hussain, A., 2021. User trustworthiness in online social networks: A systematic review. Applied Soft Computing, 103, p.107159.
[13] Tabassum, S., Pereira, F.S., Fernandes, S. and Gama, J., 2018. Social network analysis: An overview. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 8(5), p.e1256.
[14] Weerkamp, W. and de Rijke, M., 2012. Credibility-inspired ranking for blog post retrieval. Information retrieval, 15(3-4), pp.243-277.
[15] Abu-Salih, B., Wongthongtham, P., Chan, K.Y. and Zhu, D., 2019. CredSaT: Credibility ranking of users in big social data incorporating semantic analysis and temporal factor. Journal of Information Science, 45(2), pp.259-280.
[16] Saikaew, K.R. and Noyunsan, C., 2015. Features for measuring credibility on facebook information. International Scholarly and Scientific Research & Innovation, 9(1), pp.174-177.
[17] Afify, E., Sharaf Eldin, A., E Khedr, A. and Kamal Alsheref, F., 2019. User-generated content (UGC) credibility on social media using sentiment classification. النشرة المعلوماتیة فی الحاسبات والمعلومات, 1(1), pp.1-19.
[18] Arora, A., Bansal, S., Kandpal, C., Aswani, R. and Dwivedi, Y., 2019. Measuring social media influencer index-insights from Facebook, Twitter and Instagram. Journal of Retailing and Consumer Services, 49, pp.86-101.
[19] Boididou, C., Papadopoulos, S., Zampoglou, M., Apostolidis, L., Papadopoulou, O. and Kompatsiaris, Y., 2018. Detection and visualization of misleading content on Twitter. International Journal of Multimedia Information Retrieval, 7(1), pp.71-86.
[20] Pasi, G., De Grandis, M. and Viviani, M., 2020, July. Decision making over multiple criteria to assess news credibility in microblogging sites. In 2020 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE) (pp. 1-8). IEEE.
[21] Hershkovitz, A. and Hayat, Z., 2020. The role of tie strength in assessing credibility of scientific content on facebook. Technology in Society, 61, p.101261
[22] Gupta, S., Sachdeva, S., Dewan, P. and Kumaraguru, P., 2018, December. CbI: Improving Credibility of User-Generated Content on Facebook. In International Conference on Big Data Analytics (pp. 170-187). Springer, Cham.
[23] Devi, P.S. and Karthika, S., 2019. # CycloneGaja-rank based credibility analysis system in social media during the crisis. Procedia Computer Science, 165, pp.684-690.
[24] Setiawan, E.B., Widyantoro, D.H. and Surendro, K., 2020. Measuring information credibility in social media using combination of user profile and message content dimensions. International Journal of Electrical & Computer Engineering (2088-8708), 10(4).
[25] Son, J., Lee, J., Oh, O., Lee, H.K. and Woo, J., 2020. Using a Heuristic-Systematic Model to assess the Twitter user profile’s impact on disaster tweet credibility. International Journal of Information Management, 54, p.102176.
[26] Evans, L., Owda, M., Crockett, K. and Vilas, A.F., 2021. Credibility assessment of financial stock tweets. Expert Systems with Applications, 168, p.114351.
[27] Momen Bhuiyan, M., Horning, M., Lee, S.W. and Mitra, T., 2021. NudgeCred: Supporting News Credibility Assessment on Social Media Through Nudges. arXiv e-prints, pp.arXiv-2108.
[28] Thaher, T., Saheb, M., Turabieh, H. and Chantar, H., 2021. Intelligent detection of false information in arabic tweets utilizing hybrid harris hawks based feature selection and machine learning models. Symmetry, 13(4), p.556.
[29] Cano, A.E., Mazumdar, S. and Ciravegna, F., 2014. Social influence analysis in microblogging platforms–a topic-sensitive based approach. Semantic Web, 5(5), pp.357-372.
[30] Hamzehei, A., Wong, R.K., Koutra, D. and Chen, F., 2019. Collaborative topic regression for predicting topic-based social influence. Machine Learning, 108(10), pp.1831-1850
[31] Zhao, L., Hua, T., Lu, C.T. and Chen, R., 2016. A topic-focused trust model for Twitter. Computer Communications, 76, pp.1-11.
[32] Diaz-Garcia, J.A., Ruiz, M.D. and Martin-Bautista, M.J., 2022. NOFACE: A new framework for irrelevant content filtering in social media according to credibility and expertise. Expert Systems with Applications, 208, p.118063.
[33] Assery, N., Xiaohong, Y.D., Xiuli, Q., Kaushik, R. and Almalki, S., 2021. Evaluating disaster-related tweet credibility using content-based and user-based features. Information Discovery and Delivery, 50(1), pp.45-53.
[34] O'Brien, K., Simek, O. and Waugh, F., 2019, January. Collective classification for social media credibility estimation. In Proceedings of the 52nd Hawaii International Conference on System Sciences.
[35] Embar, V.R., Bhattacharya, I., Pandit, V. and Vaculin, R., 2015, August. Online topic-based social influence analysis for the wimbledon championships. In Proceedings of the 21th ACM SIGKDD international conference on knowledge discovery and data mining (pp. 1759-1768).
[36] bin Baharudin, B. and bin Md Said, A., 2018. Trust blog ranking using multi-criteria decision analysis AHP and TOPSIS. In IT Convergence and Security 2017 (pp. 68-76). Springer, Singapore.
[37] Pasi, G., Viviani, M. and Carton, A., 2019. A Multi-Criteria Decision Making approach based on the Choquet integral for assessing the credibility of User-Generated Content. Information Sciences, 503, pp.574-588.
[38] Alrubaian, M., Al‐Qurishi, M., Al‐Rakhami, M., Hassan, M.M. and Alamri, A., 2017. Reputation‐based credibility analysis of Twitter social network users. Concurrency and Computation: Practice and Experience, 29(7), p.e3873.
[39] Verma, P.K., Agrawal, P., Madaan, V. and Gupta, C., 2022. UCred: fusion of machine learning and deep learning methods for user credibility on social media. Social Network Analysis and Mining, 12(1), pp.1-10.
[40] Khan, T. and Michalas, A., 2021. Seeing and Believing: Evaluating the Trustworthiness of Twitter Users. IEEE Access, 9, pp.110505-110516.
[41] Zarrinkalam F, Kahani M, Bagheri E. Mining user interests over active topics on social networks. Information Processing & Management. 2018 Mar 1;54(2):339-57.
[42] Viviani, M. and Pasi, G., 2017. Credibility in social media: opinions, news, and health information—a survey. Wiley interdisciplinary reviews: Data mining and knowledge discovery, 7(5), p.e1209.
[43] Zhao, K., Xing, L. and Wu, H., 2021. S3UCA: Soft-Margin Support Vector Machine-Based Social Network User Credibility Assessment Method. Mobile Information Systems, 2021.
[44] Przybyła, P. and Soto, A.J., 2021. When classification accuracy is not enough: Explaining news credibility assessment. Information Processing & Management, 58(5), p.102653.
[45] Qureshi, K.A., Malick, R.A.S. and Sabih, M., 2021. Social Media and Microblogs Credibility: Identification, Theory Driven Framework, and Recommendation. IEEE Access, 9, pp.137744-137781.
[46] Jain, P.K., Pamula, R. and Ansari, S., 2021. A supervised machine learning approach for the credibility assessment of user-generated content. Wireless Personal Communications, 118(4), pp.2469-2485.
[47] Zaslavsky, A. and Paris, C., 2012. Context-aware twitter validator (CATVal): A system to validate credibility and authenticity of twitter content for use in decision support systems. In Fusing Decision Support Systems into the Fabric of the Context (pp. 323-334). IOS Press.
[48] Sikdar, S., Adali, S., Amin, M., Abdelzaher, T., Chan, K., Cho, J.H., Kang, B. and O'Donovan, J., 2014, July. Finding true and credible information on Twitter. In 17th International Conference on Information Fusion (FUSION) (pp. 1-8). IEEE.
[49] Page, J.T. and Duffy, M.E., 2018. What does credibility look like? Tweets and walls in US presidential candidates’ visual storytelling. Journal of political Marketing, 17(1), pp.3-31.
[50] Yin, C. and Zhang, X., 2020. Incorporating message format into user evaluation of microblog information credibility: A nonlinear perspective. Information processing & management, 57(6), p.102345.
[51] Kitsios, F., Mitsopoulou, E., Moustaka, E. and Kamariotou, M., 2022. User-Generated Content behavior and digital tourism services: A SEM-neural network model for information trust in social networking sites. International Journal of Information Management Data Insights, 2(1), p.100056.
پیوست
در جداول الف و ب، مجموعه ویژگیهای شبکههای اجتماعی جهت ارزیابی اعتبار اطلاعات معرفی شدهاند. که این ویژگیها براساس مرور ادبیات جمعآوری گردیده است.
جدول الف. مجموعه اول ویژگیهای شبکه اجتماعی
گروه | ویژگیها |
اطلاعات کلی | داشتن بیوگرافی (]10[، ]19[، ]28[، ]33[)، احساسات بیوگرافی (]24[)، نام کاربری (]11[، ]22[، ]24[، ]26[، ]28[، ]33[)، داشتن ایمیل (]22[)، تصویر پروفایل (]19[ ،]26[، ]11[، ]28[، ]37[)، تعداد گروههای عضو شده (]22[، ]28[، ]32[، ]39[، ]40[)، تعداد لینکها پروفایل (]22[، ]28[)، نوع ثبت نام (]28[)، موقعیت مکانی منتشر شده در پروفایل (]22[)، تم پروفایل (]22[)، تعداد زبانهای استفاده شده (]22[، ]39[) |
فعالیت | سن حساب کاربری (]10[، ]15[، ]17[، ]19[، ]22[، ]24[، ] 26 [، ]20[، ]33[، ] 34 [)،تعداد فالوئینگ (]17[، ]19[، ]24[، ]26[، ]33[، ]34[، ]39[، ]40[)، نظم در ارسال محتوا (]19[،]26[،]22[،]14[،]10[، ]28[)، تعداد محتوا و بازنشرها (]28[، ]33[)، تاریخ انتشار محتوا (]33[)، تعداد محتوا (]10[، ]36[، ]40[) |
تخصص | تعداد موضوعات مورد علاقه کاربر (]18[، ]32[، ]35[، ]39[)،تاییدیه حساب کاربری ( ]19[، ]22[، ]26[، ]11[، ]24[، ]28[، ]33[)، بررسی وب سایت کاربر (]22[، ]24[، ]26[، ]27[)، محتوایهای منحصربهفرد (]15[،]34[)، لینکهای منحصربهفرد (]34[)،شباهت محتوا با یک منبع معتبر (]14[،]31[)، نزدیکی مکان محتوا به موقعیت رویداد (]16[،]31[)، نزدیکی زمان محتوا با رویداد (]14[،]31[)، تعداد لینکهای هر محتوا (]17[، ]19[، ]26[، ]22[، ]34[،] 37[، ]16[، ]24[، ]25[، ]28[، ]33[، ]40[)، تعداد موضوع هر محتوا (]25[)،تعداد دفعاتی که نظر کاربر مورد پسند قرار گرفته است (]18[،]24[)، کلمات کلیدی (]28[)، نسبت تعداد محتوا منتشر شده توسط کاربر نسبت به سایر کاربران در یک حوزه خاص (]10[)، انتشار موقعیت در ارسال محتوا (]16[) |
جدول ب. مجموعه دوم ویژگیهای شبکه اجتماعی
گروه | ویژگیها |
محتوا | تعداد کلمات بیوگرافی (]22[، ]24[، ]26[)،تعداد جملات در بیوگرافی (]22[، ]24[)، طول بیوگرافی (]28[)، میانگین طول کلمات در بیوگرافی (]22[)، تعداد کلمات توقف در بیوگرافی (]22[)، تعداد کلمات منحصر به فرد در بیوگرافی (]22[)، تعداد کلمات اسپم (]24[)، تعداد محتوای اسپم (]14[)، طول محتوا (]17[،]19[، ]23[، ]22[، ]26[،]14[،]24[،]28[، ]33[، ]37[)، تعداد علائم نگارشی (]19[،]24[،]14[)، محتواهای دارای علامت سوال (]19[،]26[،]28[، ]34[)، محتواهای دارای علامت تعجب (]19[،]26[،]28[، ]34[)، محتواهای دارای ایموجی (]19[،]26[،]22[،]34[،]24[،]14[)، محتواهای دارای ضمیر اول شخص (]19[،]26[،]34[)، محتواهای دارای ضمیر دوم شخص (]26[)، محتواهای دارای ضمیر سوم شخص (]26[)، تعداد کلمات با حروف بزرگ (]19[،]26[،]22[،]14[)، تعداد کلمات توقف (]22[)، تعداد غلطهای املایی (]14[)، تعداد کلمات کوتاه عامیانه (]26[،]22[،]24[،]14[، ]19[)، محتواها با افعال زمان گذشته (]26[)، محتواها با افعال زمان حال(]26[)، تعداد صفات در هر محتوا (]26[)، تعداد قید در هر محتوا (]26[)، تعداد کلمات مانند لطفا، تشکر (]19[)، میزان خوانایی محتوا (]19[)، ارزیابی اعتبار لینک محتوا (]19[، ]26[، ]33[)، تعداد علامت سوال در نظرات (]27[)، احساسات مخاطبین در پاسخ به محتوا کاربر (]18[)،تعداد کلمات محتوا (]19[، ]26[،]22[، ]23[، ]34[،]24[،]25[، ]28[)، تعداد علامت هشتگ (]28[)،احساسات محتوا (]15[،]17[،]38[،]19[،]22[،]20[،]24[، ]28[، ]40[)، تعداد تصاویر (]16[، ]22[)، تعداد ویدیوها (]16[، ]22[)، میانگین طول کلمات محتوا (]22[) |
پشتیبان | تعداد بازنشر محتوا سایر کاربران (]17[، ]26[، ]28[، ]29[ ،]30[، ]31[، ]32[، ]33[، ]34[، ]37[)، تعداد محتوایی که کاربر پسندیده است (]30[)، تعداد نظرات کاربر (]15[، ]22[، ]31[) |
محبوبیت | تعداد فالور (]10[، ]17[،]18[،]36[،]38[،]19[،]29[،]35[،]26[،]22[،]30[،]34[،]20[،]24[،]31[،]37[، ]28[، ]32[، ]33[، ]39[، ]40[)، نسبت فالور به فالوئینگ (]15[،]19[، ]28[)، نسبت فالوئینگ به فالور (]28[) تعامل مخاطبین با کاربر در بازههای زمانی متفاوت (]18[،]25[، ]35[)، تعداد پاسخ برای هر محتوا (]14[،]16[،]18[، ]22[، ]35[)،احساسات مخاطبین هنگام ذکر نام کاربر در محتوا (]18[،]24[)، تعداد دفعاتی که محتواهای کاربر توسط سایرین به اشتراک گذاشته شده است (]15[،]17[،]38[،]18[،]35[،]16[،]24[، ]40[)، تعداد بازخوردهای مثبت محتوا (]15[،]17[،]18[،]16[،]24[،]25[، ]33[، ]40[)، تعداد بازدیدکنندگان محتوا (]10[، ]36[) |
انتشار | تعداد هشتگهای هر محتوا (]16[، ]17[، ]19[، ]24[، ]25[، ]26[، ]28[، ]33[)،تعداد دفعاتی که از نام سایر کاربران در محتواها استفاده شده (]19[، ]38[، ]29[، ]35[، ]26[، ]34[، ]25[،]24[، ]28[، ]37[)، هشتگهای موجود در بیوگرافی (]28[) |