Improvement payment loan concerning financial discipline and maximum gain in uncertainly
Subject Areas :Mohammad Ali Afshar Kazemi 1 , Mohammadali Afsharkazemi 2 , Abbas Toloei Eshlaghy 3 , Ezattollah Asgharizadeh 4
1 -
2 - Associate Professor of Industrial Management, Islamic Azad University, Science and Research Unit, Tehran, Iran
3 - Full Professor of Industrial Management, Islamic Azad University, Faculty of Science and Research, Tehran, Iran
4 -
Keywords: Facilities, Data Mining, Deep learning, Clustering, CNN, CNN-LSTM.,
Abstract :
Granting facilities is an important part of every bank's operations. This part of banking activities is economically important. With its operations, banks can provide the transfer of resources from those that have directly invested to those who need money, this repayment makes another people use these resources. Failure to repay facilities on time will cause the bank's resources to stagnate and in the long will cause the country's economic recession. It is important to monitor the correct allocation of resources because if bank resources are used and unfounded payments are made, the banks will not be able to pay the depositors and will become bankrupt. By examining the researches in the field of banking, it was found that most of the researches have focused on the optimal combination of the investment portfolio in the capital market, and less researchers have paid attention to the discussion of the optimal combination in the money market. Most of the researches that used operational and statistical research methods were related to industrial issues, and less in financial issues and operational research discussions were used. In the optimal portfolio of the combination of facilities or investments, mostly the genetic algorithm has been used and less than other fuzzy methods have been used in the conditions of uncertainty. Therefore, in this research, the improvement of facility payment modeling has been addressed by using convolutional neural networks and CNN-LSTM modeling.
اصغر پور، حسین، (۱۳۸۸). اثر بي ثباتي سياسي بر رشد اقتصادي ايران: رهيافت غيرخطي APARCH .
خواجوی، شکراله ، غیوری مقدم، علی، (۱۳۹۲). بررسی کاربرد تحلیل پوششی دادهها در مقایسه و ارزیابی عملکرد واحدهای تجاری.
دامی، سینا ، خیری، فرشته،(۱۳۹۷). شناسایی تقلب در پرداخت کارت های اعتباری با شبکه عصبی حافظه طولانی کوتاه مدت (LSTM). سومین کنفرانس ملی فناوری در مهندسی برق و کامپیوتر
راعی، رضا، فرهادی، روح الله، شیروانی، امیر، (۱۳۹۰). رابطه در گذر زمان بین بازده و ریسک: شواهدی از الگوی قیمت گذاری دارایی سرمایه ای در گذر زمان ICAPM، فصلنامه چشم انداز مدیریت مالی دانشگاه شهید بهشتی، تهران.
شریف فر، امیر، خلیلی عراقی، مریم، رئیسی وانانی، ایمان، فلاح شمس، میر فیض،(۱۴۰۱). کاربرد معماریهای یادگیری عمیق در پیشبینی قیمت سهام (رویکرد شبکه عصبی پیچشی CNN)، دوره ۱۰، شماره ۳، صفحه ۱-۲۰.
صالحی، فهمیه، صالحی، مجتبی،اسکندری، میثم(۱۳۹۳). بهینه سازی سبد تسهیلات اعطایی موسسات مالی با استفاده از برنامه ریزی ریاضی و الگوریتم ژنتیک (مطالعه موردی بانک تجارت)، فصلنامه توسعهی مدیریت پولی و بانکی، دوره۲، شماره۳.
عسگر زاده، مجید،و دیگران، (۱۳۸۶). بررسی ریسک عملیاتی بانکداری الکترونیکی یکپارچه و ارائهی راهکارهای کاهش مخاطرات آن، اولین کنفرانس جهانی بانکداری الکترونیک.
References
Ansari, A., Riasi,A., (2016). Customer Clustering Using a Combination of Fuzzy C-Means and Genetic Algorithms.
Adnan et al, R.M., (2020). Least square support vector machine and multivariate adaptive regression splines for streamflow prediction in mountainous basin using hydro-meteorological data as inputs,J. Hydrol.
Armantier, O., Ghysels, E., Sarkar, A., Shrader, J., (2015). Discount window stigma during the 2007-2008 financial crisis. J. Financ. Econ. 118 (2), 317–335.
Al Machot,F. et al., (2019). A deep-learning model for subject-independent human emotion recognition using electrodermal activity sensors.
Bock, H., (2007). Clustering methods: A history of k-means algorithms Selected Contributions in Data Analysis and Classification, . 161-172.
Bhandari, P., (2022). Missing Data | Types, Explanation, & Imputation. Revised on November 11, 2022.
Bernanke, B., ( 2009). The federal reserve's balance sheet: an update. In: A Speech at the Federal Reserve Board Conference on Key Developments in Monetary Policy, Washington, D.C.
Bose, I., Chen, X., (2015). Detecting the migration of mobile service customers using fuzzy clustering.
Chen, X.D., (2017). Analysis and research of common clustering algorithm in data miningDigital Technol. Appl., pp. 151-152.
Du S., Li J., (2019). Parallel processing of improved knn text classification algorithm based on Hadoop. In: 2019 7th International Conference on Information, Communication and Networks (ICICN), 167-170.
Dormann et al, C.F., (2013). Collinearity: a review of methods to deal with it and a simulation study evaluating their performance.
Estivill-Castro V., Houle M.E., (2001). Robust distance-based clustering with applications to spatial data mining,Algorithmica, 30 (2) , 216-242.
Guo,G., Wang, H., Bell, D., Greer, Y., (2003). KNN model-based approach in classificationOTM Confederated International Conferences on the Move to Meaningful Internet Systems, 986-996.
Howell, E., (2021). 4 Techniques To Deal With Missing Data in Datasets, Simple methods that can nullify the effects of missing values, Published in Towards Data Science, Sep 17.
Huang, X.Y. , (2018). An improved KNN algorithm and its application in real-time car-sharing prediction., Dalian University of Technology, Daian, China ,M.S. thesis.
Huang et al., Huang J., Wei Y., Yi J., Liu M., (2018). An improved KNN based on class contribution and feature weighting. In: 2018 10th International Conference on Measuring Technology and Mechatronics Automation (ICMTMA), 313-316.
Henderi, T., Wahyuningsih, T., Rahwanto, E., (2021). ComparisonofMin-MaxnormalizationandZ-ScoreNormalizationintheK-nearest neighbor (KNN) Algorithm to The Accuracy of Type Breast Cance, International Journal of Informatics and Information SystemVol.4,NO.1,13-20.
Khosroyani, M., Heydarpoor, F., Yaghoob-nezhad, A., & Poorzamani, Z., (2022). An artificial neural network model for predicting the liquidity risk of Iranian private banks. Int. J. Nonlinear Anal. In Press, 1–11 ISSN: 2008-6822 (electronic); http://dx.doi.org/10.22075/ijnaa.2022.29118.4071. [In Persian].
Khalila,S, Amritb, CH, Kocha, T, Dugundjia, E.,(2021). Forecasting public transport ridership: Management of Information system by using CNN and LSTM Architecture, The 12th International Conference on Ambient Systems, Networks and Technologies (ANT).
Krizhevsky, A., Sutskever, I., Hinton, G.E., )2017(. Imagenet classification with deep convolutional neural networks. Communications of the ACM 60, 84 – 90. URL: https://search-ebscohost-com.proxy.uba.uva.nl:2443/login.aspx?direct=true&db=buh&AN= 123446102&site=ehost-live&scope=site.
Mohammadi, N., Zangeneh, M., (2016). Customer credit risk assessment using artificial neural networksIJ Information Technology and Computer Science, 8 (3) , 58-66.
Ngufor, C., Van Houten, H., Caffo, B.S., Shah, N.D., McCoy, R.G.,(2019). Mixed Effect Machine Learning: a framework for predicting longitudinal change in hemoglobin A1cJ. Biomed. Inform, 56-67
Ole Hjelkrem.L , Eilif de Lange.P., (2023). Explaining Deep Learning Models for Credit Scoring with SHAP: A Case Study Using Open Banking Data, J. Risk Financial Management., 16(4), 221; https://doi.org/10.3390/jrfm16040221.
Oquab, M., Bottou, L., Laptev, I., Sivic, J., (2014). Learning and Transferring Mid-Level Image Representations using Convolutional Neural Networks, in: IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, United States. URL: https://hal.inria. fr/hal-00911179. conference version of the paper.
MODIRIAT-E-FRDA JOURNAL ISSN 2228-6047 |
Improvement payment loan concerning financial discipline and maximum gain in uncertainly
http://orcid.org/0000-0002-7520-7482 1
http://orcid.org/0000-0003-4327-8320 2
http://orcid.org/0000-0002-4420-3059 3
http://orcid.org/0000-0001-7048-9065 4
1. Roya Cheshmikhani
2. Mohammad Ali Afshar Kazemi
3. Abbas Toluie Ashlaghi
4. Ezatollah Asgharizadeh
Article Info | ABSTRACT |
Article type: Research Article
Keywords: Facilities, Data Mining, Deep learning, Clustering, CNN, CNN-LSTM. | Granting facilities is an important part of every bank's operations. This part of banking activities is economically important. With its operations, banks can provide the transfer of resources from those that have directly invested to those who need money, this repayment makes another people use these resources. Failure to repay facilities on time will cause the bank's resources to stagnate and in the long will cause the country's economic recession. It is important to monitor the correct allocation of resources because if bank resources are used and unfounded payments are made, the banks will not be able to pay the depositors and will become bankrupt. By examining the researches in the field of banking, it was found that most of the researches have focused on the optimal combination of the investment portfolio in the capital market, and less researchers have paid attention to the discussion of the optimal combination in the money market. Most of the researches that used operational and statistical research methods were related to industrial issues, and less in financial issues and operational research discussions were used. In the optimal portfolio of the combination of facilities or investments, mostly the genetic algorithm has been used and less than other fuzzy methods have been used in the conditions of uncertainty. Therefore, in this research, the improvement of facility payment modeling has been addressed by using convolutional neural networks and CNN-LSTM modeling.
|
|
بهبود پرداخت تسهيلات با در نظر گرفتن انضباط مالي و حداكثر سودآوري در شرايط عدم اطمينان
رویا چشمیخانی1، محمد علی افشار کاظمی2، عباس طلوعی اشلقی3، عزتالله اصغریزاده4
چکیده
اعطاي تسهيلات، بخش مهمي از عمليات هر بانك را تشكيل ميدهد و اين قسمت از فعاليتهاي بانكي از لحاظ اقتصادي حائز اهميت است. بانكها با عمليات اعتباري خود موجبات انتقال منابع را از اشخاصي كه مستقيماً در بانك سرمايهگذاري كردهاند به كساني كه به پول نياز دارند فراهم ميكنند و اين اشخاص با بازپرداخت اقساط خود باعث ميشوند گروهي ديگر از مردم بتوانند از اين منابع استفاده كنند. عدم بازپرداخت بهموقع تسهيلات باعث راكد شدن منابع بانك و در بلندمدت باعث ركود اقتصادي كشور ميشود. نظارت بر نحوهی صحیح تخصیص منابع و بهداشت اعتباری امری بسیار مهم میباشد زیرا در صورت تخصیص نامطلوب منابع بانک و پرداخت بیاصول تسهیلات، بانکها توان بازپرداخت سپردههای سپردهگذاران را نداشته و با ورشکستگی مواجه خواهند گردید. با بررسي پژوهشهاي سالهاي اخير در زمينه بانكداري مشخص گرديد اكثر پژوهشها تركیب بهينهی سبد سرمايهگذاري بيشتر در بازار سرمايه پرداخته و كمتر پژوهشگري به بحث و بررسي تركيب بهينه در بازار پولي توجه نمودهاست. بيشتر پژوهشهایی كه از روشهاي تحقيق در عمليات و آماري استفادهگردیده درخصوص مسائل صنعتي بوده و كمتر در مسائل مالي از بحث هاي تحقيقدرعمليات استفاده شده است. در پرتفوي بهينه تركيب تسهيلات يا سرمايهگذاريها اكثراً از الگوريتم ژنتيك بهرهمند شده وكمتر از ديگر روشهاي فازي در شرايط عدماطمينان استفاده شدهاست. بنابراین در اين پژوهش به مدلسازي بهبود پرداخت تسهيلات با استفاده از مدلسازی شبکههای عصبی کانولوشنی5 و CNN-LSTM 6 ، پرداختهشدهاست.
کلیدواژهها: تسهیلات، داده کاوی، خوشه بندی،یادگیری عمیق، شبکه عصبی CNN، شبکه عصبی CNN-LSTM
مقدمه
بهدليل گسترش مناسب نظام پولي و مالي، عملاً بانكها و شبكهي بانكي بهعنوان مهمترين نهاد مالي وظيفه جمعآوري و تخصيص منابع اقتصاد را بر عهده گرفته است. بازار سرمايه يكي از اركان مهم اقتصاد در جامعه است كه از آن بهعنوان دماسنج اقتصاد ياد ميشود. بازارسرمايه پلي است كه پسانداز واحدهاي اقتصادي داراي مازاد مانند شركتها و دولتها را به واحدهاي سرمايهگذاري كه بدان نيازمندند انتقال ميدهد. در مورد نهادهاي موجود در بازار پول نيز اين مورد صادق است. بانكهاي تجاري و مؤسسات مالي و اعتباري از يك طرف وجوه را از مردم بهعنوان سپرده ميگيرند و در قبال آن به آنها پاداش پولشان (بهره) ميدهند. از طرف ديگر اين سپردهها توسط اين نهادها به دست افرادي كه به اين وجوه نياز دارند انتقال خواهد يافت. مكانيزم اين انتقال همان فرایند اعطاي تسهيلات است كه ورودي آن تقاضاي مشتريان از بانكها و مؤسسات مالي و اعتباري بوده و خروجي آن اعطاي وجوه به آنها است و در اين ميان بايد مديريت پرتفوي اعتبارات صورت گيرد. در تعيين سياستهاي مربوط به اعطاي تسهيلات، مؤسسات مالي بايد محورهاي اصلي برنامهی اعطاي تسهيلات، نحوه تخصيص تسهيلات اعتباري و نيز شيوه مديريت مجموعهی تسهيلات اعطايي را موردتوجه قراردهند و پرداخت تسهيلات به بخشهاي مختلف ( صنعتي، خدماتي، كشاورزي) بر اساس تأثيرگذاري بر توسعه كسب و كار خرد مورد نظر قرار ميگیرد. بانكها در اداره كشورها نقش تعيينكننده و از مهمترين ابزار رشد و توسعه كشور محسوب ميشوند. بانكهاي تجاري ايران همواره از مهمترين نهادهاي فعال در بازار پول و سرمايه بهشمار ميروند و با توجه به ساختار اقتصادي كشور و دلايلي چون عدم توسعهی بازارهاي سرمايه و ساير شبكههاي غيربانكي، تأمين مالي بخشهاي اقتصادي كشور را برعهده دارند. امروزه مهمترین دغدغهی بانکها بهمنظور افزایش سودآوری، پرداخت اصولی تسهیلات به افرادی میباشد که ریسک کمتری جهت بازپرداخت اقساط داشته باشند که به ترتیب ریسک اعتباری بانک کاهش یابد و به تبع آن با ریسک نقدینگی و ریسک شهرت کمتری مواجه گردند(Armantier & others، ۲۰۱۵). اکنون بانکها با حجم زیادی از مطالبات غیرجاری مواجه می باشند که عمدهترین علت آنها پرداخت غیراصولی تسهیلات و عدم رعایت بهداشتاعتباری میباشد(Mohammadi، Zangeneh، ۲۰۱۶). این امر باعث بلوکه شدن قسمت عظیمی از پول بانکها و سپرده سپردهگذاران دیگر گردیده و باعث افزایش هزینه و کاهش درآمدهای مشاع بانکها گردیدهاست(Khosroyani، ۲۰۲۲). وجود سيستم مناسب اعطاي تسهيلات و ارزيابي فرصتهاي سرمايهگذاري و وامدهي و اطمينان از وجود رويههاي مناسب در پذيرش و اعطاي تسهيلات موجب جلب اعتماد وكسب شهرت براي مؤسسات مذكور خواهد شد(عسگرزاده، 1386). با طراحي و اجراي تكنيكهاي بهينهسازي، مديريت امور نهاد مالي ميتواند با توجه به سياستهاي كلان اعتباري و برنامههاي اعتباري استراتژيك نهاد مالي و در نظر داشتن اولويتهاي تسهيلات از منظر ريسك و بازده به تصميمات مناسب دست يابد.
در این پژوهش سعی گردیده مدلی جهت بهینهسازی پرداخت تسهیلات ارائه گردد بطوریکه با استفاده از این مدل موسسه اعتباری قادر به اعتبارسنجی صحیح و سریع مشتریان درخواست کننده تسهیلات بوده و با شناسایی مشتریان اعتباری میزان ریسک و سودآوری مشتری برای مؤسسه قبل از پرداخت تسهیلات مشخص میگردد و بانکها و مؤسسات مالی اطمینان مییابند که با پرداخت تسهیلات سپردههای سپردهگذاران دیگر سوخت نمیگردد و بانکها متضرر نمیشوند در اين پژوهش ابتدا ادبيات نظري پژوهش مورد بررسي و تحليل قرار گرفته و هم زمان با آن، تحليل جامع مرتبط با موضوع در نظام بانکي نيز بررسي شد سپس با استناد به نتايج به دست آمده از ادبيات نظري و تحليلهاي نظام بانکي و با توجه به يافته¬هاي موردانتظار و با استفاده از ابزارهای شبیهسازی و دادهکاوی اقدام به مدلسازي براي خوشهبندي مشتريان یکی از بانکهای خصوصی گردید و سپس با استفاده از یادگیری عمیق و تلفیق روشهای دستهبندی فازی از جمله شبکههای عصبی کانولوشنی و شبکه عصبی CNN-LSTM به پیشبینی رفتار مشتریان در حوزه پرداخت تسهیلات در شبکه بانکی کشور پرداخته شد.
یک شبکه عصبی کانولوشن شامل یک ورودی و یک لایه خروجی و همچنین چندین لایه پنهان است. شبکه عصبی کانولوشن نشان میدهد که شبکه از یک عملیات ریاضی به نام کانولوشن بهره میبرد کانولوشن نوعی تخصصی از عملیات خطی است(Khalila & others، ۲۰۲۱). شبکههای کانولوشنال مانند شبکههای عصبی، ساده هستند که حداقل در یکی از لایههای خود از کانولوشن به جای ضرب ماتریس عمومی بهره میبرند. همچنین معماری CNN-LSTM شامل CNN برای استخراج ویژگی و LSTM برای یادگیری وابستگی های دراز مدت است(دامی، خیری، ،۱۳۹۷). این مدل می تواند توانایی های شبکه CNN و LSTM را مهار کند و نتایج بهتری با دقت ۸۵٪ به دست آورد.
1. مرورادبیات
مفهوم تشكيل سبد تسهيلات و تشكيل پرتفوي داراييها از دهه 1950توسط ماركوينز مطرح شده اما از دههی 1980 كاربرد اين مفهوم براي داراييهاي اعتباري توسعهيافت و به دنبال آن در دهه 1990مدلهاي سبد تسهيلات اعتباري معرفي شدند .
نظريه مدرن پرتفوليو بر اساس دو فرض بنا نهاده شده است، فرض اول اينكه سرمايهگذاران ريسك گريز هستند و فرض دوم اين است كه بازده اوراق بهادار داراي توزيع مشترك نرمال هستند، نتيجه اين مفروضات آن است كه بازده موردانتظار و انحراف استاندارد به طور كامل توزيع بازده اوراق بهادار را توصيف مي كند. در مورد سهام، علاقمندي به بازده و در مورد تسهيلات و داراييهاي اعتباري علاقمندي به شناسايي زيانهاي مود انتظار تسهيلات وجود دارد. عمده تحقيقات موجود بر روي بهينهسازي سبدهاي سرمايهگذاري بر مبناي الگوها و روشهاي مختلف انجام گرفته كه در غالب اين مدلها بهينهسازي بر مبناي معيارهاي مبتني بر ميانگين، واريانس انجام گرفته است(راعي، فرهادی، شیروانی،1390). در اكثر پژوهشها به بررسي غير خطي تصميمات سرمايهگذاران پرداخته شده است.
2. پیشینۀ پژوهش
خلاصهاي از تحقيقات پيشين در خصوص تركيب بهينه تسهيلات بشرح جدول ذیل میباشد:
جدول (۱) خلاصه تحقیقات پیشین
نام محقق | سال تحقيق | روش تحقيق | ورودي ها | خروجيها |
عسگر زاده | 1385 | فنون تحقيق در عمليات | تسهيلات | سود |
ابزاري، كتابي و عباسي | 1384 | تحقيق در عمليات | سرمايهگذاري | ريسك |
خالدزاده و اميري | 1389 | الگوريتم ژنتيك | سرمايهگذاري در بورس | ريسك |
عبدالعلي زاده شهير و عشقي | 1390 | الگوريتم ژنتيك | سرمايهگذاري در بورس | ريسك |
نويد، نجومي وميرزاده | 1393 | الگوريتم ژنتيك | سرمايهگذاري در بورس | ريسك |
استيفن لي و پيتر بارنه | 1994 | شبيهسازي | سهام | سود و ريسك |
او، كيم و مين | 2005 | الگوريتم ژنتيك | سرمايهگذاري در صندوق هاي مشاع | سود |
چانگ، يانگ | 2009 | روشهاي آماري | سرمايهگذاري | سود و ريسك |
تاتنيا هوبنو وا | 2014 | شبيهسازي | تسهيلات | ريسك و بازده |
ياسمين بشير ماليم | 2017 | شبيهسازي | تسهيلات | سودو ريسك |
در جدول شماره ۲ محدوديتها و قابليتهاي(نقاط قوت و ضعف) هريک از روشهاي مورد مطالعه در حوزه های کلان در ادبیات موضوع در مقایسه با روش تحقیق این پژوهش به صورت مختصر ارائه گردیده است:
جدول (2) نقاط قوت و ضعف روشهای بررسی شده
روش | نقاط ضعف | نقاط قوت |
سيستم های خبره | عدم ثبات، دروني و ذهني بودن، پرهزينه و زمان بر بودن | ميتوانند نتايج خود را توضيح دهند، يعني قدم به قدم يا به طور متوالي منطق بياورند. |
روشهای سنتی آماری | به دليل الزامات محدودکننده، کاربردهاي محدودي دارند. | در محدوده دادههاي کوچک يا بزرگ، جواب هاي قابل قبول ارائه مي دهند. |
روشهای دادهكاوی | با وجود اينکه به آشکارسازي الگوها و روابط کمک مي کند اما اطلاعاتي را دربارهی ارزش يا ميزان اهميت آنها به دست نميدهد. با وجود توانايي شناسايي روابط بين رفتارها و يا متغيرها لزوماً قادر به کشف روابط علت و معلولي نيست. موفقيت دادهکاوي در گرو بهره گيري از کارشناسان فني و تحليل گران کار آزموده اي است که از توانايي کافي برخوردار هستند. | به گونه اي گسترش يافتهاند که به سادگي ميتوان آنها را با ابزارهاي نرمافزاري و. . . امروزي تطبيق داده و از اطلاعات جمعآوري شده بهترين بهره را برد. |
مدلهای رگرسيونی | نيازمند ورودیها بصورت مقادير عددي هستند متغيرهاي دستهبندي شده بايد بصورت متغيرهاي عددي تبديل گردند. هم خطي بين متغيرهاي مستقل ورودي، اثر منفي روي نتايج ميگذارد. | بسيار پرکاربرد در تدوين نمره دهي اعتباري مشتريان، بي نيازي به فرضيات محدودکننده آماري، در رابطه با متغيرها ميتوان اهميت نسبي متغيرهاي مربوطه را به دست آورد. |
تحليل مميزی خطی | نيازمند وروديها بصورت مقادير عددي، فرض توزيع نرمال براي متغيرها و نيز برابر بودن ماتريس کوواريانس براي تمامي گروهها که در واقع مهمترين نقد وارده بر اين روش ميباشد. | اگر به دنبال روشي باشيم که ترکيب خطي متغيرها را به گونه اي به دست دهد که هم زمان معيار تفکيک خاصي حداکثر شود، اين روش پرکاربرد است. در برخي موارد ديده شده نقض شدن فرض نرمال در دادهها، مانع کارآمدي آن نشده است. |
برنامهریزی خطی | به منظور استفاده از اين مدل بايد يک حد مرزي تعيين کرد که با توجه به آن متقاضيان اعتباري به گروههاي مختلف تقسيم شوند که اين ممکن است به راحتي قابل حصول نباشد. | از برنامهريزي خطي حتي هنگامي که دو گروه به صورت خطي قابل جداسازي نيستند با استفاده از حداقل کردن حداکثر خطاها يا جمع خطاهاي مطلق، ميتوان استفاده کرد. |
یادگيری برمبنای مورد | عملکرد اين روش در مقايسه با ساير مدلهاي مرسوم، وابسته به تعداد وامهاي بد )تعداد نکول( در دادههاست. معمولاً هم احتمال بودن وامهاي خوب و بد در مجموعه يادگيري، کارآيي اين مدل را بهتر ميکند؛ که عملاً اين گونه نيست. | ميتوان با فرضياتي ساده، دانش را از دادهها استخراج کرد. خروجي ميتواند هم امتياز پيوسته و هم عضويت در کلاس ها باشد(Huang، ۲۰۱۸). ماهيت غيرپارامتريک اين روش، مدلسازي موارد بي قاعده در تابع ريسک در فضاي مشخصات مشتريان را ممکن مي سازد. اين فرآيند کاملاً شهودي بوده و به راحتي قابل توضيح به مديران است، زيرا به لحاظ مفاهيم و به کارگيري ساده ميباشد. قابل به کارگيري بصورت پويا و گام به گام بوده و با ورود موارد جديد، ميتواند خودش را روزآمد کند. |
شبكه های عصبی | نيازمند وروديها بصورت مقادير عددي متغيرهاي ورودي ممکن است مقياسهاي متفاوتي داشته باشند و اثر آنها بر خروجي، به طور نامساوي سنجيده شود، که در اين صورت مدل دچار خطا ميشود. بنابراين مقادير هر ورودي نيازمند هم مقياس شدن ميباشند )اعدادي بين صفر و يک(. مشکل بودن فرآيند آموزش در آن که تا حد زيادي کاربرد آن را محدود کرده است. نميتوانند نتايج خود را توضيح دهند، يعني قدم به قدم يا به طور متوالي منطق بياورند. | ميتوانند با فرضياتي ساده، دانش را از دل دادهها استخراج کنند خروجي ميتواند هم به صورت امتيازات پيوسته و هم به صورت عضويت در کلاسها باشد. روي ورودي ها و خروجي هاي غيرخطي هم کار مي کند که در تحليلهاي مالي که اغلب متغيرها غيرخطي هستند بسيار مفيد است. مناسب براي شرايطي که ساختار مسئله غيرشفاف است و بايد نوعي رونديابي يا بازشناسي الگو صورت بگيرد و دادههاي موجود ناقص و تحريف شدهاند که مديران مؤسسات مالي و نهادهاي سرمايهگذاري عملا با بسياري از اين مسائل مواجه اند. |
روش خوشهبندیk-means | جواب نهايي به انتخاب خوشههاي اوليه وابستگي دارد. روالي مشخص براي محاسبۀ اوليۀ مراکز خوشهها وجود ندارد. اگر در تکراري از الگوريتم تعداد دادههاي متعلق به خوشه اي صفر شد راهي براي تغيير و بهبود ادامۀ روش وجود ندارد. در اين روش فرض ميشود که تعداد خوشهها از ابتدا مشخص است. اما معمولاً در کاربردهاي زيادي تعداد خوشهها مشخص نميباشد. | سادگي روش و پرکاربرد بودن آن به جهت مقايسه و اعتبارسنجي ساير روشهاي مورد استفاده کم هزينه و کم زمان بودن از آنجا که خوشهبندی يک روش يادگيري بدون نظارت محسوب ميگردد، در موارد بسياري ميتواند کاربرد داشته باشد. (Ansari, Riasi 2016.) |
ماشين های بردار پشتيبان | نياز به انتخاب تابع کرنل مناسبُ محدود بودن به دو صفحه خطي و نياز به محاسبات زياد، که البته ماشينهاي بردار پشتيبان تقريبي اين مشکل را حل کردهاند. | SVM ها علي الخصوص زماني که مجموعه دادهها بزرگ هستند کاربرد دارند. اين مزيت از آنجا ناشي ميشود که تنها يک زيرمجموعه از دادههاي آموزش )که به آنها بردارهاي پشتيبان مي گويند(براي تعيين تابع تصميم استفاده ميشود، در حاليکه ميتوان ساير نقاط را در نظر نگرفت. آموزش نسبتاً آسان، با تعداد کمي دادههاي آموزش به خوبي عمل مي کند. براي دادههاي با ابعاد زياد نسبتا خوب عمل مي کند. |
UTADIS | تخمين توابع ارزش حاشيهاي، وزن هاي مشخصهها و مقدار برش با استفاده از تکنيکهاي برنامهريزي خطي محاسبه ميشوند که ميتواند شامل معايب تکنيکهاي برنامهريزي خطي گردد. | اجازه مدلسازي روابط دادههاي غيرخطي را ميدهد. مدل ساخته شده ميتواند متغيرهاي کيفي را نيز شامل شود. |
در مورد اينکه کداميک از اين روشها مناسبتر است بايد اشاره کرد که عموماً هر محقق مدل خود را بهترين ميداند. اما در تحقيقات گوناگون، محققين مختلف بين اين روشها مقايساتي انجام دادهاند که بر اساس آنها نتايج کاملاً متناقضي حاصل شده است. شايد يکي از مهمترين دلايل حصول به نتايج متناقض، تفاوت زمان و جامعه آماري است. با اين وجود باز هم برخي تلاش ميکنند مدلهايي براي کاربرد عام طراحي کنند، به گونهاي که مدل در يک جامعه آماري طراحي و در جامعه آماري ديگري پياده سازي شود. اگرچه هرکدام از اين مدلها بر جنبهاي خاص تکيه ميکنند، ولي تلاش شده از تحقیقاتی استفاده گردد که در مفروضات خود از دادههای مالي استفاده کرده و نيز از اطلاعات موجود در بازارهاي مالي به عنوان داده استفاده ميکنند.
شایان ذکراست پژوهش حاضر توانسته رفتارمشتریان بانک را بر اساس شاخصهای مالی و غیرمالی خوشهبندی نماید و نتایج حاصل از خوشهبندی را در مدل ریاضی تخصیص خدمات و محصولات بگونهای بکارگرفته تا با ورود مشتریان اهداف از پیش تعیین شده مورد نظر بانک در مناسبترین حالت خود قرار گیرند. با توجه آنکه جوابهای مؤثر7 یا راه حلهای غیر مسلط8 هرکدام از اهداف این تحقیق ممکن است جواب غیر مؤثر(مسلط) هدف دیگری باشند، بنابراین مسئله دارای جواب بهینه مطلق نمیباشد.
۳.شکاف تحقیق و تعریف مسئله
درحال حاضر بانكهاي تجاري در تحقق رسالت خويش چندان موفق نيستند. بالا بودن ذخاير بانكها از يكسو و تسهيلات اعطايي سوختشده و معوقه از سوي ديگر بيانگر عدم توجه كافي به مديريت ريسك و عدم وجود مديريت پرتفوي اعتباري در آنهاست(صالحي و اسكندري، 1393). بديهي است درصورتيكه مدلي براي مديريت پرتفوي اعتباري طراحي نشود و بهعبارتي در پرتفوي تسهيلات اعطايي، تخصيص بهدرستي صورت نگيرد، بانك در بلندمدت با ورشكستگي مواجه خواهد شد، چرا كه بودجه و سرمايه زيادي را به بعضي از تسهيلات اعطايي خود اختصاص ميدهد كه باعث افزايش ريسك اعتباري و در نتيجه احتمال عدم وصول مطالبات خواهد شد. مسائل و مشكلات مديريت پرتفوي تسهيلات مهمترين دليل ورشكستگي يا زياندهي بانكها و مؤسسات مالي و اعتباري میباشد(خواجوي و غيوري مقدم، 1392).مدل هايي مثل برنامه ريزي خطي ، برنامه ريزي عدد صحيح،برنامه ريزي صفر و يك وجود دارند كه ميتوانند تركيبي بهينه از عناصر تشكيل دهنده سبدتسهیلات را ارائه دهند اما نمي توان براي رسيدن به چنين هدفي اطلاعات مالي را با در نظر گرفتن تمام شرايط وارد برنامهريزي رياضي كرد. بيشترين روشهای انجام شده مربوط به چهار مدل مطرح شده با عنوان مدل هاي پرتفوي اعتباري به سه دسته مدلهاي ساختاري، مدلهاي بر مبناي كلان اقتصادي و مدلهاي مبتني بر عملكرد گذشته، تقسيم بندي ميشوند. مدلهاي ساختاري از دادهها و اقلام صورتهاي مالي و تغييرات ارزش دارايي ها در بازار سرمايه استفاده می نمایند. مدل هاي بر مبناي كلان اقتصادي، ريسك اعتباري را بر مبناي همبستگي و ارتباط صنايع با برخي از متغيرهاي كلان اقتصادي محاسبه ميكنند. مدلهاي آماري كه همان مدلهاي مبتني بر عملكرد گذشته هستند با استفاده از برخي توزيعهاي آماري ، ريسك اعتباري را در بانکها اندازهگيري نموده اند. فلذا بررسی سود و ریسک هریک از مشتریان بانک در صورت اعطای تسهیلات در هیچ یک از مدل ها و روش های پیشین مطرح نبوده است. درصورتیکه در این پژوهش با استفاده از داده کاوی به بهینه سازی مدل چند هدفه تخصیص تسهیلات با استفاده از شبکه عصبی پرداخته شده است.
۴. روش شناسی
۴.۱ساختار بانک اطلاعاتی سازمان مورد پژوهش
برای بررسی متغیرهای مستقل و تشخیص نوع آنها و تحلیل دادهها از نرم افزار R استفاده شده است. نرم افزار R داراي محیطی شبیه نرمافزار Plus-S بوده و براي انجام هر فعالیت در این نرمافزار باید از دستورها و کدهاي مناسب، که اغلب شبیه دستورهاي مورد استفاده در نرم افزار Plus-S هستند استفاده کـرد. دادهها به طور خلاصه بشرح ذیل می باشند که ۱۶۵۸ سطر و ۱۸ ستون دارا میباشد.
جدول (۳)متغیرهای تحقیق
همانطور که می بینیم اکثر متغیرها از جنس فاکتور و اعداد می باشند به جز متغیر پرداخت تسهیلات که از جنس کاراکتر میباشد. در زبان برنامه نویسی R، مقدارهای متغیرهای طبقهای را در یک متغیر عامل یا فاکتور ذخیره میکنند. البته ممکن است چنین مقدارهایی را در متغیرهای پیوسته نیز ذخیره کرد ولی کارایی و مفهوم طبقهای بودن در چنین حالتی از آنها گرفته میشود.
۴.۲ آماده سازی دادهها
۴.۲.۱پاکسازی داده 9
پاکسازی یا تمیزکردن دادهها به فرآیندی جهت تشخیص، حذف و اصلاح دادههای نادرست از مجموعه جداول، رکوردها یا بانکهای اطلاعاتی، همچنین شناسایی قسمتهای ناقص و نادرست دادهها و سپس اصلاح و جایگزینی آنها اشاره دارد. هدف از پاکسازی دادهها استخراج اطلاعات دقیق و درست است، چرا که اطلاعات نادرست میتواند منجر به نتیجهگیری غلط شود. در این مرحله برخی از متغیرهای موجود در مجوعه دادههای بدست آمده از بانک مورد نیاز محقق نمیباشد و این دادهها در ادامه فعالیت از مجموعه دادهها حذف گردیدند بطور مثال ستون هایی مانند ردیف، عنوان تسهیلات و . . . از دادهها حذف گردیدند.
۴.۲.۲تبدیل داده 10
گاهی اوقات برای اینکه دقت تجزیه و تحلیل را بالا ببریم باید در دادههای خامی که برای تحلیل در دسترس ما قرار دارند، تغییراتی ایجاد کنیم، یکی از این تغییرات، فرایند تبدیل دادهها است. تبدیل دادهها روشهایی بر پایه ریاضی است که برای متغیرهایی به کار میرود که از شاخصهای آماری نرمال بودن، خطی بودن، پراکندگی یکسان و… پیروی نمیکنند. تبدیل داده نوعی روش تثبیت داده نیز به شمار میرود. در این فاز، دادههای انتخاب شده به فرم دیگری تبدیل میشود. در این مرحله متغیرهایی که از جنس فاکتور بودند به کاراکتر تبدیل شدند و نوع وثیقه که کاراکتر می بود به نوع عددی تبدیل شدهاند. برای مباحث آمار و برنامه نویسی، متغیر عامل با فاکتور11، دارای مقدارهای عددی محدود است. این اعداد و ارقام اصولاً بصورت اعداد صحیح ثبت یا نمایش داده میشوند، از آنجائیکه برخی از این ستونها فقط بصورت یک متن میباشند با کاراکتر نشان داده شدهاند بقیه متغیرها نیز چون از نوع عددی هستند از نوع عددی12 تعریف شدهاند. قبل از انجام هرگونه عملیات محقق تصمیم گرفته است که متغیرهای کاراکتری به متغیرهای فاکتور با استفاده از تابع as. تبدیل گردد. که بشرح ذیل میباشد.
جدول(۴) تبدیل دادهها
۴.۲.۳ دادههاي گمشده13
مسئله مقادیر گمشده در علم داده14 و بخصوص دادهکاوی، زمانی رخ می دهد که یک یا چند مشاهده دارای مقدارهایی ثبت نشده یا ناموجود در ستون های «چارچوب اطلاعاتی»15 هستند. در چنین حالت می گوییم آن مشاهده دارای مقدار گمشده یا مقدار ناموجود است. در این حالت این مجموعه داده را دارای «داده گمشده» یا دادههای گمشده میگوئیم. به منظور تحلیلهای آماری روی مجموعههای اطلاعاتی با داده گمشده، باید مشخص کنیم که نقش چنین مشاهداتی در محاسبات مربوط به تحلیل آماری چگونه است. براي معرفی دادههاي گمشده در یک بردار از عبارت NA استفاده میکنیم. براي بررسی دادههاي گمشده در یـک بردار از تابع ()na. is استفاده میشود. این تابع برداري منطقی به طول بردار موردنظر ارائه می دهد که مقادیر گمشده متناظر با اعضاي بردار در آن با TRUE نشان داده شدهاند(Bhandari،۲۰۲۲).
۴.۲.۴ مدیریت دادههای گمشده
روشهای مختلفی برای مقابله با دادههای از دست رفته وجود دارد، شاید راحتترین روش، حذف نمونههایی از دادههای از دست رفته باشد. ولی در این روش تعداد نمونهها کاهش پیدا میکند. همانطور که می دانید در دادهکاوی هرچقدر تعداد نمونهها بیشتر باشد مدلسازی با دقت بالاتری انجام میشود. گاهی میتوان مقادیر خالی را با استفاده از الگوریتمهای مختلف مقداردهی نمود(Howell، ۲۰۲۱). در این پژوهش از روش نزدیکترین همسایه استفاده شده است. الگو کی- نزدیکترین همسایه16 یک متد آمار ناپارامتری است که برای طبقهبندی آماری و رگرسیون استفاده میشود(Du، Li ، ۲۰۱۹). در هر دوحالت k شامل نزدیکترین مثال آموزشی در فضای دادهای میباشد و خروجی آن بسته به نوع مورداستفاده در طبقه بندی و رگرسیون متغیر است. در حالت طبقه بندی با توجه به مقدار مشخص شده برای کی، به محاسبه فاصله نقطهای که می خواهیم برچسب آن را مشخص کنیم با نزدیکترین نقاط میپردازد و با توجه به تعداد رأی حداکثری این نقاط همسایه، در رابطه با برچسب نقطه موردنظر تصمیمگیری میکنیم(Huang، ۲۰۱۸). برای محاسبه این فاصله میتوان از روشهای مختلفی استفاده کرد که یکی از مطرحترین این روشها، فاصله اقلیدسی است(Estivill، Houle ،۲۰۰۱). در این پژوهش با استفاده از روش نزدیکترین همسایه، مقدار میانگین هر ستون بجای مقادیر گمشده جایگزین گردیده است.
۴.۲.۵ بصریسازی متغیرها
جهت تصویرسازی بهتر متغیرها استفاده از نمودار ggplot توصیه میگردد، نمودار تأثیر متغیرها روی متغیر وابسته که درآمد – هزینه یا ریسک میباشد بهشرح زیر و به تصویر کشیده شدهاند.
شکل(۱) تاثیر متغیر جنسیت بر متغیر وابسته هزینه/درآمد
در شکل شماره ۱ نشان داده شده است که تسهیلات پرداختی به اشخاص حقیقی با درآمد بالا و درآمد متوسط از نوع مرابحه بیشترین تأثیر را روی درآمد-هزینه بانک داشته است.
شکل(۲) تاثیر متغیر نوع تسهیلات بر متغیر وابسته هزینه/درآمد
طبق شکل شماره ۲ تسهیلات مرابحه و مشارکت مدنی پرداختی به اشخاص حقوقی بیشترین تأثیر را روی درآمد- هزینه داشته است.
در شکل شماره ۳ مشخص میباشد که تسهیلات مشارکت مدنی در بخش بازرگانی ریسک بیشتری داشته و مرابحه در بخش مسکن و خدمات به ترتیب ریسک کمتری داشته است.
شکل(۳) تاثیر متغیر بخش تسهیلات بر متغیر وابسته ریسک
همچنان در شکل ۴ مشخص میباشد که تسهیلات مرابحه در بخش خدمات و مسکن و مشارکت مدنی در بخش خدمات بیشترین تأثیر را روی درآمد- هزینه داشته است.
شکل(۴) تاثیر متغیر بخش تسهیلات بر متغیر وابسته هزینه/درآمد
۴.۲.۶ نرمالسازی دادهها
نرمالسازی دادهها روشی برای یکنواختکردن بازه مقادیر مربوط به متغیرهای مختلف پژوهش است و به بیمقیاسسازی دادهها نیز معروف است. اگر واحد سنجش متغیرهای موردمطالعه متنوع باشد با استفاده از روشهای نرمالسازی میتوان دادهها را بیمقیاس کرد. مفهوم دیگر از نرمال کردن که به استاندارد کردن نیز موسوم است در تحلیل شبکههای عصبی مصنوعی و تحلیل پوششی دادهها کاربرد دارد. برای استاندارد کردن یک عنصر باید آن عنصر را منهای میانگین کرده و بر انحراف معیار تقسیم نمایید. استراتژیهای ماکسمین، ماکسیماکس و مینیمکس سه رویکرد تصمیمگیری تحت عدم اطمینان هستند که بخصوص در مسائل مالی و تصمیمگیریهای اقتصادی، نقش مهمی دارند(Henderi,، Wahyuningsih، Rahwanto،۲۰۲۱). اینگونه روشهای انتخاب و تصمیم، برای اجرای یک فعالیت در استراتژیهای مالی و بازار سهام نیز قابل استفاده است. برای اطمینان از بکارگیری روش مناسب جهت استانداردسازی دادهها در این تحقیق از روش فازی یا همان روش ماکزیمم-مینیمم استفاده میشود. که این روش برای یک شاخص(xj) باجنبه مثبت(مانند درآمد هریک از تسهیلات) و یک شاخص با جنبه منفی مانند (ریسک و هزینه هریک از تسهیلات) عبارت است از :
(۱) |
اعداد در این روش نرمالسازی دقیقاً بین صفر و یک خواهند بود بطوریکه فارغ از جنبه مثبت و منفی، صفر برای بدترین نتیجه و یک برای بهترین نتیجه میباشد(اصغرپور، 1388).
۴.۲.۷حذف دادههای پرت با استفاده از رویکرد z-score
یک روش متداول برای شناسایی و حذف دادههای پرت استفاده از الگوریتم z-score میباشد که بر اساس فاصله دادهها از میانگین و استاندارد دادهها محاسبه میشود. برای استفاده از این روش، ابتدا باید میانگین و استاندارد دادههای مجموعه داده را محاسبه کرد. سپس برای هر داده، فاصله آن از میانگین را با استفاده از فرمول زیر محاسبه میکنیم:
(۲) |
که در این فرمول، x داده مورد نظر، μ میانگین دادهها و σ انحراف معیار دادهها است.
زمانی که ما z-score همه دادهها را محاسبه کردیم، میتوانیم به دادههای پرت پی ببریم. دادههایی که z-score بیشتر از یک حداکثر مشخص مثلاً ۳ یا 4 شده باشد به عنوان دادههای پرت شناخته میشوند و میتوانیم آنها را از مجموعه داده حذف کنیم. شکل زیر حالت کلی استفاده از این روش میباشد.
شکل (۵)z-score
باتوجه به اینکه تعداد دادههای این پژوهش زیاد نمیباشد در حذف دادههای پرت محتاط بوده بههمین دلیل دادههای پرت بزرگتر از 4 حذف گردیده است.
۴.۲.۸ خوشهبندی متغیرها
خوشهبندی، فرآیندی است که به کمک آن میتوان مجموعهای از اشیاء را به گروههای مجزا افراز کرد. هر افراز یک خوشه نامیده میشود. اعضاء هر خوشه با توجه به ویژگیهایی که دارند به یکدیگر بسیار شبیه هستند و در عوض میزان شباهت بین خوشهها کمترین مقدار است. در چنین حالتی هدف از خوشهبندی، نسبت دادن برچسبهایی به اشیاء است که نشان دهنده عضویت هر شیء به خوشه است(Bock، ۲۰۰۷). در این پژوهش با استفاده از معیار سیلوئیت تعداد بهینه خوشه با استفاده از فرمول زیر در نرم افزار R-Studio بدست آمده است:
(۳) |
km. res=kmeans(dfn ,centers = k , nstart = 25)
ss=silhouette(km. res$cluster, dist(dfn))
return(mean(ss[ ,3]))
}
k_values=2:6
avg_sil=map_dbl(k_values , avg)
fviz_nbclust(dfn , kmeans , method = "silhouette")
dfn <- df %>%
dplyr::select(approved_amount,loan_remaining,ghest,profit_rate,income_or_cost,risk)
روش 17SC یکی از متداولترین و بهترین روشهای اعتبار سنجی الگوریتم خوشهبندی کا-میانه18 میباشد. که اولین بار توسط کافمن و روسیو در سال 1990 پیشنهاد شد. که در این رابطه همبستگی a(x) متوسط فاصله (x) نسبت به بردار های دیگر در همان خوشه است، شاخص تفکیک b(x)متوسط فاصله (x) نسبت به سایر خوشهها را نشان می دهدS(x) نمایش اندازه گیری میزان نزدیکی هر نقطه در یک خوشه است، که امتیاز آنها نسبت به خوشههای مجاورش سنجیده میشود. محدوده امتیاز دهی آن بین 0 و1+ است(Bose، Chen،۲۰۱۵). به این صورت که اگر این اندازه گیری در محدوده 1+ باشد نشان دهنده این است که خوشه مورد نظر نسب به خوشه مجاورش بسیار دور است. و حالت صفر نشان میدهد که هیچ گونه تفکیکی بین خوشه موردنظر و خوشههای همسایه وجود ندارد. و بالاخره حالت 1- نشان دهنده احتمالات اختصاص خوشه مورد نظر به صورت غلط است. که نتیجه به دست آمده از روش فوق به شکل زیر میباشد:
(۴) |
1. 253211e+24 7. 134004e+24
(between_SS / total_SS = 75. 4 %)
همانگونه که از خروجی مشخص میباشد total-ss میزان ۴/۷۵٪ را به خود اختصاص داده که نشانگر این موضوع است که به درستی خوشهها انتخاب شدهاند . چنانچه از شکل زیر مشخص میباشد بهترین تعداد خوشه دو میباشد .
شکل (۶) تعداد بهینه خوشه
۴.۲.۹روش خوشهبندی کا-میانه 19
(۵) |
kmedoid. re<-pam(dfn , k=2, metric = "euclidean" , stand = FALSE)
kmedoid. re<-pam(dfn , k=2, metric = "manhattan" , stand = FALSE)
همانطور که مشاهده میشود تعداد بهینه خوشه ۲ بوده و از فاصله اقلیدسیو منهتن برای خوشهبندی استفاده گردیده است که نتیجه هر دو یکسان و بهشکل زیر میباشد:
شکل (۷) خوشه بندی کا-میانه
نتیجه خوشهبندی با روش کا-میانه بشرح ذیل میباشد:
که نشانگر این میباشد که مشتریان در دو گروه مشتریان خوش حساب و مشتریان بدحساب طبقه بندی گردیدهاند که مشتریان خوش حساب دارای درآمد مثبت و ریسک صفر بوده و مشتریان بد حساب دارای ریسک ۱۶. ۴۲ و درآمد منفی یا بهتر است ذکر کنیم برای بانک دارای هزینه بوده اند.
۵.چارچوب پژوهش
مجموعه داده |
-یکسان سازی داده ها -بهبود داده ها - حذف داده های نامناسب |
پیش پردازش |
انتخاب ویژگی ها |
-کاهش ویژگی ها -بهبود کارایی الگوریتم ها |
خوشه بندی |
-کای میانه |
- CNN
|
پیش بینی |
Convolution |
Activation Relu |
-CNN-LSTM |
pooling |
dropout |
Fully connected |
Out put |
شکل (۸) چارچوب پژوهش
۶.یافتههای پژوهش
۶.۱ یادگیری عمیق با استفاده از شبکههای عصبی
یادگیری عمیق از شبکههای عصبی مصنوعی برای انجام محاسبات پیچیده بر روی حجم زیادی از دادهها استفاده میکند. یادگیری عمیق، نوعی از یادگیری ماشین است(Ngufor & others، ۲۰۱۹)، که بر اساس ساختار و عملکرد مغز انسان کار میکند(Adnan،۲۰۲۰). یادگیری عمیق زیر مجموعهای از هوش مصنوعی است که در آن به جای انسان از ماشین استفاده میشود در ابتدا باید بگوییم که مغز انسان از رشتههای عصبی تشکیل شده است که این عصبها با هم در ارتباطاند و پردازش اطلاعات میکنند کارهایی که انجام میدهیم براساس ورودیهایی است که دریافت میکنیم و در اصل مغز ما مانند یک تابع رفتار میکند که ورودیهایی را میگیرد و عملیات انجام میدهد و خروجی به ما تحویل میدهد یادگیری عمیق نیز با استفاده از شبکه عصبی عمیق که مانند مغز انسان عمل میکند و پردازش انجام میدهد(Al Machot & others ،۲۰۱۵). شبکه عصبی توسط ورودیها آموزش داده میشود و شامل سه لایه ورودی و پنهان و خروجی است و هر کدام از عصب ها دارای مقدار آستانه و تابع فعال سازی میباشند که به ما خروجی میدهند نتیجهای که به دست میآوریم با خروجی که انتظار داریم مقایسه میشود که این دو مقدار باید نزدیک به هم باشند، مدل یاد میگیرد که وزن ها و مقدار آستانه را طوری تنظیم کند که خروجی درست دریافت کند. لایههای شبکهی عصبی، از گرهها تشکیل شدهاند. یک گره، مانند نورونهای مغز انسان، مکانی برای انجام محاسبات است. مجموعهای از نورونهای فعال شده منجر به یادگیری میشوند(شریف فر،۱۴۰۱).
۶.۱.۱ شبکه عصبی CNN
CNN از گیرندههای چند لایه تشکیل شده است منظور از گیرنده های چند لایه شبکههای کاملاً متصل هستند، که هر نورون در یک لایه به همه سلول های عصبی در لایه بعدی متصل میشود اتصال کامل این شبکهها موجب میشود که بیشازحد از دادهها استفاده کنند CNN ها از الگوی سلسلهمراتبی در دادهها استفاده میکنند و با استفاده از الگوهای کوچکتر و ساده الگوهای پیچیدهتری را بدست میآورند( Oquab & others، ۲۰۱۴). ورودی بیشتر مدلهای یادگیری عمیق مانند شبکه عصبی باید به صورت عدد باشند به همین منظور دادههای کیفی را باید در مرحله پیش پردازش دادهها به صورت عدد تبدیل شوند. در مدلهای یادگیری عمیق، برای دادههایی که به صورت دستهای هستند (مثلاً در این مجموعه داده ایی ویژگی نوع مشتری)، باید قبل از اعمال مدل ، آنها را به صورت عددی تبدیل کرد. روش رمزگذاری به صورت برچسب یکی از روشهای تبدیل دادههای کیفی به دادههای عددی می باشد(Krizhevsky & others ،۲۰۱۷). در این پژوهش، برای هر دسته یک عدد مخصوص تعیین گردید. به عنوان مثال برای ویژگی نوع مشتری، برای حقیقی، حقوقی به ترتیب میتوان عدد ۱و ۲ را نسبت داد. سپس برای هر داده، مقدار عددی مخصوص آن دسته برای آن نمونه انتخاب گردید. همچنین بخش آموزش برای آموزش مدلهای یادگیری عمیق استفاده میشود، بخش آزمایش برای ارزیابی عملکرد مدلها بر روی دادههای جدید استفاده میشود و بخش اعتبارسنجی برای تنظیم پارامترهای مدل و انتخاب بهترین مدل از بین چندین مدل مختلف استفاده میشود(Ole Hjelkrem , Eilif de Lange ۲۰۲۳). برای تقسیم مجموعه داده به سه بخش، معمولاً از روش تصادفی استفاده گردیده است. در این تحقیق، 70٪ از دادهها به بخش آموزش، 15٪ به بخش آزمایش و 15٪ به بخش اعتبارسنجی تخصیص داده شده است. در این پژوهش مدل به صورت لایه به لایه تعریف شده است. در ابتدا، یک لایه کانولوشن با ۶۴ فیلتر، اندازه کرنل ۳ و تابع فعالسازی relu تعریف شده است. سپس یک لایه MaxPooling با اندازه ۲ تعریف شده است که به منظور کاهش ابعاد دادهها استفاده شده است. این لایه با انتخاب بزرگترین مقدار در هر دو مقدار دادههای ورودی، ابعاد دادهها را نصف میکند. برای جلوگیری از بیشبرازش ، یک لایه Dropout با مقدار ۵/۰ تعریف شده است. این لایه به منظور حذف تصادفی وزنهای یادگیری مدل استفاده میشود و در اینجا مقدار ۵/۰ به این معنی است که در هر دوره ۵۰ درصد از وزنهای مدل به صورت تصادفی حذف میشوند. پس از آن، یک لایه Flatten تعریف شده است که به منظور تبدیل دادههای ورودی به دادههای یک بعدی استفاده میشود. این لایه به صورت خطی دادههای ورودی را به یک بعد تبدیل میکند تا بتوانند به لایه Dense بعدی داده شوند. در نهایت، دو لایه Dense تعریف شده است. لایه اول با ۱۲۸ نورون و تابع فعالسازی relu تعریف شده است و لایه دوم با دو نورون و بدون فعالسازی تعریف شده است.
۶.۱.۲ مدل CNN-LSTM
این مدل شامل چند لایه است. ابتدا، یک لایه کانولوشن با ۸ فیلتر، اندازه کرنل ۳ تعریف شده است. سپس یک لایه LSTM با ۶۴ نورون و بازگشت دنبالههای خروجی تعریف شده است. این لایه به منظور یادگیری الگوهای طولانی مدت در دادههای ورودی استفاده میشود. تنظیم return_sequences=True به LSTM میگوید که برای تمام دادههای ورودی، خروجی تولید کند. پس از آن، یک لایه MaxPooling با اندازه ۲ تعریف شده است. این لایه با انتخاب بزرگترین مقدار در هر دو مقدار دادههای ورودی، ابعاد دادهها را نصف میکند. سپس، یک لایه Flatten تعریف شده است که به منظور تبدیل دادههای ورودی به دادههای یک بعدی استفاده میشود. در نهایت، یک لایه Dense با دو نورون و بدون فعالسازی تعریف شده است.
۶.۲پارامترهای کامپایل برای مدلهای CNN و CNN-LSTM
سه پارامتر بهینه ساز ، ضرر و متریک برای هر دو مدل CNN و CNN-LSTM یکسان در نظر گرفته شده است تا مقایسه دقتهای دو مدل در شرایط یکسان بررسی شود.
• پارامتر بهینهساز، الگوریتم بهینهسازی است که در فرایند آموزش مدلها مورد استفاده قرار میگیرد. در اینجا، الگوریتم بهینهسازی آدام انتخاب شده است.
• پارامتر ضرر، تابع هزینه است که در فرایند آموزش مدل مورد استفاده قرار میگیرد. در اینجا، تابع هزینه میانگین مربعات خطا انتخاب شده است. این تابع هزینه برای مسائل رگرسیون مناسب است.
• پارامتر متریک، معیارهایی است که در فرایند آموزش مدل جهت ارزیابی عملکرد مدل استفاده میشوند(Dormann، ۲۰۱۳). در اینجا، معیار دقت انتخاب شده است. این معیار برای مسائل دستهبندی مناسب است و نشان میدهد که چه درصد از دادههای آزمون به درستی دستهبندی شدهاند.
۷.تحلیل یافته ها
نمودارهای دقت و خطا مدلهای CNN و CNN-LSTM بهشرح زیر میباشد. این نمودارها به ما کمک میکند که فرآیند آموزش مدل به چه صورت انجام گردیدهاست. تعداد مراحل آموزش برای هر دو مدل برابر با 100 در نظر گرفته شده است.
شکلهای شماره ۸ و ۹ بهترتیب مربوط به نمودارهای دقت و خطا برای مدل CNN در فرآیند آموزش میباشد. نمودار آبی رنگ مربوط به میزان دقت و خطا مدل برای دادههای آموزش و نمودار نارنجی برای دقت و خطا مدل بر روی دادههای اعتبارسنجی میباشد. همانطور که از نمودار دقت مشخص است در همان مراحل ابتدایی مدل توانسته به برازش نسبتاً کاملی از دادهها دست پیدا کند. به طوری که هم دقت مدل بر روی دادههای آموزش و هم دادههای اعتبارسنجی در هر مرحله از دقت بالای ۵/۹۷٪ برخوردار هستند و از طرفی میزان خطا هم در همان مراحل ابتدایی به زیر 1% رسیده است. در نتیجه پس با قطعیت می توانیم بگوییم که در فرآیند آموزش مدل CNN بیش برازش رخ نداده است و مدل با موفقیت توانسته دادهها را برازش کند.
شکل(۹)نمودار دقت مدل CNN
شکل(۱۰)نمودار خطای مدل CNN
همچنین نمودار دقت و خطا مدل CNN-LSTM به شکل زیر میباشد. همانگونه که مشخص است، شکل های زیر به ترتیب مربوط به نمودارهای دقت و خطا برای مدل CNN-LSTM در فرآیند آموزش میباشد. نمودار آبی رنگ مربوط به میزان دقت و خطا مدل برای دادههای آموزش و نمودار نارنجی برای دقت و خطا مدل بر روی دادههای اعتبارسنجی میباشد. مدل CNN-LSTM برخلاف مدل CNN در همان نتوانسته به صورت پایدار به برازش نسبتاً کاملی از دادهها دست پیدا کند و بعد از مرحله 20ا اُم آموزش دقت مدل بر روی دادههای هر چند مرحله یک بار افزایش و کاهش پیدا میکند به نحوی که حتی در مراحل آخر آموزش دقت مدل بر روی دادههای آموزش به کاهش بیشتری پیدا میکند. اما در مجموع مدل موفقیت آمیز بوده است چرا که کمترین میزان دقت بر روی دادههای آموزش و اعتبار سنجی به ترتیب ۸۵/۹۷٪ و ۷۰/۹۷٪ بوده است. از طرفی دیگر نیز خطای مدل همواره رو به کاهش بوده است به طوری که میزان خطا در همان مراحل ابتدایی به زیر ۵/۰٪ رسیده است. این امر با توجه به میزان دقت مدل نشانگر این موضوع است که مدل دچار بیش برازش نشده است و در نهایت مدل نسبتاً کاملی از دادهها برازش شده است.
شکل(۱۱)نمودار دقت مدل CNN-LSTM
شکل(۱۲) نمودار خطای مدل CNN-LSTM
نتیجه گیری
مؤسسات مالی در ساختار اقتصادی جوامع از اهمیت بالایی برخوردارند. این مؤسسات به عنوان قلب اقتصاد در دو بازار سرمایه و پول فعالیت داشته و باعث ایجاد جریان نقدینگی میگردند. در اقتصاد ایران حتی، اهمیت این مؤسسات دو چندان میشود چرا که آنها علاوه بر واسطهی وجوه بودن در بازار پول، به دلیل عدم توسعه کافی بازار سرمایه، نقش اساسی در تأمین مالی برنامههای میانمدت و بلندمدت اقتصادی کشور ایفا میکنند. بنابراین مبحث سودآوری در این نوع مؤسسات نه تنها برای خود آنها که برای کل اقتصاد حائز ارزش میگردد. این پژوهش در ابتدا به دنبال شناسایی عوامل مؤثر بر سودآوری بانکها و کاهش ریسک داشته و با جداسازی تأثیرات عوامل مختلف، به طور خاص بر کارکرد آنها تمرکز کرده و تأثیر عوامل کارکردی شعب را بر روی سودآوری و ریسک بررسی نمودهاست. برای رسیدن به هدف مذکور ابتدا از تکنیکهای خوشهبندی برای جدا کردن مشتریان به دو گروه مشتریان خوش حساب و بدحساب استفاده گردید و سپس به بررسی عوامل مؤثر بر افزایش سودآوری و کاهش ریسک پرداخته شده است. هدف این پژوهش طراحی یک مدل یادگیری عمیق CNN و CNN-LSTM بوده است. سپس به برآورد ریسک و سود با مدل موردنظر پرداخته شدهاست.در مقایسه دقت مدلهای CNN و CNN-LSTM بر روی دادههای آزمایش میتوان گفت میزان دقت مدل CNN بر روی دادههای آزمایش برابر با ۲۳/۹۸٪ میباشد. دقت مدل CNN-LSTM بر روی همان دادههای آزمایش برابر با ۷۸/۹۷٪ میباشد. با توجه به اینکه هر دو مدل در شرایط یکسانی آموزش دیدهاند و پارامترهای یادگیری هر دو دقیقاً باهم برابر بوده است و با توجه به پایداری بیشتر مدل CNN در فرآیند آموزش و دقت بالاتر آن بر روی دادههای آزمایش میتوان نتیجه گرفت که مدل CNN بهتر از مدل CNN-LSTM عمل کرده است. اما در کل هر دو مدل توانسته اند دقت خوبی بر روی دادههای آزمایش بدست بیاورند.
پیشنهادات کاربردی
با توجه به بکارگیری عوامل مؤثر در پرداخت تسهیلات، در بانکها می توان با داشتن هریک از پارامترهای مشتریان آنها را در هریک از دو دسته مشتریان بد حساب یا خوش حساب خوشهبندی نمود علاوه بر آن میتوان پیشبینی نمود مشتری با ویژگیهای شخصیتی و درآمدی و با توجه به نوع و مبلغ وام آیا توان باز پرداخت تسهیلات را دارا میباشد یا خیر ؟ و اگر به مشتری وامی پرداخت شود ریسک و سود مربوط به هر وام چقدر میباشد.
تحقیقات آتی
پژوهشگران آتی میتوانند از بقیه مدلهای یادگیری عمیق نیز برای مباحث پیشبینی استفاده نمایند. همچنین آنها می توانند از یافتههای این تحقیق در بقیه مسائل مالی و مدیریتی استفاده نمایند.
منابع
اصغر پور، حسین، (۱۳۸۸). اثر بي ثباتي سياسي بر رشد اقتصادي ايران: رهيافت غيرخطي APARCH .
خواجوی، شکراله ، غیوری مقدم، علی، (۱۳۹۲). بررسی کاربرد تحلیل پوششی دادهها در مقایسه و ارزیابی عملکرد واحدهای تجاری.
دامی، سینا ، خیری، فرشته،(۱۳۹۷). شناسایی تقلب در پرداخت کارت های اعتباری با شبکه عصبی حافظه طولانی کوتاه مدت (LSTM). سومین کنفرانس ملی فناوری در مهندسی برق و کامپیوتر
راعی، رضا، فرهادی، روح الله، شیروانی، امیر، (۱۳۹۰). رابطه در گذر زمان بین بازده و ریسک: شواهدی از الگوی قیمت گذاری دارایی سرمایه ای در گذر زمان ICAPM، فصلنامه چشم انداز مدیریت مالی دانشگاه شهید بهشتی، تهران.
شریف فر، امیر، خلیلی عراقی، مریم، رئیسی وانانی، ایمان، فلاح شمس، میر فیض،(۱۴۰۱). کاربرد معماریهای یادگیری عمیق در پیشبینی قیمت سهام (رویکرد شبکه عصبی پیچشی CNN)، دوره ۱۰، شماره ۳، صفحه ۱-۲۰.
صالحی، فهمیه، صالحی، مجتبی،اسکندری، میثم(۱۳۹۳). بهینه سازی سبد تسهیلات اعطایی موسسات مالی با استفاده از برنامه ریزی ریاضی و الگوریتم ژنتیک (مطالعه موردی بانک تجارت)، فصلنامه توسعهی مدیریت پولی و بانکی، دوره۲، شماره۳.
عسگر زاده، مجید،و دیگران، (۱۳۸۶). بررسی ریسک عملیاتی بانکداری الکترونیکی یکپارچه و ارائهی راهکارهای کاهش مخاطرات آن، اولین کنفرانس جهانی بانکداری الکترونیک.
References
Ansari, A., Riasi,A., (2016). Customer Clustering Using a Combination of Fuzzy C-Means and Genetic Algorithms.
Adnan et al, R.M., (2020). Least square support vector machine and multivariate adaptive regression splines for streamflow prediction in mountainous basin using hydro-meteorological data as inputs,J. Hydrol.
Armantier, O., Ghysels, E., Sarkar, A., Shrader, J., (2015). Discount window stigma during the 2007-2008 financial crisis. J. Financ. Econ. 118 (2), 317–335.
Al Machot,F. et al., (2019). A deep-learning model for subject-independent human emotion recognition using electrodermal activity sensors.
Bock, H., (2007). Clustering methods: A history of k-means algorithms Selected Contributions in Data Analysis and Classification, . 161-172.
Bhandari, P., (2022). Missing Data | Types, Explanation, & Imputation. Revised on November 11, 2022.
Bernanke, B., ( 2009). The federal reserve's balance sheet: an update. In: A Speech at the Federal Reserve Board Conference on Key Developments in Monetary Policy, Washington, D.C.
Bose, I., Chen, X., (2015). Detecting the migration of mobile service customers using fuzzy clustering.
Chen, X.D., (2017). Analysis and research of common clustering algorithm in data miningDigital Technol. Appl., pp. 151-152.
Du S., Li J., (2019). Parallel processing of improved knn text classification algorithm based on Hadoop. In: 2019 7th International Conference on Information, Communication and Networks (ICICN), 167-170.
Dormann et al, C.F., (2013). Collinearity: a review of methods to deal with it and a simulation study evaluating their performance.
Estivill-Castro V., Houle M.E., (2001). Robust distance-based clustering with applications to spatial data mining,Algorithmica, 30 (2) , 216-242.
Guo,G., Wang, H., Bell, D., Greer, Y., (2003). KNN model-based approach in classificationOTM Confederated International Conferences on the Move to Meaningful Internet Systems, 986-996.
Howell, E., (2021). 4 Techniques To Deal With Missing Data in Datasets, Simple methods that can nullify the effects of missing values, Published in Towards Data Science, Sep 17.
Huang, X.Y. , (2018). An improved KNN algorithm and its application in real-time car-sharing prediction., Dalian University of Technology, Daian, China ,M.S. thesis.
Huang et al., Huang J., Wei Y., Yi J., Liu M., (2018). An improved KNN based on class contribution and feature weighting. In: 2018 10th International Conference on Measuring Technology and Mechatronics Automation (ICMTMA), 313-316.
Henderi, T., Wahyuningsih, T., Rahwanto, E., (2021). ComparisonofMin-MaxnormalizationandZ-ScoreNormalizationintheK-nearest neighbor (KNN) Algorithm to The Accuracy of Type Breast Cance, International Journal of Informatics and Information SystemVol.4,NO.1,13-20.
Khosroyani, M., Heydarpoor, F., Yaghoob-nezhad, A., & Poorzamani, Z., (2022). An artificial neural network model for predicting the liquidity risk of Iranian private banks. Int. J. Nonlinear Anal. In Press, 1–11 ISSN: 2008-6822 (electronic); http://dx.doi.org/10.22075/ijnaa.2022.29118.4071. [In Persian].
Khalila,S, Amritb, CH, Kocha, T, Dugundjia, E.,(2021). Forecasting public transport ridership: Management of Information system by using CNN and LSTM Architecture, The 12th International Conference on Ambient Systems, Networks and Technologies (ANT).
Krizhevsky, A., Sutskever, I., Hinton, G.E., )2017(. Imagenet classification with deep convolutional neural networks. Communications of the ACM 60, 84 – 90. URL: https://search-ebscohost-com.proxy.uba.uva.nl:2443/login.aspx?direct=true&db=buh&AN= 123446102&site=ehost-live&scope=site.
Mohammadi, N., Zangeneh, M., (2016). Customer credit risk assessment using artificial neural networksIJ Information Technology and Computer Science, 8 (3) , 58-66.
Ngufor, C., Van Houten, H., Caffo, B.S., Shah, N.D., McCoy, R.G.,(2019). Mixed Effect Machine Learning: a framework for predicting longitudinal change in hemoglobin A1cJ. Biomed. Inform, 56-67
Ole Hjelkrem.L , Eilif de Lange.P., (2023). Explaining Deep Learning Models for Credit Scoring with SHAP: A Case Study Using Open Banking Data, J. Risk Financial Management., 16(4), 221; https://doi.org/10.3390/jrfm16040221.
Oquab, M., Bottou, L., Laptev, I., Sivic, J., (2014). Learning and Transferring Mid-Level Image Representations using Convolutional Neural Networks, in: IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, United States. URL: https://hal.inria. fr/hal-00911179. conference version of the paper.
[1] - دانشجوی دکتری رشته مدیریت صنعتی، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران
[2] - دانشیار رشته مدیریت صنعتی ، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران
[3] - استادتمام رشته مدیریت صنعتی، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران
[4] - دانشیار رشته مدیریت صنعتی ، دانشگاه تهران، تهران، ایران
[5] -Convolutional neural network
[6] - Long-Short Term Memory
[7] - Efficient solution
[8] - Non dominated solution
[9] - Data Cleaning
[10] - Data Transformation
[11] - factor
[12] - numeric
[13] 4 -missing value
[14] 5 -data science
[15] 6 -data frame
[16] -K- nearest neighbors algorithm
[17] - Silhouette Coefficient
[18] - K-Means
[19] -k-medoids