کد مقاله : 1401120841383 بازدید : 6366 صفحه: 149 - 167

نوع مقاله: پژوهشی

پیش‌بینی بازار سهام با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته و الگوریتم‌های سری زمانی

محورهای موضوعی : فناوری اطلاعات و ارتباطات

1 - صنعتی امیرکبیر
2 - استاد داشگاه صنعتی امیرکبیر

تاریخ دریافت : 1400/04/14 تاریخ پذیرش : 1401/04/03 تاریخ انتشار : 1401/12/10

کلید واژه: پیش‌بینی, الگوریتم بهینه‌سازی ملخ بهبود یافته, شبکه عصبی GMDH, پیش‌بینی, مدل‌سازی,

چکیده مقاله :

پیش‌بینی بازار سهام به عنوان یک زمینه جذاب و همچنین چالش برانگیز برای سرمایه گذاران در بازارهای مالی عمل می‌کند. بسیاری از مدل‌های مورد استفاده در پیش‌بینی بازار سهام قادر به پیش‌بینی دقیق نیستند یا این مدل‌ها نیاز به تعداد داده ورودی بسیار زیادی دارند که باعث افزایش حجم شبکه‌ها و پیچیدگی یادگیری می‌شود که همه این موارد در نهایت موجب کاهش دقت در پیش‌بینی می‌شود. این مقاله یک روش برای پیش‌بینی بازار سهام را پیشنهاد می‌دهد که این روش قادر هست به طور موثر وضعیت بازار سهام را پیش‌بینی کند. در این مقاله، برای کاهش حجم داده‌های ورودی از قیمت گذشته بازار استفاده شده و این داده‌ها در یک مدل رگریسور قرار داده شده است. در این حالت، با ارایه یک روش مبتنی بر الگوریتم بهینه‌سازی ملخ بهبود یافته، تعیین می‌شود که داده‌های فعلی بازار بورس به کدام داده‌های قبلی وابسته هستند و با استفاده از داده‌های قبلی می‌توان داده جدید را پیش‌بینی کرد. برای پیش‌بینی سری زمانی نیز از روش‌های شبکه عصبی GMDH، شبکه نروفازی و شبکه عصبی استفاده شده است؛ به علاوه، در این مقاله از روش‌های متناسب‌سازی داده‌ها با استفاده از الگوریتم‌های مختلف استفاده شده است که این روش‌ها می‌توانند در پیش‌بینی بازار موثر باشند. در نهایت، از مجموعه داده شرکت تسلا برای اعتبارسنجی و تست الگوریتم‌های ارایه شده استفاده شده است و نتایج شبیه‌سازی در پایان آمده است. همانطور که در قسمت شبیه‌سازی نشان داده شده، با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته، موثرترین خروجی‌ها برای پیش‌بینی ارزش سهام به دست آمده و در نهایت با استفاده از چند حالت مختلف پیش‌بینی انجام شده و نتایج روش‌های مختلف مورد مقایسه قرار گرفته و ارزیابی بر اساس معیار خطای میانگین مربع (RMSE) انجام شده است. مدل پیشنهادی پیش بینی بازار سهام دارای حداقل RMSE=4.05 است که نشان دهنده اثربخشی روش پیشنهادی در پیش بینی بازار سهام است. نتایج نشان می‌دهد که در بین الگوریتم‌های ارایه شده مربوط به پیش‌بینی سری زمانی، شبکه GMDH با الگوریتم ترکیبی ارایه شده، بهترین نتیجه را در بر داشته است.

چکیده انگلیسی:

Stock market prediction serves as an attractive and challenging field for researchers in financial markets. Many of the models used in stock market prediction are not able to predict accurately or these models require a large amount of input data, which increases the volume of networks and learning complexity, all of which ultimately reduce the accuracy of forecasting. This article proposes a method for forecasting the stock market that can effectively predict the stock market. In this paper, the past market price is used to reduce the volume of input data and this data is placed in a regressor model.

منابع و مأخذ:

[1]. Buettner R. Predicting user behavior in electronic markets based on personality-mining in large online social networks: A personality-based product recommender framework. The International Journal on Networked Business. Springer, 2016. pp. 1–19.
[2]. Mosavi A, Vaezipour A. Developing effective tools for predictive analytics and informed decision. University of Tallinn, Technical Report. 2013.
[3] Jones ER. Neural Networks’ Role in Predictive Analytics. DM Review Special Report. 2008.
[4] Krauss C, Do XA, Huck N. Deep neural networks, gradient boosted trees, random forests: Statistical arbitrage on the S&P 500. Eur J Oper Res. 2017;259:689–702.
[5] Hiransha M, Gopalakrishnan EA, Menon VK, Soman KP. NSE stock market prediction using deep-learning models. Procedia Comput Sci. 2018;132: 1351–1362.
[6] Abraham A, Nath B, Mahanti PK. Hybrid intelligent systems for stock market analysis. In: Proceedings of International Conference on Computational Science. San Francisco, CA. Springer-Verlag, Berlin Heidelberg, 2001. pp. 337–345.
[7] Vijaya P, Raju G, Ray SK. Artificial neural network-based merging score for Meta search engine. J Central South Univ. 2016;23:2604–2615.
[8] Evans C, Pappas K, Xhafa P. Utilizing artificial neural networks and genetic algorithms to build an algo-trading model intra-day foreign exchange speculation. Math Comput Model. 2013;58:1249–1266.
[9] Sun BQ, Guo H, Karimi HR, et al. Prediction of stock market futures based on fuzzy sets and multivariate fuzzy time series. Neurocomputing. 2015; 151:1528–1536.
[10] Efendi R, Arbaiy N, Deris MM. A new procedure in stock market forecasting based on fuzzy random auto-regression time series model. Inform Sci. 2018;441:113–132.
[11] Khedr AE, Yaseen N. Predicting stock market behavior using data mining technique and news sentiment analysis. Int J Intell Syst Appl. 2017;9:22.
[12] Ahmadi E, Jasemi M, Monplaisir L, et al. New efficient hybrid candlestick technical analysis model for stock market timing on the basis of the Support Vector Machine and Heuristic Algorithms of Imperialist Competition and Genetic. Expert Syst Appl. 2018;94:21–31.
[13]. Safari Dehnavi, V., & Shafiee, M. (2020). »LQR for Generalized Systems Using Metaheuristic Algorithms Based on Disturbance Observer«. 28th Iranian Conference on Electrical Engineering (ICEE), 2020, 08, 04, Tabriz, Iran.
[14]. Sabri, M. (2018). »Stabilization and control of power system using meta-heuristic algorithms«. Karafan (TVU), 14 (42), 33-55.
[15]. Pourdadashi Komachali, F., & Shafiee, M. (2020). »Sensor fault diagnosis in fractional-order singular systems using unknown input observer«. International Journal of Systems Science, 51 (1), 116-132.‏
[16] Huang, W. (2007). »Neural networks in finance and economics forecasting«. International Journal of Information Technology & Decision Making, 6 (1), 113-140.‏
[17] Dennis, O. & Mossman, CH. (2003). »Neural network forecasts of Canadian stock returns using accounting ratios«. International Journal of Forecasting, 19 (3), 453-465.‏
[18] Kelly, J. (2011). »The current stock of money: an aggregation theoretic measure of narrowly defined money«. Applied Economics Letters, 18 (7), 659-664.‏
[19] Moayedi, H. (2020). »Optimization of ANFIS with GA and PSO estimating α ratio in driven piles«. Engineering with Computers, 36 (1), 227-238.‏
[20] Sajadi, A. (2020). »Estimation of cetane numbers of biodiesel and diesel oils using regression and PSO-ANFIS models«. Renewable Energy, 158 (1), 465-473.‏
[21] Çakıt, E. (2020). »Assessing safety at work using an adaptive neuro-fuzzy inference system (ANFIS) approach aided by partial least squares structural equation modeling (PLS-SEM)«. International Journal of Industrial Ergonomics, 76(1), 102925- (in press).‏
[22] Choo, K. (2018). »Symmetries and many-body excitations with neural-network quantum states«. Physical review letters, 121 (16), 167-204.‏
[23] Dai, A., & Quoc V. (2020). »Training a document classification neural network«, U.S. Patent No. 10,528,866. 7.‏
[24] Shqair, M. (2020). »Adaptation of conformable residual power series scheme in solving nonlinear fractional quantum mechanics problems«. Applied Sciences, 10 (3), 890-912.‏
[25] Erik, C., Gálvez, J., & Avalos, O. (2020). »Gravitational Search Algorithm for Non-linear System Identification Using ANFIS-Hammerstein Approach«. Recent Metaheuristics Algorithms for Parameter Identification (Springer), 854 (1), 97-134.‏
[26] Bobyr, M., & Sergey G. (2020). »A nonlinear method of learning neuro-fuzzy models for dynamic control systems«. Applied Soft Computing, 88 (1), 106030-106044.‏
[27] SafariDehnavi, Vahid, and Masoud Shafiee. "The prediction of stock value by using the proposed fuzzy neural network and hybrid algorithm." Karafan Quarterly Scientific Journal 18.1 (2021): 203-220.‏
[28] Pourzamani, Z. & Miralavi, H. (2018). »Provide a model for stock price forecasting using meta-innovative methods and neural networks«. Quarterly Journal of Financial Management and Securities, 10 (40), 57-83 (in Persian).
[29] Samadipour, S., Matinfard, R. & Torkashvand, A. (2020). »Investigating and predicting the decline or growth of stock companies in a certain period of time using data mining classification technique«. The Third International Conference on New Strategies in Engineering, Information Science and Technology in the Next Century, 2020, 05, 20, Tehran, Iran (in Persian).

متن کامل:

دو فصلنامه علمي

فناوري اطلاعات و ارتباطات ایران

سال چهاردهم، شماره‌هاي 53 و 54، پاییزو زمستان 1401

صفحات: 149تا 167

$E:\E Drive\logo\iicta Logo0.JPG$

Stock market prediction using improved grasshopper optimization algorithm and time series algorithms

Vahid Safari Dhanavi*، Masoud Shafi'i**

* Faculty of Electrical Engineering, Amirkabir University of Technology, Iran

** Faculty of Electrical Engineering, Amirkabir University of Technology, Iran

Abstract:

This paper proposes a stock market prediction method to predict stock value effectively. In this article, the one-time price of the market is used to reduce the volume of input data, and by presenting a method based on the improved grasshopper optimization algorithm, the dependence of the current data of the stock market on the previous data is determined, which leads to the reduction of the order of the model, and as a result, The number of network input is increased, by improving the learning rate of the grasshopper optimization algorithm, the results with less error were obtained. After that, stock value prediction was made using three separate neural networks, and finally, Tesla and NASDAQ datasets were used to validate and test the algorithm. As shown in the simulation section, the most effective outputs for stock value forecasting were obtained using the improved grasshopper optimization algorithm. Finally, several forecasting modes were used, the results of different methods were compared, and an evaluation was made based on the root mean square error criterion. If the obtained MSE is less than the specified value, only the features of the previous input are used. Suppose the error is more than the specified limit. In that case, statistical features such as the average of a week, maximum, minimum in a week, skewness, standard deviation, and the logarithm of these features are used. The proposed stock market prediction model for the Tesla symbol has a root mean square error value of 4.05, which shows the proposed method's effectiveness in forecasting the stock market. The results show that the group method of data modeling with the presented combined algorithm has the best result among the presented algorithms related to time series forecasting.

Keywords: Prediction, improved grasshopper optimization algorithm, modeling.

پیش‌بینی بازار سهام با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته و الگوریتم‌های سری زمانی

وحید صفری دهنوی *و مسعود شفیعی**

* دانشکده مهندسی برق، دانشجوی دکترا ، دانشگاه صنعتی امیرکبیر، ایران

** دانشکده مهندسی برق، استاد ، دانشگاه صنعتی امیرکبیر، ایران

تاریخ دریافت:14/04/1400 تاریخ پذیرش: 03/04/1401

نوع مقاله: پژوهشی

چکیده

این مقاله یک روش برای پیش‌بینی بازار سهام را پیشنهاد می‌دهد که می‌تواند به طور موثر ارزش سهام را پیش‌بینی کند. در این مقاله، برای کاهش حجم داده‌های ورودی از قیمت گذشته بازار استفاده شده است و با ارائه یک روش مبتنی بر الگوریتم بهینه‌سازی ملخ بهبود یافته، وابستگی داده‌های فعلی بازار بورس به داده‌های قبلی تعیین می‌شود که این الگوریتم منجر به کاهش مرتبه مدل و در نتیجه تعداد ورودی شبکه می‌شود، به وسیله بهبود نرخ یادگیری الگوریتم بهینه‌سازی ملخ، نتایج با خطای کمتری به دست آمد. پس از آن، پیش‌بینی ارزش سهام با استفاده از سه شبکه عصبی مجزا انجام شد و در نهایت، از مجموعه داده شرکت تسلا و NASDAQ برای اعتبارسنجی و آزمایش الگوریتم استفاده شد. همانطور که در قسمت شبیه‌سازی نشان داده شده، با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته، موثرترین خروجی‌ها برای پیش‌بینی ارزش سهام به دست آمد و در نهایت با استفاده از چند حالت مختلف پیش‌بینی انجام شد و نتایج روش‌های مختلف مورد مقایسه قرار گرفت و ارزیابی بر اساس معیار خطای جذر میانگین مربعات انجام شد. در صورتی که MSE به دست آمده کمتر از مقدار مشخص شده باشد، صرفا از ویژگی‌های ورودی قبلی استفاده می‌شود؛ در صورتی که خطا از حد مشخص شده بیشتر باشد، از ویژگی‌های آماری مانند میانگین یک هفته، بیشینه و کمینه در یک هفته، چولگی و انحراف معیار و لگاریتم این ویژگی‌ها استفاده می‌شود. مدل پیشنهادی پیش‌بینی بازار سهام برای نماد تسلا دارای مقدار خطای جذر میانگین مربعات 4.05 است که نشان دهنده اثربخشی روش پیشنهادی در پیش‌بینی بازار سهام است. نتایج نشان می‌دهد که در بین الگوریتم‌های ارائه شده مربوط به پیش‌بینی سری زمانی، روش گروهی مدلسازی داده با الگوریتم ترکیبی ارائه شده، بهترین نتیجه را در بر داشته است.¹

واژگان کلیدی:پیش‌بینی، الگوریتم بهینه‌سازی ملخ بهبود یافته، مدلسازی.

[1] v.safari@aut.ac.irنویسنده مسئول:وحید صفری دهنوی

1. مقدمه

پیش‌بینی روند بازار از جمله پژوهش‌های کاربردی و مورد علاقه متخصصان پیش‌بینی هست و این موضوع همواره توسط سازمان‌های مختلف مورد بحث و پژوهش قرار گرفته است. بسیاری از فعالان بورس با استفاده از تجربه قبلی یک مدل ذهنی از وضعیت بازار را ایجاد می‌کنند و بدین وسیله می‌توانند پیش‌بینی را انجام دهند؛ در این مقاله، تحلیل این مسئله به روشی علمی انجام می‌شود و یک برنامه پیش‌بینی داده‌های مالی توسعه داده می‌شود که در آن از داده‌های شرکت تسلا و شاخص NASDAQ برای آموزش و آزمایش استفاده شده است. در این حالت، برای داده‌های تسلا 70 درصد داده‌ها به عنوان مجموعه آموزش، 15 درصد داده به عنوان داده اعتبارسنجی و 15 درصد به عنوان داده آزمایش در نظر گرفته می‌شود. برای داده‌های بورس NASDAQ، به منظور مقایسه با مقالات جدید، 80 درصد داده‌ها به عنوان آموزش و 20 درصد به عنوان داده‌های آزمایش در نظر گرفته می‌شوند. استخراج اطلاعات از داده‌ها با مفهوم پیش‌بینی شناخته می‌شود که زمینه‌ای مهم در داده کاوی است که می‌تواند برای پیش‌بینی الگوهای رفتاری استفاده شود[1]. پیش‌بینی در دو حالت انجام می‌شود: در روش اول، پیش‌بینی بر اساس مشاهده رابطه بین داده‌هایی که در گذشته اتفاق افتاده و داده‌هایی که در حال حاضر اتفاق می‌افتد، انجام می‌شود؛ به عبارتی در پیش‌بینی از داده‌های قبلی استفاده می‌شود و به وسیله این داده‌ها یک مدل مناسب به دست می‌آید و سپس از مدل طراحی شده برای پیش‌بینی داده‌های آینده استفاده می‌شود. اگر روش اول دارای خطای قابل پذیرش نبود، ویژگی‌های زمانی و آماری به مجموعه ویژگی‌هایی که به عنوان ورودی به شبکه داده می‌شود، اضافه می‌شوند.

مدیریت ریسک، بازاریابی مبتنی بر هوش تجاری، تحلیل رفتار مشتری و مدیریت ارتباط با مشتری برخی از کاربردهای پیش‌بینی است[2]. در این خصوص، در مقالات از روش‌های مختلفی مانند شبکه عصبی کانولوشنی، شبکه‌های عصبی عمیق، روش‌های یادگیری ماشین و... که در رگرسیون و پیش‌بینی مفید هستند، استفاده شده است[3]. شبکه‌های عصبی برای پیش‌بینی، طبقه‌بندی و تجزیه و تحلیل داده‌ها استفاده می‌شوند؛ به علاوه در سال‌های اخیر از شبکه عصبی عمیق نیز به منظور پیش‌بینی استفاده شده است[4]. در حوزه پیش‌بینی شاخص بورس، مقالات ارائه شده در چند زمینه کلی به پژوهش پرداخته‌اند؛ برخی از این مقالات به پیشنهاد شبکه‌های جدید جهت بهبود دقت پیش‌بینی پرداخته‌اند[5-10,13-19]، دسته دیگری از پژوهش‌ها به ارائه ویژگی‌های جدید جهت کاهش خطای پیش‌بینی پرداخته‌اند[9-11]، دسته دیگر پژوهش‌ها به ارائه مدل‌های مناسب جهت پیش‌بینی داده پرداخته‌اند[8,16,20,21] و برخی دیگر به توسعه الگوریتم جهت آموزش شبکه‌ها پرداخته‌اند[22,23].

در [5] استفاده از مجموعه‌های فازی به منظور کاهش عدم قطعیت در پیش‌بینی به عنوان نوآوری اصلی معرفی شده است. اگر چه این شبکه‌ها می‌توانند در پیش‌بینی داده‌های بورس استفاده شوند؛ منتها این شبکه‌ها دارای ساختاری پیچیده هستند که این ساختار می‌تواند آموزش شبکه را با چالش‌های متفاوتی مواجه کند؛ به خصوص هنگامی که تعداد داده کم هست. نوآوری اصلی[6] استفاده از شبکه عصبی عمیق برای پیش‌بینی داده‌های بورس هست؛ استفاده از شبکه عصبی عمیق، دارای محدودیت‌های مهمی هست به خصوص هنگامی که بخواهیم پیش‌بینی را به صورت برخط انجام دهیم و با استفاده از داده‌های یک روز مشخص، پیش‌بینی داده‌های ثانیه‌هایی بعد را انجام دهیم. در [7]، از روش‌های یادگیری ماشین و شبکه عصبی عمیق جهت رگرسیون و همچنین کلاس‌بندی استفاده شده است و نوآوری مقاله، استفاده از این روش‌ها در پیش‌بینی هست. در [8] از ترکیب منطق فازی و سری زمانی برای پیش‌بینی شاخص بورس چین استفاده شده است. در [9] از یک روش فازی بهبود یافته استفاده شده که روی داده‌های ورودی آن پردازش صورت گرفته است که نوآوری اصلی این مقاله پردازش داده‌های ورودی هست. در [10] از داده‌های ورودی متفاوتی شامل اطلاعات گذشته و تحلیل اخبار استفاده شده است و این مقاله به دقت 89.8 درصد دست یافته است. در [11]، از روش بردار پشتیبان ماشین و روش‌های پیش‌پردازش داده‌های ورودی استفاده شده است و مقایسه در دو حالت بدون پیش‌پردازش و در حالت پیش‌پردازش داده‌های ورودی شبکه مقایسه شده است. در [12]، یک روش جدید مبتنی بر یادگیری ماشین پیشنهاد شده است و نوآوری مقاله در زمینه ارائه شبکه جدید بوده است.

به علت ساختار غیرخطی داده‌های بورس، مقالات متعددی نشان داده‌اند که روش‌های محاسبات نرم نتایج بهتری از رگرسیون و فیلتر کالمن دارند [13]. همچنین در [14] بیان شده که شبکه‌های عصبی در عصر حاضر یک معجزه برای پیش‌بینی هست و در این مقاله به مزیت شبکه‌های عصبی نسبت به روش‌های استراتژی خرید و فروش اشاره شده؛ دلیل اصلی استفاده از شبکه‌های مبتنی بر تئوری عصبی، توانایی مدلسازی روابط غیرخطی بین متغیرها هست[14]. در [14] از شبکه‌های عصبی و داده‌های مالی یک سال برای پیش‌بینی نرخ رشد اقتصادی آمریکا استفاده شده است. در [15] نتایج برای بازارهای کانادا بررسی شده که شبکه عصبی نتایج مناسبی در مقایسه با رگرسیون داشته؛ در این مقاله صرفا از داده‌های روز گذشته استفاده شده؛ در صورتی که برای پیش‌بینی دقیق‌تر نیاز به تحلیل داده‌های بلند مدت هست.

روش دیگری که بدین منظور استفاده می‌شود، روش تخمینگر حداقل درجه هست. این روش نتایج قابل قبول و دقت مناسبی دارد؛ منتها در این روش سرعت آموزش با افزایش متغیرها کاهش می‌یابد[16]. در [17] نیز از سری‌های توانی برای تقریب و حل توابع و معادلات استفاده شده است که در این مقاله سعی در تعمیم این روش‌ها برای پیش‌بینی داده‌های بورس هست. در مقالات بسیاری مانند [18] از شبکه نروفازی استفاده شده و بدین وسیله یک تابع غیرخطی تقریب زده شده است که این تقریب می‌تواند در تشخیص مدل شاخص بورس نیز استفاده شود. در [19] از شبکه عصبی جهت پیش‌بینی داده‌های آینده بورس استفاده شد. در این حوزه، یکی از کارهای جدید بررسی رشد یا نزول ارزش سهام هست که در [20] مورد بررسی قرار گرفته؛ در این مقاله، هدف اصلی تعیین صعود یا نزول شاخص هست و پیش‌بینی میزان در گام‌های بعدی پژوهش قرار می‌گیرد. در [21] از ARIMA¹ و شبکه عصبی به منظور پیش‌بینی داده‌های بورس استفاده شده است. در [22] نیز از مدل ARIMA و داده‌های روزانه مربوط به سال‌های 1993 تا 2017 استفاده شده است. مدل‌های سری زمانی آماری مانند فیلتر کالمن، فضای حالت، ARIMA و رگرسیون در تحلیل بازار سهام استفاده می‌شوند. در این مدل‌ها متناسب‌سازی داده‌های دارای ماهیت غیرخطی، دشوار است و عملاً این مدل‌ها برای مدلسازی و پیش‌بینی سری زمانی با ماهیت غیرخطی مناسب نیستند. در [23] از بردار پشتیبان و الگوریتم کرم شب‌تاب بهبود یافته برای داده‌های بورس استفاده شده است. همچنین در [24] از الگوریتم ژنتیک برای پیش‌بینی بورس استفاده شده است.

این مقاله در دو حوزه مورد بررسی قرار گرفته است:

در حوزه اول: از داده‌های قبل سهام برای پیش‌بینی قیمت آینده استفاده شده است که مزیت این روش نسبت به مقالات قبل، کاهش تعداد داده ورودی شبکه عصبی و کاهش اندازه شبکه هست. در این حالت، تعیین مرتبه مدل با استفاده از یک روش جدید مبتنی بر الگوریتم بهینه‌سازی ملخ بهبودیافته انجام می‌گیرد. در حوزه الگوریتم نیز با ارائه یک نرخ یادگیری تطبیقی، الگوریتم بهینه‌سازی ملخ، بهبود یافته است. به منظور نشان دادن نتایج از نماد تسلا و شاخص NASDAQ استفاده شده است. در نتیجه از داده‌های قبلی سهام برای پیش‌بینی تسلا و NASDAQ استفاده شده است(شبیه‌سازی 1-5 و 2-5).

در حوزه دوم، در صورتی که خطای پیش‌بینی بیشتر از مقدار تعیین شده باشد، علاوه بر اطلاعات گذشته سهام، از سایر ویژگی‌های سهام در حوزه زمان استفاده می‌شود که منجر به کاهش خطا می‌شود. در این حالت، تعیین مرتبه مدل AR² قیمت گذشته بر اساس الگوریتم ارائه شده هست و بهینه‌سازی پارامترهای غیرخطی نیز بر اساس الگوریتم ملخ هست. در این حالت، از پنجره گذاری روی سیگنال استفاده شده است و پنجره‌های در نظر گرفته شده برای استخراج ویژگی 3، 5، 7، 14، 21 و 30 روزه بوده است.

2. پرسش‌های پژوهش و اهداف

این مقاله برای پاسخ به سوالات پژوهشی زیر ارائه شده است:

- روند تغییر بازار مالی به خصوص نمادهای بورس در کشورهای مختلف مانند نماد تسلا با چه الگویی تغییر می‌کند و بر چه مدلی منطبق هست؟

- مقایسه‌ای بین روش‌های رگرسیون و روش‌های محاسبات نرم انجام گیرد و بررسی گردد که شبکه‌های عصبی نتیجه بهتری دارد یا روش‌های رگرسیون؟

- در اغلب مقالات از داده‌‌های بازارهای موازی مانند بازار نفت و طلا برای پیش‌بینی بورس استفاده شده است، در این حالت آیا می‌توان بدون استفاده از داده بازارهای موازی و کاهش ورودی‌ها الگوی مناسب یک نماد را به دست آورد؟

- آیا متناسب‌سازی داده‌ها در یک مدل خطی یا غیرخطی می‌تواند برای پیش‌بینی و تحلیل روند بازار بورس استفاده شود؟

در این پژوهش، هدف این است که با استفاده از روش‌های مختلف پیش‌بینی سری زمانی و همچنین روش‌های متناسب‌سازی داده‌ها یک مدل مناسب برای پیش‌بینی نمادهای بورس به دست آورد و همچنین یک مقایسه‌ای بین این روش‌ها انجام داد و روش مناسب را انتخاب کرد. در محاسبات نرم، هدف این است که با کمترین تعداد ویژگی ورودی، یک پیش‌بینی از وضعیت آینده نمادهای بورس در کشورهای مختلف داشت. در این مقاله، ابتدا با استفاده از الگوریتم‌های فراابتکاری داده‌های موثر در پیش‌بینی پیشنهاد شده است، در نهایت یکسری الگوریتم پیش‌بینی سری زمانی و همچنین متناسب‌سازی داده‌ها ارائه شد و در نهایت یک مقایسه بین این روش‌ها انجام شد.

3. روش پژوهش

3-1. گام اول: رویکرد روش

در این روش، با استفاده از داده‌‌های بازارهای مالی مانند قیمت روز گذشته سهام و همچنین با معرفی الگوریتم‌های مناسب پیش‌بینی سری زمانی، می‌توان یک مدل مناسب را به دست آورد و به پیش‌بینی ارزش سهام پرداخت. در این حالت، روش‌های مختلف برای انجام یک مسئله پرکاربرد شامل پیش‌بینی ارزش نماد تسلا پیشنهاد شده است. در این حالت، داده‌‌های زمان‌های مختلف نماد تسلا جمع‌آوری و از این داده‌‌ها برای آموزش شبکه‌ها استفاده شد. در این حالت، به وسیله داده‌های فعلی و همچنین مدل آموزش داده شده برای پیش‌بینی قیمت آینده سهام استفاده شد. در این حالت، دو هدف دنبال می‌شود، اول اینکه بتوان مدت زمان پیش‌بینی را طولانی کرد و با کمک داده‌های با فاصله زمانی طولانی‌تر یک پیش‌بینی قابل قبول ارائه داد و در گام دوم، با استفاده از روش‌های متناسب‌سازی داده‎ها، الگو و روند کلی تغییر نمادها را بررسی کرد.

3-2. گام دوم: روش جمع‌آوری داده‌ها برای تعیین مدل و پیش‌بینی نمادهای بورس

در این شبکه‌ها برای تعیین مدل مناسب مانند شبکه‌های عصبی نیاز به تعدادی داده هست که این داده‌ها برای تعیین داده‌های موثر گذشته برای پیش‌بینی ارزش آینده و همچنین مقداردهی اولیه و بهینه‌سازی پارامترها مورد استفاده قرار می‌گیرند. یکی از مشکلاتی که در روش‌های شبکه عصبی به خصوص مدل‌های پیچیده وجود دارد، بیش‌برازش هست. این حالت در شرایطی به وجود می‌آید که مدل مورد نظر یک مدل پیچیده و غیرخطی هست؛ در صورتی که تعداد داده در دسترس محدود هست. در این حالت، باید یک تعادل بین دقت مورد نیاز و پیچیدگی شبکه که وابسته به تعداد داده هست، ایجاد کرد که بتوان بدون بیش‌برازش به دقت مورد نظر دست یافت. در این مقاله، از داده‌‌های نماد تسلا برای آموزش و آزمایش شبکه استفاده شده است. در این حالت، داده‌‌های نماد تسلا در قالب اکسل جمع‌آوری شده و این داده‌ها به نرم‌افزار متلب منتقل شد و پس از آن الگوریتم‌‌های مناسب روی این داده‌ها آزمایش شد و در نهایت نتایج شبیه‌سازی آورده شده است.

3-3. گام سوم: روش‌های تحلیل

در این پژوهش، ابتدا داده‌‌های نماد تسلا جمع‌آوری شد، سپس کد شبکه‌های مختلف و الگوریتم‌های مناسب نوشته شد. سپس داده‌ها به سه قسمت داده‌های آموزش، آزمایش و اعتبارسنجی تقسیم شد. در این شرایط، مرتبه مدل مناسب و تعیین پارامترهای گذشته که در پیش‌بینی موثر هستند و همچنین تعیین پارامترهای شبکه‌ها به وسیله داده‌های آموزش انجام می‌شود و پس از آن مدل مناسب به دست می‌آید و در نهایت شبکه روی داده‌‌های مجزا از داده‌‌های آموزش آزمایش می‌شود و نتایج در قسمت شبیه‌سازی آورده شده است.

3-4. گام چهارم: ارزیابی شبکه‌ها

در نهایت به وسیله داده‌های آزمایش، شبیه‌سازی انجام شد و پس از آن به وسیله شاخص خطای جذر میانگین مربعات به ارزیابی مدل پرداخته شد. در این حالت، نتایج پیش‌بینی برای شاخص نماد تسلا مورد قبول بود. در این حالت، به وسیله الگوریتم‌هایی که استفاده شد، تعداد داده‌های ورودی کاهش یافت که موجب کاهش حجم شبکه شده است.

4. یافته‌ها و تئوری پژوهش

4-1. انتخاب مدل مناسب و مرتبه مدل برای پیش‌بینی

برای پیش‌بینی داده‌های بورس، نیاز به تعیین یک مدل مناسب هست. پس از آن نیاز به تعیین مرتبه مدل هست که بتوان به این نکته پی برد که داده‌های فعلی به کدام داده‌های قبلی وابسته هستند. در حالت کلی، مدل‌های گسسته به صورت (1) بیان می‌شود[25].

(1)

که در آن، y خروجی، u ورودی و e خطا هست.

در این مقاله، مطلوب این است که بدون در نظر گرفتن متغیرهای جهانی مانند نفت، طلا و... بتوان یک مدل برای پیش‌بینی مناسب به دست آورد. در این حالت، این روش باعث کاهش تعداد ورودی در شبکه شده است. با تطبیق این خواسته‌ها با مدل‌های خطی موجود، مدل AR بهترین روش برای تعیین مرتبه مدل هست؛ چراکه از داده‌های گذشته نمادهای بورس استفاده می‌کند و برای کاهش هزینه، ورودی مجزا در نظر گرفته نشده است. در مدل AR رابطه (2) برقرار هست[25].

(2)

در (1)، خروجی و ورودی مدل هست؛ به علاوه در مدل AR، رابطه (3) برقرار هست.

(3)

در این حالت، با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته، مرتبه مدل تعیین شده؛ به صورتی که ضرایب مدل مورد نظر با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته به صورتی به دست آورده شود که رابطه (4) به دست بیاید.

Findwhere:

min (4)

در (4)، n بیانگر تعداد نمونه هست و ضرایبی که بیشترین اندازه را دارند، به عنوان موثرترین عناصر انتخاب می‌شوند و جمله‌‌های مربوط به این ضرایب را نگه می‌داریم و سایر عبارات حذف می‌شوند.

4-2. تعیین مرتبه مدل با الگوریتم بهینه‌سازی ملخ بهبود یافته

در اغلب الگوریتم‌های فراابتکاری مراحل جستجو در دو گام پیگیری می‌شود:

در گام اول همه عامل‌ها به صورت سراسری و تصادفی به جستجو می‌پردازند و در گام دوم، عامل‌ها به صورت محلی در فضای مورد نظر گردش می‌کنند. در این روش، رفتار ریاضی عامل‌ها که در این مقاله ملخ‌ها هستند به صورت (5) نمایش داده می‌شود.

(5)

در رابطه (5)، بیانگر تعداد عامل‌ها، موقعیت عامل‌ها، بیانگر تعامل اجتماعی بین عامل‌ها، بیانگر نیروی جاذبه و بیانگر اثر باد هست. در این حالت نحوه رفتار عامل‌ها به صورت (6) نشان داده می‌شود.

(6)

که پارامترهای (6) بر اساس روابط (7) به دست می‌آید.

(7)

با جایگذاری (7) در (5) و در نظر گرفتن تاثیر بهترین نتیجه جستجوی قبل، (8) به دست می‌آید[26].

(8)

که در آن حد بالا، حد پایین، ‌ بهترین نتیجه به دست آمده و نرخ یادگیری متناسب با خطا هست. یکی از نوآوری‌های این مقاله، ارائه پارامتر نرخ یادگیری به صورت تطبیقی وابسته به خطا هست که در حالتی که حساسیت خطا زیاد هست، به سرعت افزایش می‌یابد و هنگام کاهش حساسیت خطا و نزدیکی به پاسخ بهینه، با نرخ کمتری اعمال می‌شود. در [26]، نرخ یادگیری به صورت خطی کاهش پیدا خواهد کرد. نرخ یادگیری خطی در بسیاری از کاربردها مناسب نیست؛ چراکه تا زمانی که خطا زیاد باشد، باید نرخ یادگیری بزرگ انتخاب شود و در صورت رسیدن به نزدیک نقطه بهینه، نرخ یادگیری کاهشی شود. در نتیجه در (9) یک مقدار برای حد بالای نرخ یادگیری به دست آمده است.

(9)

رابطه(9) منتج به یک رابطه تطبیقی برای نرخ یادگیری می‌شود؛ شیوه عملکرد این رابطه بدین صورت هست:

هنگامی که پارامترهای مجهول به دست آمدند، حساسیت خطا نسبت به پارامترهای به دست آمده سنجیده می‌شود و این حساسیت تشکیل‌دهنده حد بالای نرخ یادگیری تطبیقی تکرار بعدی هست. در صورتی که بزرگتر از 1 انتخاب شود و حساسیت خطا نسبت به پارامترها زیاد باشد، نرخ یادگیری نزدیک به مقدار خواهد بود، هنگامی که حساسیت خطا نسبت به پارامتر کم شود، نرخ یادگیری کاهش می‌یابد و با نرخ یادگیری معرفی شده در [26] به مقدار کمینه می‌رسد. در نتیجه مزیت نرخ یادگیری پیشنهاد شده در این مقاله نسبت به [26]، تطبیقی بودن این پارامتر بر اساس حساسیت خطا نسبت به پارامترها هست. اگر خطا برای پارامترهای خطی را به صورت(10) در نظر بگیریم، با جایگذاری (10) در (9)، رابطه (11) به دست می‌آید.

(10)

که در (10)، بردار پارامترها، خروجی، بردار معلوم و خطا هست.

که یک عدد دلخواه بزرگتر از 1 هست.

4-3. شبکه عصبی GMDH³

برای مدلسازی سیستم‌های پیچیده و پس از آن استفاده از مدل مناسب جهت پیش‌بینی که غالباً برای سیستم‌های دارای ساختار غیرخطی استفاده می‌شوند، می‌توان از شبکه‌های با ساختار غیرخطی استفاده کرد که یکی از روش‌های مناسب در این خصوص استفاده از چند جمله‌ای‌های (12) هست که با شناسایی و تعیین پارامترهای این چندجمله‌ای‌ها به وسیله الگوریتم‌های مناسب آموزش، می‌توان یک مدل مناسب و قابل قبول به دست آورد[27].

(11)

که در (12)، نشانگر خروجی سیستم، بردار ورودی و ضرایب این چندجمله‌ای هستند. می‌توان با استفاده از چندجمله‌ای درجه دوم این روابط را تقریب زد که این مورد باعث به وجود آمدن ساختارهای جدید خواهد شد. در این حالت بر اساس ترکیب دوتایی که از ورودی شبکه ساخته خواهد شد، می‌توان این تقریب را انجام داد. در این حالت، شبکه GMDH بر اساس این طرح کلی به وجود آمده و با توجه به ساختار غیرخطی می‌تواند به عنوان یک تقریب‌زن مناسب استفاده شود، در این حالت با شناسایی مدل مورد نظر و مناسب، می‌توان پیش‌بینی را با کمترین خطا انجام داد و به نتایج دلخواه دست یافت. شبکه عصبی GMDH همانند اغلب شبکه‌های عصبی، یک شبکه با چند لایه و پیشرو هست، استفاده از لایه‌های متعدد موجب افزایش قابلیت شبکه و توانایی مدلسازی سیستم‌های پیچیده و غیرخطی می‌شود. این شبکه همانند سایر شبکه‌های عصبی، دارای مجموعه‌ای از نرون‌ها هست؛ منتها در این شبکه روابط با استفاده از چندجمله‌ای‌های درجه دو به دست آمده‌اند. در این شبکه، هر لایه دارای تعدادی واحد هست که هر کدام از این واحدها دارای دو ورودی و یک خروجی هستند که ترکیب این واحدها با چندجمله‌ای‌ها ساختار کلی شبکه را تشکیل می‌دهند. در این حالت، واحدهای تشکیل دهنده شبکه به صورت چند جمله‌ای (13) نشان داده می‌شود[27].

(12)

ضرایب (13) بیانگر پارامترهای مجهول GMDH هستند که باید به گونه‌ای موثر انتخاب شوند. در این حالت، پارامترها به صورتی تعیین می‌شوند که خروجی تخمین زده شده به خروجی دلخواه و مورد نظر نزدیک شود و برای هر بردار ورودی ، مقدار به گونه‌ای به دست آید که میانگین مربعات خطا کمترین مقدار باشد و در صورتی که میانگین مربعات خطا به حداقل مورد نظر نرسید، می‌توان از الگوریتم‌های مناسب دیگری استفاده کرد.

در این حالت، تابع خطا را به صورت (14) تعریف می‌کنیم که بیانگر مجموع مربعات اختلاف مقدار واقعی و مقدار تخمین زده شده هست.

(14)

در این حالت، می‌توان از (14) مشتق جزئی گرفت و در نهایت به (15) رسید.

(15)

که در (15)، بیانگر پارامترهای سیستم و بیانگر خروجی سیستم هست که به صورت (16) تعریف می‌گردد.

(16)

4-4. مدل‌های غیرخطی جهت پیش‌بینی

در این حالت، از مدل‌های غیرخطی برای مدلسازی مساله و سپس پیش‌بینی استفاده می‌شود، در این شبکه‌ها یکسری پارامترهای خطی و یکسری پارامتر غیرخطی وجود دارد که پارامتر‌های غیرخطی به وسیله الگوریتم بهینه‌سازی ملخ بهبودیافته بهینه می‌شوند و پارامترهای خطی نیز به وسیله الگوریتم‌های حداقل مربعات و حداقل مربعات بازگشتی تعیین می‌شوند.

مدل گاوسی: مدل گاوسی استفاده شده در این مقاله به صورت (17) هست. در این مقاله، وابستگی قیمت سهام به جملات قبل با استفاده از الگوریتم بهینه‌سازی ملخ تعیین می‌شود؛ سپس جملات و ویژگی‌هایی که بیشترین وابستگی را در پیش‌بینی داده‌های آموزش به منظور کمینه شدن خطا دارند، انتخاب می‌شوند. در (17)، m جمله قبلی که بیشترین تاثیر را در پیش‌بینی بورس داشتند، مورد استفاده قرار می‌گیرند. انتخاب این جملات به ترتیب نیست و این عبارت‌ها بر اساس کاهش خطای پیش‌بینی داده‌های آموزش به صورت هدفمند انتخاب می‌شوند.

(13)

که در (17)، پارامترهای خطی و و پارامترهای غیرخطی هستند که باید با استفاده از الگوریتم‌های مناسب جهت بهینه‌سازی پارامترهای غیرخطی بهینه شوند. در (17) از m ورودی که بر اساس روش تعیین مرتبه مدل به دست آمده است و n جمله گاوسی با پارامترهای انتقال و مقیاس مختلف استفاده می‌شود.

مدل چندجمله‌ای: این مدل به صورت (18) نمایش داده می‌شود.

(18)

که در (16)، پارامترهای خطی مدل هستند که باید به وسیله الگوریتم‌های خطی ارائه شده در 5-4 آموزش داده شوند. در (18)، از m جمله که بیشترین تاثیر را در پیش‌بینی داده‌های بورس مجموعه داده آموزش داشته‌اند، استفاده شده است.

شبکه نروفازی: در این مقاله، با استفاده از الگوریتم تعیین مرتبه مدل، موثرترین خروجی‌های قبلی در پیش‌بینی تعیین می‌شوند، سپس این خروجی‌ها به عنوان ورودی شبکه نروفازی مورد استفاده قرار می‌گیرند. نکته بسیار مهم این هست که هر چه تعداد ورودی‌های شبکه بیشتر شود، حجم شبکه بزگتر می‌شود، الگوریتم یادگیری سخت‌تر هست و خطای پیش‌بینی بیشتر می‌شود؛ بنابراین در این مقاله سعی شده به وسیله الگوریتم‌های ارائه شده تعداد ورودی شبکه کاهش یابد که منجر به کاهش اندازه شبکه نروفازی و ساده‌تر شدن الگوریتم یادگیری می‌شود. در این حالت، قوانین شبکه نروفازی به صورت زیر می‌باشد:

که در آن، m بیانگر تعداد ورودی و n بیانگر تعداد قانون هست. در این شبکه، m ورودی بر اساس تعداد جملات با بیشترین تاثیر در پیش‌بینی داده‌های بورس به دست می‌آید. شیوه به دست آوردن m ورودی بر اساس یک روش انتخاب ویژگی جدید مبتنی بر الگوریتم‌های فراابتکاری هست.

4-5. الگوریتم آموزش

برای آموزش پارامترهای شبکه با توجه به اینکه پارامترها خطی یا غیرخطی هستند، می‌توان از الگوریتم‌های مختلفی استفاده کرد. در این بین معمولا الگوریتم حداقل مربعات و حداقل مربعات بازگشتی برای تعیین پارامترهای خطی و الگوریتم گرادیان نزولی برای بهینه‌سازی پارامترهای خطی و غیرخطی استفاده می‌شوند؛ ولی گرادیان نزولی غالباً برای بهینه‌سازی پارامترهای غیرخطی استفاده می‌شود و در بین کلیه الگوریتم‌های مورد استفاده برای بهینه‌سازی پارامترهای غیرخطی، پرکاربرترین روش هست. نمای کلی کارکرد الگوریتم این مقاله در شکل1 نشان داده شده است. همانطور که در این شکل دیده می‌شود، ابتدا پیش‌بینی صرفا بر اساس داده‌های قبلی بورس انجام می‌شود؛ در صورتی که خطا بیشتر از حد تعیین شده باشد، ویژگی‌های زمانی-آماری دیگر نظیر میانگین، میانه، کمینه، بیشینه، چولگی و انحراف معیار در پنجره‌های 3، 5، 7، 14، 21 و 30 روزه نیز اضافه می‌شود.

شکل1. الگوریتم ارائه شده در این مقاله

به طور کلی طراحی شبکه و الگوریتم مورد نظر آموزش به صورت زیر طراحی شده است:

- مقادیر ابتدایی پارامترهای خطی شبکه GMDH، مدل گاوسی و شبکه نروفازی تعیین می‌شود؛ در این حالت، پارامترها بر اساس روش‌های تقریبی به دست می‌آیند. در الگوریتم‌های فراابتکاری این کار به وسیله تعداد جستجوی محدود انجام می‌گیرد.

- در صورتی که از شبکه‌ها و روش‌های تقریبی استفاده شود که دارای پارامترهای غیرخطی باشند، باید از الگوریتم گرادیان نزولی یا الگوریتم‌های فراابتکاری مانند الگوریتم بهینه‌سازی ملخ استفاده کرد که در این مقاله برای بهینه‌سازی پارامترهای غیرخطی از الگوریتم بهینه‌سازی ملخ بهبودیافته استفاده می‌شود.

-در گام بعد، به وسیله الگوریتم حداقل مربعات بازگشتی و داده جدید، پارامترهای خطی به روز می‌شوند.

الگوریتم حداقل مربعات در زمره الگوریتم‌های یکباره قرار می‌گیرد و به سرعت می‌تواند پارامترهای خطی شبکه را تعیین کند و بیشتر برای مقداردهی اولیه پارامترهای غیرخطی استفاده می‌شود. پارامترهای شبکه GMDH، پارامترهای وزن مدل گاوسی و پارامترهای استنتاج نروفازی نسبت به خروجی خطی می‌باشد و بدین وسیله می‌توان از الگوریتم حداقل مربعات استفاده کرد. این الگوریتم معمولاً یک بار در ابتدا یا انتهای الگوریتم جهت تعیین پارامترهای خطی استفاده می‌شود و در صورتی که داده‌ها و پارامترها در گذر زمان تغییر کنند، الگوریتم حداقل مربعات مناسب نیست و باید از الگوریتم حداقل مربعات بازگشتی استفاده کرد که می‌تواند به وسیله وارد شدن داده‌های جدید، به بهینه‌سازی پارامترهای خطی تغییرپذیر با زمان بپردازد.

-بهینه‌سازی پارامترهای خطی

مقداردهی اولیه پارامترها با روش حداقل مربعات: در صورتی که خروجی سیستم نسبت به پارامترها خطی باشد، می‌توان از الگوریتم حداقل مربعات استفاده کرد. در این حالت پارامترها از (19) به دست می‌آیند.

(19)

که در آن ورودی و پارامترهای شبکه هستند که در زمره پارامترهای خطی قرار می‌گیرند.

در این حالت، بردار بیانگر پارامترهای مجهول است که این پارامترها در (20) نشان داده شده است.

(20)

حال برای یافتن پارامترهای بهینه به گونه‌ای که شود و خطا کمینه مقدار ممکن شود. برای یافتن پارامترهای بهینه باید نسبت به پارامترها مشتق گرفت. در این حالت، (21) به دست می‌آید.

(17)

برای به دست آوردن مقدار موثر باید باشد که با استفاده از این شرط، (22) به دست می‌آید.

(22)

چنانچه ماتریس معکوس داشته باشد، به صورت (23) به دست می‌آید.

(23)

-تخمینگر حداقل مربعات بازگشتی

در این الگوریتم به ازای هر داده جدید، الگوریتم اجرا می‌شود و پارامترها را بهینه می‌کند. این الگوریتم در زمره الگوریتم‌های برخط قرار می‌گیرد. در این حالت، به ازای ورود یک داده جدید نیاز به اجرای الگوریتم حداقل مربعات و استفاده از کلیه داده‌ها نیست و می‌توان به وسیله یک داده جدید و الگوریتم حداقل مربعات بازگشتی پارامترها را به روز کرد. در این الگوریتم فرض می‌شود که داده وجود داشته و یک داده جدید وارد می‌شود و باید پارامترها بهینه شوند.

داده وارد شده جدید به صورت (( وارد می‌شود و در سطر قرار می‌گیرد. در این حالت برای محاسبه نیازی به استفاده از همه داده‌های آموزش نیست و با این الگوریتم می‌توان پارامترها را با یک داده به روز کرد. در این حالت، مطابق (24) با زوج جدید ()، می‌توان پارامترهای را به دست می‌آید.

(24)

که در این حالت رابطه نهایی این الگوریتم به صورت (25) به دست می‌آید.

(25)

در ابتدا باید تعیین شود. در گام‌های ابتدایی که خطا بزرگ است، پارامتر بزرگ انتخاب می‌شود که سریعتر به ناحیه مورد نظر برسیم و در گام‌های نهایی که خطا کمتر هست، پارامتر کوچک انتخاب شده است که به بهترین نقطه برسیم.

همانطور که ذکر شد، در حالاتی که پارامترها در طی زمان دارای تغییر هستند، بهتر است از الگوریتم حداقل مربعات بازگشتی استفاده کرد. این الگوریتم به خصوص در پیش‌بینی و مدلسازی نمادهای بورس که در هر روز تغییر می‌کند، مناسب هست. استفاده از پارامترهای دیگری مثل فاکتور فراموشی تطبیقی نیز می‌تواند در همگرایی الگوریتم تسریع ایجاد کند. در این حالت پارامترها از روابط (26) به دست می‌آیند[28].

= (26)

5. شبیه‌سازی

5-1. پیش‌بینی نماد تسلا

برای پیش‌بینی این نماد از داده‌های شرکت تسلا استفاده شده که مجموعاً 2200 داده می‌شود (شکل 2) که برای آموزش از 70 درصد داده‌ها، برای آزمایش از 20 درصد داده‌ها و برای اعتبارسنجی از 10 درصد داده‌ها استفاده شده است. در گام اول مرتبه مدل تعیین شده، در این خصوص از الگوریتم بهینه‌سازی ملخ بهبود یافته استفاده شده است. در شکل 2، محور افقی بیانگر تعداد داده‌های نماد تسلا که عددی از 1 تا 2200 را شامل می‌شود و محور عمودی بیانگر مقدار داده‌ها هست.

شکل 2. داده‌های نماد تسلا

در شکل 3 نحوه تعیین مرتبه مدل با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته نشان داده شده است که در این شکل، محور افقی بیانگر تعداد تکرار الگوریتم(100 تکرار) و محور عمودی بیانگر مقدار پارامترها هست.

شکل3. نتایج الگوریتم بهینه‌سازی ملخ بهبود یافته برای تعیین مرتبه مدل

همانطور که در شکل 3 نشان داده شده است، ضرایب جملات 3، 10 و12 بیشترین ضریب و بیشترین تاثیر را در پیش‌بینی دارند. لذا این مدل را با استفاده از این جملات تشکیل می‌دهیم و بدین وسیله می‌توان با کمترین تعداد ورودی، یک پیش‌بینی از سری زمانی داشت. بنابراین خروجی در لحظه فعلی به جملاتی از خروجی در گذشته بستگی دارد:

پس از تعیین مرتبه به وسیله الگوریتم بهینه‌سازی ملخ بهبود یافته، حال می‌توان به وسیله مدل، یک پیش‌بینی از وضعیت نماد تسلا داشت. برای بررسی میزان تاثیر مرتبه مدل در دقت پیش‌بینی، پیش‌بینی را در چندین حالت انجام می‌دهیم و در نهایت از مدلی که به وسیله الگوریتم ملخ بهبود یافته به دست آمده استفاده می‌کنیم:

- پیش‌بینی به وسیله داده‌های دو روز قبل (حالت اول).

- پیش‌بینی به وسیله داده‌های هفت روز قبل (حالت دوم).

- پیش‌بینی به وسیله مدل به دست آمده توسط الگوریتم بهینه‌سازی ملخ بهبود یافته (حالت سوم).

پس از اینکه مرتبه مدل تعیین شد، از الگوریتم آموزش برای آموزش شبکه استفاده شده است. در این حالت از شاخص خطای جذر میانگین مربعات مطابق (27) استفاده شده است.

(27)

نتایج شبیه‌سازی در شکل‌های 4 تا 8 نشان داده شده است؛ همانطور که در شکل 4 دیده می‌شود نتایج شبیه‌سازی برای حالتی که از الگوریتم ارائه شده به منظور تعیین مرتبه مدل و تعیین موثرترین ورودی‌ها استفاده شده، نتایج بهتر بوده است. شکل 4 نشانگر داده‌های آموزش و آزمایش هست که به صورت مجزا از یکدیگر قرار گرفته‌اند و این نحوه دسته‌بندی داده‌ها و اخذ نتایج مناسب، یکی از مزیت‌های این روش هست. در شکل4، محور افقی بیانگر شماره داده بورس که عددی از 1 تا 1540 هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیش‌بینی شده(عددی بین 0 تا 300) و خطا(عددی بین 25- تا 25) هست.

شکل 4-الف

شکل4-ب

شکل 4-الف: نتایج حالت سوم شبکه GMDH برای داده‌های آموزش. شکل 4-ب: نتایج برای داده‌های آزمایش.

در شکل 5 نتایج برای حالتی مورد بررسی قرار گرفته که از داده‌های 7 روز قبل استفاده شده است، شکل 5 نتایج الگوریتم را برای داده‌های آموزش و آزمایش نشان می‌دهد. در طی این مدت داده‌ها به عنوان ورودی شبکه در نظر گرفته می‌شوند و مطابق شکل 4، همه این داده‌ها مورد نیاز نبوده و صرفا موجب بزرگ شدن حجم شبکه شده است. در شکل5، محور افقی بیانگر شماره داده بورس که شامل 1540 داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیش‌بینی شده(0 تا 300) و خطا(25- تا 25) هست.

شکل 5-الف

شکل 5-ب

شکل 4-الف: نتایج حالت دوم شبکه GMDH برای داده‌های آموزش. شکل 4-ب: نتایج برای داده‌های آزمایش

در شکل 6 از مدل گاوسی برای پیش‌بینی داده‌های بورسی استفاده شده است، همانطور که دیده می‌شود، نقاطی که دامنه بالاتری دارند، آموزش بهتری دیده‌اند و داده‌هایی که دامنه کمتری دارند، خطای بیشتری دارند. برای بهبود این وضعیت می‌توان تابع هزینه را به صورت وزن دار انتخاب کرد یا داده‌ها را نرمالیزه کرد که آموزش همه داده‌ها به صورت یکنواخت انجام شود؛ البته یکی از مزیت‌های روش ارائه شده در شکل6 این هست که هر چه داده‌ها به نقاط پایان نزدیک می‌شوند، خروجی با دقت بهتری تخمین زده شده و این مورد برای سهامداران بسیار مهم هست؛ چراکه خروجی‌های نزدیک به روز مورد نیاز برای پیش‌بینی از اهمیت بیشتری برخوردار هست؛ بنابراین یکی از گام‌هایی که می‌تواند در مقالات بعدی معرفی شود، تابع هزینه وزن‌دار هست. در شکل 6-الف، محور افقی بیانگر شماره داده و محور عمودی بیانگر مقدار هست که از داده 1 تا 1540 به منظور آموزش و مابقی برای آزمایش استفاده شده است. در شکل 6-ب، محور عمودی بیانگر مقدار داده‌های ورودی و محور افقی بیانگر مقادیر داده‌های پیش‌بینی شده هست.

شکل 6-الف

شکل 6-ب

شکل 6-الف و 6-ب: نتایج مدل گاوسی برای پیش‌بینی داده‌های بورس

در شکل 7، نتایج مدل چندجمله‌ای نشان داده شده است که در این شکل، محور عمودی بیانگر مقادیر داده‌های ورودی و محور افقی بیانگر مقادیر داده‌های پیش‌بینی شده هست.

شکل 7. نتایج مدل چندجمله‌ای برای پیش‌بینی داده‌های بورس

در شکل 8، نتایج پیش‌بینی با استفاده از شبکه RBF ارائه شده است. در این روش، نتایج نسبت به روش‌های قبلی بهتر هست و پیش‌بینی با خطای کمتری انجام شده است و می‌توان از این روش جهت تقریب داده‌های عملی استفاده کرد. در این حالت، پیش‌بینی به چند عامل بستگی دارد: میزان توانایی شبکه‌ها در مدلسازی توابع و الگوهای غیرخطی، توابع فعالسازی، الگوریتم آموزش و تعداد تکرار. در شکل 8، محور افقی بیانگر شماره داده و محور عمودی بیانگر مقادیر داده‌ها هست که از داده 1 تا 1540 به منظور آموزش و مابقی به عنوان آزمایش استفاده شده است.

شکل8. نتایج مدلRBF برای پیش‌بینی داده‌های بورس

در جدول 1 نتایج الگوریتم پیشنهادی برای پیش‌بینی داده‌های نماد تسلا نشان داده شده است.

جدول1. نتایج برای شبیه‌سازی برای شبکه و الگوریتم پیشنهادی

(21)

#	الگوریتم/ روش	حالت	RMSE train	RMSE/MAX	RMSE test
1	شبکه عصبی[19]-لونبرگ	سوم	15.98	0.024	16.28
2	شبکه عصبی[19]-بیزین	سوم	8.57	0.131	9.12
3	شبکه عصبی[19]-گرادیان	سوم	8.43	0.129	9.22
4	شبکه GMDH	اول	4.3729	0.00672	6.5712
5	شبکه GMDH	دوم	4.3909	0.00675	6.5802
6	شبکه GMDH	سوم	4.05	0.0062	5.59
7	ANFIS	اول	4.3653	0.0067	6.2912
8	ANFIS	دوم	4.3602	0.0067	6.3745
9	ANFIS	سوم	4.3509	0.00669	6.3812
10	Gaussian-n=1	اول	11.42	0.017	15.86
11	Gaussian-n=5	اول	7.32	0.011	10.95
12	Gaussian-n=8	اول	7.35	0.011	10.83
13	Polynomial-n=1	اول	7.27	0.0109	10.27
14	Polynomial -n=5	اول	7.25	0.0109	9.96
15	Polynomial -n=8	اول	7.24	0.0108	9.75
16	RBF	اول	4.99	0.0075	7.76

همانطور که در جدول 1 دیده می‌شود، شبکه GMDH با الگوریتم تعیین مرتبه مدل طراحی شده بهترین نتیجه را داشته است، پس از آن شبکه نروفازی نتایج مناسبی را داشت. با توجه به اینکه از داده‌های آموزش برای آموزش شبکه استفاده شده، مقدار خطا برای داده‌های آموزش در همه شبکه‌ها به جز RBF نسبت به داده‌های آزمایش کمتر بود. در توابع چندجمله‌ای به ازای افزایش تعداد جمله، خطا کاهش یافت؛ ولی این افزایش تعداد جمله و کاهش خطا به حد قابل قبولی جهت مقایسه با شبکه GMDH نبود. به علاوه، در مدل گاوسی دیده می‌شود که با افزایش تعداد جمله از 5 به 8، خطا به صورت محسوس کاهش پیدا نکرده است و این نشانگر این هست که این روش برای پیش‌بینی این داده‌ها مناسب نبوده است.

5-2. پیش‌بینی شاخص NASDAQ

اطلاعات این شاخص از finance.yahoo استخراج شده است و برای مقایسه با نتایج مقاله [12]، داده‌های استخراج شده از تاریخ 14/02/2017 تا تاریخ 27/12/2018 مورد بررسی قرار گرفته که شامل 440 داده هست و 80 درصد داده‌ها به عنوان آموزش و 20 درصد به عنوان آزمایش انتخاب شده‌اند. در این قسمت، هدف اصلی ارائه ویژگی‌های مناسب به عنوان ورودی شبکه هست که بتوان پیش‌بینی مناسبی از شاخص سهام داشت. در این قسمت چند سری ویژگی مطابق جدول 2 ارائه می‌شود. در این حالت، از روش پنجره گذاری روی سیگنال استفاده می‌شود، پنجره گذاری به صورت 3 روزه، 5 روزه، 7 روزه، 14 روزه، 21 روزه و 30 روزه هست.

جدول 2. ویژگی‌های استفاده شده برای پیش‌بینی

#	مجموعه ویژگی	ویژگی‌ها
1	اول	اطلاعات قبلی سهام
2	دوم	اطلاعات قبلی سهام+میانگین، میانه، کمینه، بیشینه، چولگی و انحراف معیار برای پنجره‌های 3، 5، 7، 14، 21 و 30 روزه شامل 39 ورودی.
3	سوم	اطلاعات قبلی سهام+لگاریتم (میانگین، میانه، کمینه، بیشینه، چولگی و انحراف معیار) برای پنجره‌ای 3، 5، 7، 14، 21 و 30 روزه شامل 39 ورودی.

نتایج پیش‌بینی بر اساس شبکه GMDH در جدول 3 آمده است. همانطور که دیده می‌شود مجموعه ویژگی سوم بهترین نتیجه را داشته است. چون داده‌های آموزش 80 درصد داده‌های ابتدایی و داده‌های آزمایش 20 درصد بعدی هستند، داده‌های آموزش و آزمایش کاملا از یکدیگر مستقل هستند؛ در نتیجه شبکه با داده‌های آموزش، تنظیم می‌شود و به همین علت در جدول 1، خظای داده‌های آزمایش بالاتر از آموزش هست. به منظور کاهش خطای داده‌های آزمایش، باید از تعداد داده بیشتری استفاده کرد که الگوریتم کلیه الگوها را فرابگیرد.

جدول 3. نتایج پیش‌بینی

#	مجموعه ویژگی	RMSE TRAIN	RMSE TEST	RMSE TRAIN+TEST
1	مقاله[12]-RC	-	-	78.09
2	مقاله[12]-RNN	-	-	78.80
3	مقاله[12]-LSTM	-	-	81.41
4	اول	58.4844	108.854	71.5114
5	دوم	25.5891	51.4271	32.419
6	سوم	25.1139	43.4015	29.6677

نتایج شبکه GMDH برای داده‌های آموزش و آزمایش در شکل‌های 9 تا 19 نشان داده شده است؛ در شکل‌های داده‌های آموزش، بازه محور افقی از 1 تا 353 و محور عمودی از 5000 تا 8000 و برای شکل‌های داده‌های تست، بازه محور افقی از 1 تا 90 که شامل 88 داده هست و بازه محور عمودی 6500 تا 8500 هست. همانطور که در جدول3 دیده می‌شود، به ترتیب مجموعه ویژگی سوم، دوم و اول دارای کمترین خطای پیش‌بینی بوده‌اند؛ به عبارتی هر چه از ویژگی‌های بیشتری استفاده شده، نتایج بهتر و خطا کمتر شده است. در این شبیه‌سازی‌ها، آموزش شبکه با استفاده از 80 درصد داده‌های ابتدایی انجام شده و از 20 درصد باقیمانده برای آزمایش استفاده شده است که این مورد نشانگر استقلال داده‌های آموزش و آزمایش هست که در پیش‌بینی بورس بسیار مهم هست.

در شکل‌های 9 نتایج الگوریتم برای داده‌های آموزش، در شکل 10 نتایج برای داده‌های آزمایش و در شکل 11 نتایج الگوریتم و شبکه GMDH برای داده‌های آموزش و آزمایش نشان داده شده است. همانطور که دیده می‌شود، از آنجایی که شبکه با داده‌های آموزش، بهینه شده و آموزش داده می‌شود و سپس برای سنجش عملکرد از داده‌های مستقل آزمایش استفاده می‌شود، نتایج پیش‌بین داده‌های آموزش بهتر هست و نسبت به داده‌های آزمایش خطای کمتری دارد. در شکل‌های 9 تا 11، محور افقی بیانگر شماره روزهای جمع‌آوری داده و شماره داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیش‌بینی شده بورس و مقدار خطا هست.

شکل9. نتایج برای داده‌های آموزش مجموعه ویژگی اول

شکل10. نتایج برای داده‌های آزمایش مجموعه ویژگی اول

شکل11. نتایج برای داده‌های آموزش و آزمایش مجموعه ویژگی اول

شکل 12، مجموعه ویژگی دوم را نشان می‌دهد که در این شکل محور افقی بیانگر شماره داده و محور عمودی بیانگر مقدار هست. در شکل 13 نتایج الگوریتم برای داده‌های آموزش، در شکل 14 نتایج برای داده‌های آزمایش و در شکل 15 نتایج الگوریتم و شبکه GMDH برای داده‌های آموزش و آزمایش نشان داده شده است که در آن‌ها، محور افقی بیانگر شماره روزهای جمع‌آوری داده و شماره داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیش‌بینی شده بورس و مقدار خطا هست. در این حالت، تعداد ویژگی‌های ورودی شبکه افزایش یافته است و این افزایش در تعداد ویژگی منجر به افزایش دقت پیش‌بینی و کاهش خطا شده است. در این حالت نیز نتایج شبکه برای داده‌های آموزش بهتر از داده‌های آزمایش هست.

شکل12. مجموعه ویژگی‌های دوم

شکل13. نتایج برای داده‌های آموزش مجموعه ویژگی دوم

شکل14. نتایج برای داده‌های آزمایش مجموعه ویژگی دوم

شکل15. نتایج برای داده‌های آموزش و آزمایش مجموعه ویژگی دوم

در شکل 16، مجموعه ویژگی سوم نشان داده شده است که در این شکل محور افقی بیانگر شماره داده و محور عمودی بیانگر مقدار هست، در شکل‌های 17 تا 19، نتایج الگوریتم برای مجموعه داده سوم نشان داده شده است که در آن‌ها، محور افقی بیانگر شماره روزهای جمع‌آوری داده و شماره داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیش‌بینی شده بورس و مقدار خطا هست. در این حالت، از یک روش ابتکاری برای به دست آوردن ویژگی‌ها استفاده می‌شود و لگاریتم این ویژگی‌ها به همراه داده‌های تعیین شده توسط الگوریتم تعیین مرتبه مدل، به عنوان ورودی به شبکه داده می‌شود. همانطور که در جدول 3 و شکل‌های 17 تا 19 دیده می‌شود، نتایج داده‌های آموزش و آزمایش نسبت به دو حالت قبل بهبود یافته است که این می‌تواند بیانگر ساختار غیرخطی بورس باشد. در این حالت نیز نتایج پیش‌بینی داده‌های آموزش دارای خطای کمتری نسبت به داده‌های آزمایش هست.

شکل16. مجموعه ویژگی‌های سوم

شکل17. نتایج برای داده‌های آموزش مجموعه ویژگی سوم

شکل18. نتایج برای داده‌های آزمایش مجموعه ویژگی سوم

شکل19. نتایج برای داده‌های آموزش و آزمایش مجموعه ویژگی سوم

6. بحث و نتایج

نکته‌ای که در ابتدا باید اشاره شود، این است که در اغلب مقالات داده‌های آزمایش و آموزش از بین کل داده‌ها به صورت تصادفی انتخاب می‌شود؛ منتها این روش در حالت آزمایش عملی و کاربردی دچار محدودیت‌های بسیار جدی می‌شود؛ بنابراین در این مقاله، در روش اول ابتدا تعداد داده آموزش از اولین داده تا 70 درصد داده‌ها انتخاب شد، سپس داده اعتبارسنجی انتخاب شد و در نهایت داده‌های آزمایش انتخاب شد؛ بنابراین الگوریتم و شبکه ارائه شده یک روش مناسب هست که می‌تواند به صورت موثر برای پیش‌بینی بورس در حالت عملی و واقعی استفاده شود. دلیل تفاوت اندک خطای داده آموزش و آزمایش نیز همین مورد است؛ چراکه شبکه با یکسری داده در شرایط خاص آموزش داده شده و با استفاده از داده‌های جدید در شرایط دیگر مورد بررسی قرار گرفته است. در روش دوم، 80 درصد داده‌های ابتدایی به عنوان آموزش و 20 درصد باقیمانده به عنوان آزمایش انتخاب شدند.

در این مقاله، یک روش برای پیش‌بینی ارزش سهام و تحلیل آن بررسی شد؛ در این حالت، در ابتدا یک روش موثر بر اساس مدل AR و الگوریتم بهینه‌سازی ملخ با نرخ یادگیری تطبیقی و بهبود یافته ارائه شد. در این روش مدل مورد نظر جهت پیش‌بینی به صورت AR در نظر گرفته شد و برای بررسی اینکه کدام جملات بیشترین تاثیر را در پیش‌بینی دارند، از الگوریتم بهینه‌سازی ملخ بهبود یافته استفاده شد که یکی از نوآوری‌های این مقاله هست و مزیتی که روش اول نسبت به مقالات قبل دارد این است که در این مقاله صرفاً از قیمت نماد استفاده شده و از شاخص‌های نفت، طلا و... استفاده نشده که این موضوع موجب کاهش هزینه و کاهش تعداد داده ورودی و حجم شبکه شده است. در این روش جملاتی که بیشترین ضریب را دارند، دارای بیشترین تاثیر در پیش‌بینی خروجی هستند. بنابراین در این حالت مشخص گردید که خروجی به کدام جملات قبلی بستگی دارد. سپس از شبکه عصبی GMDH با الگوریتم آموزش ترکیبی حداقل مربعات برای مقداردهی اولیه و الگوریتم حداقل مربعات بازگشتی برای بهینه‌سازی برخط پارامترها و تطبیق شبکه با داده‌های جدید استفاده شد؛ به علاوه برای آموزش شبکه نروفازی از یک الگوریتم جدید شامل روش حداقل مربعات برای مقداردهی اولیه پارامترهای خطی، الگوریتم حداقل مربعات بازگشتی برای آموزش برخط شبکه و الگوریتم بهینه‌سازی ملخ بهبود یافته استفاده شده است. با توجه به تغییراتی که در الگوریتم ملخ بهبود یافته انجام شده، باعث شد که این الگوریتم به یک الگوریتم تطبیقی تبدیل شود. بدین صورت که دیگر نیازی به تعیین تعداد بیشینه تکرار برای این الگوریتم نیست و حساسیت خطا تعداد تکرار را مشخص می‌کند؛ به علاوه استفاده از روش حداقل مربعات بازگشتی موجب شده که الگوریتم در مقابل تغییرات داده‌ها مقاوم‌تر شود و با سرعت بیشتر آموزش داده شود. یکی از مواردی که می‌تواند در پژوهش‌های بعدی مورد توجه قرار بگیرد، استفاده از سیستم‌های دو بعدی برای پیش‌بینی شاخص هست، بدین صورت که شماره ماه و شماره روز در ماه به عنوان دو متغیر در نظر گرفته شود و پس از می‌توان با تعداد متغیر کمتر به پیش‌بینی ارزش بورس پرداخت؛ به علاوه در صورت استفاده از سیستم‌های چند متغیره و استفاده از ورودی‌های مختلف می‌توان به نتایج مناسب‌تری دست یافت. نکته بعدی این است که به وسیله این الگوریتم و شبکه توانستیم مدت زمان پیش‌بینی را طولانی‌تر کنیم، در این حالت با استفاده از داده‌های سه روز، ده روز و دوازده روز قبل می‌توان ارزش سهام را پیش‌بینی کرد. در روش دوم که برای مجموعه داده NASDAQ انجام شد، تعداد ویژگی‌های ورودی شبکه را افزایش دادیم که منجر به کاهش خطا شد و نتایج مناسب‌تری به دست آمد. در این روش، از شیوه پنجره‌گذاری 3، 5، 7، 14، 21 و 30 روزه استفاده شد و ویژگی‌های زمانی و آماری و لگاریتم این داده‌ها استخراج و برای پیش‌بینی استفاده شد.

7. نتیجه‌گیری

در نهایت از داده‌های نماد یک شرکت بورسی به نام تسلا و شاخص NASDAQ استفاده شد. در این حالت، داده‌های موجود در الگوریتم AR قرار گرفت و در این حالت ضرایب جملات این مدل به گونه‌ای انتخاب شد که خطا کمینه شود، در این حالت ضرایب با بیشترین اندازه انتخاب شد و این ضرایب به عنوان ورودی‌های شبکه مورد استفاده قرار گرفت. پس از آن از شبکه GMDH و الگوریتم مناسب بهینه‌سازی پارامترهای خطی استفاده شد و نتایج مورد نظر در جدول بیان شد. پس از آن، از روش‌های مختلف مانند چندجمله‌ای‌های درجه دو، سه و... و چندجمله‌ای‌های گاوسی استفاده شد. در این حالت، پارامترهای خطی به وسیله الگوریتم‌های حداقل مربعات و حداقل مربعات بازگشتی بهینه شدند و پارامترهای غیرخطی به وسیله الگوریتم بهینه‌سازی سراسری مانند الگوریتم بهینه‌سازی ملخ بهبودیافته تعیین و بهینه شدند. در نهایت، با انجام یک مقایسه بررسی شد که شبکه GMDH بهترین نتیجه را داشت. نتایج این مقاله به صورت خلاصه به صورت زیر بیان می‌شود:

- پیش‌بینی طولانی مدت با استفاده از داده‌های سه روز، ده روز و دوازده روز قبل.

- تعیین مرتبه مدل به طور موثر توسط یک روش جدید بر اساس الگوریتم بهینه‌سازی ملخ بهبود یافته.

- با استفاده از تعیین مرتبه مدل، تعداد ویژگی‌های موثر در یادگیری کاهش یافت که منجر به کاهش تعداد ورودی شبکه شد.

- با شبکه و الگوریتم معرفی شده، نماد تسلا به صورت مناسب پیش‌بینی شده است.

- استفاده از روش پنجره گذاری و کاهش خطای پیش‌بینی.

- نشان داده شد که استفاده از ویژگی‌های آماری در حوزه زمان منجر به کاهش خطا می‌شود و می‌توان با خطای محدود، داده‌های روزهای بعدی را پیش‌بینی کرد.

مراجع

[1]. Buettner R. Predicting user behavior in electronic markets based on personality-mining in large online social networks: A personality-based product recommender framework. The International Journal on Networked Business. Springer, 2016. pp. 1–19.

[2] Lu, T., Zhang, Y., & Li, B. (2019). The value of alternative data in credit risk prediction: Evidence from a large field experiment.‏

[3] Duan, J. (2019). Financial system modeling using deep neural networks (DNNs) for effective risk assessment and prediction. Journal of the Franklin Institute, 356(8), 4716-4731.‏

[4] Krauss C, Do XA, Huck N. Deep neural networks, gradient boosted trees, random forests: Statistical arbitrage on the S&P 500. Eur J Oper Res. 2017;259:689–702.

[5] Yolcu, O. C., Egrioglu, E., Bas, E., & Yolcu, U. (2022). Multivariate intuitionistic fuzzy inference system for stock market prediction: The cases of Istanbul and Taiwan. Applied Soft Computing, 116, 108363.‏

[6] Hiransha M, Gopalakrishnan EA, Menon VK, Soman KP. NSE stock market prediction using deep-learning models. Procedia Comput Sci. 2018;132: 1351–1362.

[7] Ravikumar, Srinath, and Prasad Saraf. "Prediction of stock prices using machine learning (regression, classification) Algorithms." 2020 International Conference for Emerging Technology (INCET). IEEE, 2020.‏

[8] Sun BQ, Guo H, Karimi HR, et al. Prediction of stock market futures based on fuzzy sets and multivariate fuzzy time series. Neurocomputing. 2015; 151:1528–1536.

[9] Efendi R, Arbaiy N, Deris MM. A new procedure in stock market forecasting based on fuzzy random auto-regression time series model. Inform Sci. 2018;441:113–132.

[10] Khedr AE, Yaseen N. Predicting stock market behavior using data mining technique and news sentiment analysis. Int J Intell Syst Appl. 2017;9:22.

[11] Ahmadi E, Jasemi M, Monplaisir L, et al. New efficient hybrid candlestick technical analysis model for stock market timing on the basis of the Support Vector Machine and Heuristic Algorithms of Imperialist Competition and Genetic. Expert Syst Appl. 2018;94:21–31.

[12] Wang, W. J., Tang, Y., Xiong, J., & Zhang, Y. C. (2021). Stock market index prediction based on reservoir computing models. Expert Systems with Applications, 178, 115022.‏

[13]. Safari Dehnavi, V., & Shafiee, M. (2020). »LQR for Generalized Systems Using Metaheuristic Algorithms Based on Disturbance Observer«. 28th Iranian Conference on Electrical Engineering (ICEE), 2020, 08, 04, Tabriz, Iran.

[14] Huang, W. (2007). Neural networks in finance and economics forecasting. International Journal of Information Technology & Decision Making, 6 (1), 113-140

[15] Dennis, O. & Mossman, CH. (2003). Neural network forecasts of Canadian stock returns using accounting ratios. International Journal of Forecasting, 19 (3), 453-465

[16] Kelly, J. (2011). »The current stock of money: an aggregation theoretic measure of narrowly defined money«. Applied Economics Letters, 18 (7), 659-664.‏

[17] Shqair, M. (2020). »Adaptation of conformable residual power series scheme in solving nonlinear fractional quantum mechanics problems«. Applied Sciences, 10 (3), 890-912.‏

[18] Erik, C., Gálvez, J., & Avalos, O. (2020). »Gravitational Search Algorithm for Non-linear System Identification Using ANFIS-Hammerstein Approach«. Recent Metaheuristics Algorithms for Parameter Identification (Springer), 854 (1), 97-134.‏

[19] Pourzamani, Z. & Miralavi, H. (2018). »Provide a model for stock price forecasting using meta-innovative methods and neural networks«. Quarterly Journal of Financial Management and Securities, 10 (40), 57-83 (in Persian).

[20] Samadipour, S., Matinfard, R. & Torkashvand, A. (2020). »Investigating and predicting the decline or growth of stock companies in a certain period of time using data mining classification technique«. The Third International Conference on New Strategies in Engineering, Information Science and Technology in the Next Century, 2020, 05, 20, Tehran, Iran (in Persian).

[21] Y. Du, "Application and analysis of forecasting stock price index based on combination of ARIMA model and BP neural network," 2018 Chinese Control And Decision Conference (CCDC), 2018, pp. 2854-2857, doi: 10.1109/CCDC.2018.8407611.

[22] Almasarweh, M., & Alwadi, S. (2018). ARIMA model in predicting banking stock market data. Modern Applied Science, 12(11), 309.‏

[23] Zhang, Jun, Yu-Fan Teng, and Wei Chen. "Support vector regression with modified firefly algorithm for stock price forecasting." Applied Intelligence 49.5 (2019): 1658-1674.‏

[24] Chung, H., & Shin, K. S. (2018). Genetic algorithm-optimized long short-term memory network for stock market prediction. Sustainability, 10(10), 3765.‏

[25] Lugnani, Lucas, et al. "ARMAX-based method for inertial constant estimation of generation units using synchrophasors." Electric Power Systems Research 180 (2020): 106097.‏

[26] Saremi, S., Mirjalili, S., & Lewis, A. (2017). Grasshopper optimisation algorithm: theory and application. Advances in Engineering Software, 105, 30-47.‏

[27] Shaghaghi, Saba, et al. "Comparative analysis of GMDH neural network based on genetic algorithm and particle swarm optimization in stable channel design." Applied Mathematics and Computation 313 (2017): 271-286.‏

[1] 1. Autoregressive integrated moving average

[2] Autoregressive model

[3]

3. Group Method of Data Handling

اشتراک گذاری

آدرس مقاله

پیش‌بینی بازار سهام با استفاده از الگوریتم بهینه‌سازی ملخ بهبود یافته و الگوریتم‌های سری زمانی

رایمگ

پیوندهای سایت

مراکز مرتبط

پشتیبانی

صفحات رسمی