پیشبینی بازار سهام با استفاده از الگوریتم بهینهسازی ملخ بهبود یافته و الگوریتمهای سری زمانی
الموضوعات :وحید صفری دهنوی 1 , مسعود شفیعی 2
1 - صنعتی امیرکبیر
2 - استاد داشگاه صنعتی امیرکبیر
الکلمات المفتاحية: پیشبینی, الگوریتم بهینهسازی ملخ بهبود یافته, شبکه عصبی GMDH, پیشبینی, مدلسازی,
ملخص المقالة :
پیشبینی بازار سهام به عنوان یک زمینه جذاب و همچنین چالش برانگیز برای سرمایه گذاران در بازارهای مالی عمل میکند. بسیاری از مدلهای مورد استفاده در پیشبینی بازار سهام قادر به پیشبینی دقیق نیستند یا این مدلها نیاز به تعداد داده ورودی بسیار زیادی دارند که باعث افزایش حجم شبکهها و پیچیدگی یادگیری میشود که همه این موارد در نهایت موجب کاهش دقت در پیشبینی میشود. این مقاله یک روش برای پیشبینی بازار سهام را پیشنهاد میدهد که این روش قادر هست به طور موثر وضعیت بازار سهام را پیشبینی کند. در این مقاله، برای کاهش حجم دادههای ورودی از قیمت گذشته بازار استفاده شده و این دادهها در یک مدل رگریسور قرار داده شده است. در این حالت، با ارایه یک روش مبتنی بر الگوریتم بهینهسازی ملخ بهبود یافته، تعیین میشود که دادههای فعلی بازار بورس به کدام دادههای قبلی وابسته هستند و با استفاده از دادههای قبلی میتوان داده جدید را پیشبینی کرد. برای پیشبینی سری زمانی نیز از روشهای شبکه عصبی GMDH، شبکه نروفازی و شبکه عصبی استفاده شده است؛ به علاوه، در این مقاله از روشهای متناسبسازی دادهها با استفاده از الگوریتمهای مختلف استفاده شده است که این روشها میتوانند در پیشبینی بازار موثر باشند. در نهایت، از مجموعه داده شرکت تسلا برای اعتبارسنجی و تست الگوریتمهای ارایه شده استفاده شده است و نتایج شبیهسازی در پایان آمده است. همانطور که در قسمت شبیهسازی نشان داده شده، با استفاده از الگوریتم بهینهسازی ملخ بهبود یافته، موثرترین خروجیها برای پیشبینی ارزش سهام به دست آمده و در نهایت با استفاده از چند حالت مختلف پیشبینی انجام شده و نتایج روشهای مختلف مورد مقایسه قرار گرفته و ارزیابی بر اساس معیار خطای میانگین مربع (RMSE) انجام شده است. مدل پیشنهادی پیش بینی بازار سهام دارای حداقل RMSE=4.05 است که نشان دهنده اثربخشی روش پیشنهادی در پیش بینی بازار سهام است. نتایج نشان میدهد که در بین الگوریتمهای ارایه شده مربوط به پیشبینی سری زمانی، شبکه GMDH با الگوریتم ترکیبی ارایه شده، بهترین نتیجه را در بر داشته است.
[1]. Buettner R. Predicting user behavior in electronic markets based on personality-mining in large online social networks: A personality-based product recommender framework. The International Journal on Networked Business. Springer, 2016. pp. 1–19.
[2]. Mosavi A, Vaezipour A. Developing effective tools for predictive analytics and informed decision. University of Tallinn, Technical Report. 2013.
[3] Jones ER. Neural Networks’ Role in Predictive Analytics. DM Review Special Report. 2008.
[4] Krauss C, Do XA, Huck N. Deep neural networks, gradient boosted trees, random forests: Statistical arbitrage on the S&P 500. Eur J Oper Res. 2017;259:689–702.
[5] Hiransha M, Gopalakrishnan EA, Menon VK, Soman KP. NSE stock market prediction using deep-learning models. Procedia Comput Sci. 2018;132: 1351–1362.
[6] Abraham A, Nath B, Mahanti PK. Hybrid intelligent systems for stock market analysis. In: Proceedings of International Conference on Computational Science. San Francisco, CA. Springer-Verlag, Berlin Heidelberg, 2001. pp. 337–345.
[7] Vijaya P, Raju G, Ray SK. Artificial neural network-based merging score for Meta search engine. J Central South Univ. 2016;23:2604–2615.
[8] Evans C, Pappas K, Xhafa P. Utilizing artificial neural networks and genetic algorithms to build an algo-trading model intra-day foreign exchange speculation. Math Comput Model. 2013;58:1249–1266.
[9] Sun BQ, Guo H, Karimi HR, et al. Prediction of stock market futures based on fuzzy sets and multivariate fuzzy time series. Neurocomputing. 2015; 151:1528–1536.
[10] Efendi R, Arbaiy N, Deris MM. A new procedure in stock market forecasting based on fuzzy random auto-regression time series model. Inform Sci. 2018;441:113–132.
[11] Khedr AE, Yaseen N. Predicting stock market behavior using data mining technique and news sentiment analysis. Int J Intell Syst Appl. 2017;9:22.
[12] Ahmadi E, Jasemi M, Monplaisir L, et al. New efficient hybrid candlestick technical analysis model for stock market timing on the basis of the Support Vector Machine and Heuristic Algorithms of Imperialist Competition and Genetic. Expert Syst Appl. 2018;94:21–31.
[13]. Safari Dehnavi, V., & Shafiee, M. (2020). »LQR for Generalized Systems Using Metaheuristic Algorithms Based on Disturbance Observer«. 28th Iranian Conference on Electrical Engineering (ICEE), 2020, 08, 04, Tabriz, Iran.
[14]. Sabri, M. (2018). »Stabilization and control of power system using meta-heuristic algorithms«. Karafan (TVU), 14 (42), 33-55.
[15]. Pourdadashi Komachali, F., & Shafiee, M. (2020). »Sensor fault diagnosis in fractional-order singular systems using unknown input observer«. International Journal of Systems Science, 51 (1), 116-132.
[16] Huang, W. (2007). »Neural networks in finance and economics forecasting«. International Journal of Information Technology & Decision Making, 6 (1), 113-140.
[17] Dennis, O. & Mossman, CH. (2003). »Neural network forecasts of Canadian stock returns using accounting ratios«. International Journal of Forecasting, 19 (3), 453-465.
[18] Kelly, J. (2011). »The current stock of money: an aggregation theoretic measure of narrowly defined money«. Applied Economics Letters, 18 (7), 659-664.
[19] Moayedi, H. (2020). »Optimization of ANFIS with GA and PSO estimating α ratio in driven piles«. Engineering with Computers, 36 (1), 227-238.
[20] Sajadi, A. (2020). »Estimation of cetane numbers of biodiesel and diesel oils using regression and PSO-ANFIS models«. Renewable Energy, 158 (1), 465-473.
[21] Çakıt, E. (2020). »Assessing safety at work using an adaptive neuro-fuzzy inference system (ANFIS) approach aided by partial least squares structural equation modeling (PLS-SEM)«. International Journal of Industrial Ergonomics, 76(1), 102925- (in press).
[22] Choo, K. (2018). »Symmetries and many-body excitations with neural-network quantum states«. Physical review letters, 121 (16), 167-204.
[23] Dai, A., & Quoc V. (2020). »Training a document classification neural network«, U.S. Patent No. 10,528,866. 7.
[24] Shqair, M. (2020). »Adaptation of conformable residual power series scheme in solving nonlinear fractional quantum mechanics problems«. Applied Sciences, 10 (3), 890-912.
[25] Erik, C., Gálvez, J., & Avalos, O. (2020). »Gravitational Search Algorithm for Non-linear System Identification Using ANFIS-Hammerstein Approach«. Recent Metaheuristics Algorithms for Parameter Identification (Springer), 854 (1), 97-134.
[26] Bobyr, M., & Sergey G. (2020). »A nonlinear method of learning neuro-fuzzy models for dynamic control systems«. Applied Soft Computing, 88 (1), 106030-106044.
[27] SafariDehnavi, Vahid, and Masoud Shafiee. "The prediction of stock value by using the proposed fuzzy neural network and hybrid algorithm." Karafan Quarterly Scientific Journal 18.1 (2021): 203-220.
[28] Pourzamani, Z. & Miralavi, H. (2018). »Provide a model for stock price forecasting using meta-innovative methods and neural networks«. Quarterly Journal of Financial Management and Securities, 10 (40), 57-83 (in Persian).
[29] Samadipour, S., Matinfard, R. & Torkashvand, A. (2020). »Investigating and predicting the decline or growth of stock companies in a certain period of time using data mining classification technique«. The Third International Conference on New Strategies in Engineering, Information Science and Technology in the Next Century, 2020, 05, 20, Tehran, Iran (in Persian).
دو فصلنامه علمي فناوري اطلاعات و ارتباطات ایران | سال چهاردهم، شمارههاي 53 و 54، پاییزو زمستان 1401 صفحات: 149تا 167 |
|
Stock market prediction using improved grasshopper optimization algorithm and time series algorithms
Vahid Safari Dhanavi*، Masoud Shafi'i**
* Faculty of Electrical Engineering, Amirkabir University of Technology, Iran
** Faculty of Electrical Engineering, Amirkabir University of Technology, Iran
Abstract:
This paper proposes a stock market prediction method to predict stock value effectively. In this article, the one-time price of the market is used to reduce the volume of input data, and by presenting a method based on the improved grasshopper optimization algorithm, the dependence of the current data of the stock market on the previous data is determined, which leads to the reduction of the order of the model, and as a result, The number of network input is increased, by improving the learning rate of the grasshopper optimization algorithm, the results with less error were obtained. After that, stock value prediction was made using three separate neural networks, and finally, Tesla and NASDAQ datasets were used to validate and test the algorithm. As shown in the simulation section, the most effective outputs for stock value forecasting were obtained using the improved grasshopper optimization algorithm. Finally, several forecasting modes were used, the results of different methods were compared, and an evaluation was made based on the root mean square error criterion. If the obtained MSE is less than the specified value, only the features of the previous input are used. Suppose the error is more than the specified limit. In that case, statistical features such as the average of a week, maximum, minimum in a week, skewness, standard deviation, and the logarithm of these features are used. The proposed stock market prediction model for the Tesla symbol has a root mean square error value of 4.05, which shows the proposed method's effectiveness in forecasting the stock market. The results show that the group method of data modeling with the presented combined algorithm has the best result among the presented algorithms related to time series forecasting.
Keywords: Prediction, improved grasshopper optimization algorithm, modeling.
پیشبینی بازار سهام با استفاده از الگوریتم بهینهسازی ملخ بهبود یافته و الگوریتمهای سری زمانی
وحید صفری دهنوی *و مسعود شفیعی**
* دانشکده مهندسی برق، دانشجوی دکترا ، دانشگاه صنعتی امیرکبیر، ایران
** دانشکده مهندسی برق، استاد ، دانشگاه صنعتی امیرکبیر، ایران
تاریخ دریافت:14/04/1400 تاریخ پذیرش: 03/04/1401
نوع مقاله: پژوهشی
چکیده
این مقاله یک روش برای پیشبینی بازار سهام را پیشنهاد میدهد که میتواند به طور موثر ارزش سهام را پیشبینی کند. در این مقاله، برای کاهش حجم دادههای ورودی از قیمت گذشته بازار استفاده شده است و با ارائه یک روش مبتنی بر الگوریتم بهینهسازی ملخ بهبود یافته، وابستگی دادههای فعلی بازار بورس به دادههای قبلی تعیین میشود که این الگوریتم منجر به کاهش مرتبه مدل و در نتیجه تعداد ورودی شبکه میشود، به وسیله بهبود نرخ یادگیری الگوریتم بهینهسازی ملخ، نتایج با خطای کمتری به دست آمد. پس از آن، پیشبینی ارزش سهام با استفاده از سه شبکه عصبی مجزا انجام شد و در نهایت، از مجموعه داده شرکت تسلا و NASDAQ برای اعتبارسنجی و آزمایش الگوریتم استفاده شد. همانطور که در قسمت شبیهسازی نشان داده شده، با استفاده از الگوریتم بهینهسازی ملخ بهبود یافته، موثرترین خروجیها برای پیشبینی ارزش سهام به دست آمد و در نهایت با استفاده از چند حالت مختلف پیشبینی انجام شد و نتایج روشهای مختلف مورد مقایسه قرار گرفت و ارزیابی بر اساس معیار خطای جذر میانگین مربعات انجام شد. در صورتی که MSE به دست آمده کمتر از مقدار مشخص شده باشد، صرفا از ویژگیهای ورودی قبلی استفاده میشود؛ در صورتی که خطا از حد مشخص شده بیشتر باشد، از ویژگیهای آماری مانند میانگین یک هفته، بیشینه و کمینه در یک هفته، چولگی و انحراف معیار و لگاریتم این ویژگیها استفاده میشود. مدل پیشنهادی پیشبینی بازار سهام برای نماد تسلا دارای مقدار خطای جذر میانگین مربعات 4.05 است که نشان دهنده اثربخشی روش پیشنهادی در پیشبینی بازار سهام است. نتایج نشان میدهد که در بین الگوریتمهای ارائه شده مربوط به پیشبینی سری زمانی، روش گروهی مدلسازی داده با الگوریتم ترکیبی ارائه شده، بهترین نتیجه را در بر داشته است.1
واژگان کلیدی:پیشبینی، الگوریتم بهینهسازی ملخ بهبود یافته، مدلسازی.
[1] v.safari@aut.ac.irنویسنده مسئول:وحید صفری دهنوی
1. مقدمه
پیشبینی روند بازار از جمله پژوهشهای کاربردی و مورد علاقه متخصصان پیشبینی هست و این موضوع همواره توسط سازمانهای مختلف مورد بحث و پژوهش قرار گرفته است. بسیاری از فعالان بورس با استفاده از تجربه قبلی یک مدل ذهنی از وضعیت بازار را ایجاد میکنند و بدین وسیله میتوانند پیشبینی را انجام دهند؛ در این مقاله، تحلیل این مسئله به روشی علمی انجام میشود و یک برنامه پیشبینی دادههای مالی توسعه داده میشود که در آن از دادههای شرکت تسلا و شاخص NASDAQ برای آموزش و آزمایش استفاده شده است. در این حالت، برای دادههای تسلا 70 درصد دادهها به عنوان مجموعه آموزش، 15 درصد داده به عنوان داده اعتبارسنجی و 15 درصد به عنوان داده آزمایش در نظر گرفته میشود. برای دادههای بورس NASDAQ، به منظور مقایسه با مقالات جدید، 80 درصد دادهها به عنوان آموزش و 20 درصد به عنوان دادههای آزمایش در نظر گرفته میشوند. استخراج اطلاعات از دادهها با مفهوم پیشبینی شناخته میشود که زمینهای مهم در داده کاوی است که میتواند برای پیشبینی الگوهای رفتاری استفاده شود[1]. پیشبینی در دو حالت انجام میشود: در روش اول، پیشبینی بر اساس مشاهده رابطه بین دادههایی که در گذشته اتفاق افتاده و دادههایی که در حال حاضر اتفاق میافتد، انجام میشود؛ به عبارتی در پیشبینی از دادههای قبلی استفاده میشود و به وسیله این دادهها یک مدل مناسب به دست میآید و سپس از مدل طراحی شده برای پیشبینی دادههای آینده استفاده میشود. اگر روش اول دارای خطای قابل پذیرش نبود، ویژگیهای زمانی و آماری به مجموعه ویژگیهایی که به عنوان ورودی به شبکه داده میشود، اضافه میشوند.
مدیریت ریسک، بازاریابی مبتنی بر هوش تجاری، تحلیل رفتار مشتری و مدیریت ارتباط با مشتری برخی از کاربردهای پیشبینی است[2]. در این خصوص، در مقالات از روشهای مختلفی مانند شبکه عصبی کانولوشنی، شبکههای عصبی عمیق، روشهای یادگیری ماشین و... که در رگرسیون و پیشبینی مفید هستند، استفاده شده است[3]. شبکههای عصبی برای پیشبینی، طبقهبندی و تجزیه و تحلیل دادهها استفاده میشوند؛ به علاوه در سالهای اخیر از شبکه عصبی عمیق نیز به منظور پیشبینی استفاده شده است[4]. در حوزه پیشبینی شاخص بورس، مقالات ارائه شده در چند زمینه کلی به پژوهش پرداختهاند؛ برخی از این مقالات به پیشنهاد شبکههای جدید جهت بهبود دقت پیشبینی پرداختهاند[5-10,13-19]، دسته دیگری از پژوهشها به ارائه ویژگیهای جدید جهت کاهش خطای پیشبینی پرداختهاند[9-11]، دسته دیگر پژوهشها به ارائه مدلهای مناسب جهت پیشبینی داده پرداختهاند[8,16,20,21] و برخی دیگر به توسعه الگوریتم جهت آموزش شبکهها پرداختهاند[22,23].
در [5] استفاده از مجموعههای فازی به منظور کاهش عدم قطعیت در پیشبینی به عنوان نوآوری اصلی معرفی شده است. اگر چه این شبکهها میتوانند در پیشبینی دادههای بورس استفاده شوند؛ منتها این شبکهها دارای ساختاری پیچیده هستند که این ساختار میتواند آموزش شبکه را با چالشهای متفاوتی مواجه کند؛ به خصوص هنگامی که تعداد داده کم هست. نوآوری اصلی[6] استفاده از شبکه عصبی عمیق برای پیشبینی دادههای بورس هست؛ استفاده از شبکه عصبی عمیق، دارای محدودیتهای مهمی هست به خصوص هنگامی که بخواهیم پیشبینی را به صورت برخط انجام دهیم و با استفاده از دادههای یک روز مشخص، پیشبینی دادههای ثانیههایی بعد را انجام دهیم. در [7]، از روشهای یادگیری ماشین و شبکه عصبی عمیق جهت رگرسیون و همچنین کلاسبندی استفاده شده است و نوآوری مقاله، استفاده از این روشها در پیشبینی هست. در [8] از ترکیب منطق فازی و سری زمانی برای پیشبینی شاخص بورس چین استفاده شده است. در [9] از یک روش فازی بهبود یافته استفاده شده که روی دادههای ورودی آن پردازش صورت گرفته است که نوآوری اصلی این مقاله پردازش دادههای ورودی هست. در [10] از دادههای ورودی متفاوتی شامل اطلاعات گذشته و تحلیل اخبار استفاده شده است و این مقاله به دقت 89.8 درصد دست یافته است. در [11]، از روش بردار پشتیبان ماشین و روشهای پیشپردازش دادههای ورودی استفاده شده است و مقایسه در دو حالت بدون پیشپردازش و در حالت پیشپردازش دادههای ورودی شبکه مقایسه شده است. در [12]، یک روش جدید مبتنی بر یادگیری ماشین پیشنهاد شده است و نوآوری مقاله در زمینه ارائه شبکه جدید بوده است.
به علت ساختار غیرخطی دادههای بورس، مقالات متعددی نشان دادهاند که روشهای محاسبات نرم نتایج بهتری از رگرسیون و فیلتر کالمن دارند [13]. همچنین در [14] بیان شده که شبکههای عصبی در عصر حاضر یک معجزه برای پیشبینی هست و در این مقاله به مزیت شبکههای عصبی نسبت به روشهای استراتژی خرید و فروش اشاره شده؛ دلیل اصلی استفاده از شبکههای مبتنی بر تئوری عصبی، توانایی مدلسازی روابط غیرخطی بین متغیرها هست[14]. در [14] از شبکههای عصبی و دادههای مالی یک سال برای پیشبینی نرخ رشد اقتصادی آمریکا استفاده شده است. در [15] نتایج برای بازارهای کانادا بررسی شده که شبکه عصبی نتایج مناسبی در مقایسه با رگرسیون داشته؛ در این مقاله صرفا از دادههای روز گذشته استفاده شده؛ در صورتی که برای پیشبینی دقیقتر نیاز به تحلیل دادههای بلند مدت هست.
روش دیگری که بدین منظور استفاده میشود، روش تخمینگر حداقل درجه هست. این روش نتایج قابل قبول و دقت مناسبی دارد؛ منتها در این روش سرعت آموزش با افزایش متغیرها کاهش مییابد[16]. در [17] نیز از سریهای توانی برای تقریب و حل توابع و معادلات استفاده شده است که در این مقاله سعی در تعمیم این روشها برای پیشبینی دادههای بورس هست. در مقالات بسیاری مانند [18] از شبکه نروفازی استفاده شده و بدین وسیله یک تابع غیرخطی تقریب زده شده است که این تقریب میتواند در تشخیص مدل شاخص بورس نیز استفاده شود. در [19] از شبکه عصبی جهت پیشبینی دادههای آینده بورس استفاده شد. در این حوزه، یکی از کارهای جدید بررسی رشد یا نزول ارزش سهام هست که در [20] مورد بررسی قرار گرفته؛ در این مقاله، هدف اصلی تعیین صعود یا نزول شاخص هست و پیشبینی میزان در گامهای بعدی پژوهش قرار میگیرد. در [21] از ARIMA1 و شبکه عصبی به منظور پیشبینی دادههای بورس استفاده شده است. در [22] نیز از مدل ARIMA و دادههای روزانه مربوط به سالهای 1993 تا 2017 استفاده شده است. مدلهای سری زمانی آماری مانند فیلتر کالمن، فضای حالت، ARIMA و رگرسیون در تحلیل بازار سهام استفاده میشوند. در این مدلها متناسبسازی دادههای دارای ماهیت غیرخطی، دشوار است و عملاً این مدلها برای مدلسازی و پیشبینی سری زمانی با ماهیت غیرخطی مناسب نیستند. در [23] از بردار پشتیبان و الگوریتم کرم شبتاب بهبود یافته برای دادههای بورس استفاده شده است. همچنین در [24] از الگوریتم ژنتیک برای پیشبینی بورس استفاده شده است.
این مقاله در دو حوزه مورد بررسی قرار گرفته است:
در حوزه اول: از دادههای قبل سهام برای پیشبینی قیمت آینده استفاده شده است که مزیت این روش نسبت به مقالات قبل، کاهش تعداد داده ورودی شبکه عصبی و کاهش اندازه شبکه هست. در این حالت، تعیین مرتبه مدل با استفاده از یک روش جدید مبتنی بر الگوریتم بهینهسازی ملخ بهبودیافته انجام میگیرد. در حوزه الگوریتم نیز با ارائه یک نرخ یادگیری تطبیقی، الگوریتم بهینهسازی ملخ، بهبود یافته است. به منظور نشان دادن نتایج از نماد تسلا و شاخص NASDAQ استفاده شده است. در نتیجه از دادههای قبلی سهام برای پیشبینی تسلا و NASDAQ استفاده شده است(شبیهسازی 1-5 و 2-5).
در حوزه دوم، در صورتی که خطای پیشبینی بیشتر از مقدار تعیین شده باشد، علاوه بر اطلاعات گذشته سهام، از سایر ویژگیهای سهام در حوزه زمان استفاده میشود که منجر به کاهش خطا میشود. در این حالت، تعیین مرتبه مدل AR2 قیمت گذشته بر اساس الگوریتم ارائه شده هست و بهینهسازی پارامترهای غیرخطی نیز بر اساس الگوریتم ملخ هست. در این حالت، از پنجره گذاری روی سیگنال استفاده شده است و پنجرههای در نظر گرفته شده برای استخراج ویژگی 3، 5، 7، 14، 21 و 30 روزه بوده است.
2. پرسشهای پژوهش و اهداف
این مقاله برای پاسخ به سوالات پژوهشی زیر ارائه شده است:
- روند تغییر بازار مالی به خصوص نمادهای بورس در کشورهای مختلف مانند نماد تسلا با چه الگویی تغییر میکند و بر چه مدلی منطبق هست؟
- مقایسهای بین روشهای رگرسیون و روشهای محاسبات نرم انجام گیرد و بررسی گردد که شبکههای عصبی نتیجه بهتری دارد یا روشهای رگرسیون؟
- در اغلب مقالات از دادههای بازارهای موازی مانند بازار نفت و طلا برای پیشبینی بورس استفاده شده است، در این حالت آیا میتوان بدون استفاده از داده بازارهای موازی و کاهش ورودیها الگوی مناسب یک نماد را به دست آورد؟
- آیا متناسبسازی دادهها در یک مدل خطی یا غیرخطی میتواند برای پیشبینی و تحلیل روند بازار بورس استفاده شود؟
در این پژوهش، هدف این است که با استفاده از روشهای مختلف پیشبینی سری زمانی و همچنین روشهای متناسبسازی دادهها یک مدل مناسب برای پیشبینی نمادهای بورس به دست آورد و همچنین یک مقایسهای بین این روشها انجام داد و روش مناسب را انتخاب کرد. در محاسبات نرم، هدف این است که با کمترین تعداد ویژگی ورودی، یک پیشبینی از وضعیت آینده نمادهای بورس در کشورهای مختلف داشت. در این مقاله، ابتدا با استفاده از الگوریتمهای فراابتکاری دادههای موثر در پیشبینی پیشنهاد شده است، در نهایت یکسری الگوریتم پیشبینی سری زمانی و همچنین متناسبسازی دادهها ارائه شد و در نهایت یک مقایسه بین این روشها انجام شد.
3. روش پژوهش
3-1. گام اول: رویکرد روش
در این روش، با استفاده از دادههای بازارهای مالی مانند قیمت روز گذشته سهام و همچنین با معرفی الگوریتمهای مناسب پیشبینی سری زمانی، میتوان یک مدل مناسب را به دست آورد و به پیشبینی ارزش سهام پرداخت. در این حالت، روشهای مختلف برای انجام یک مسئله پرکاربرد شامل پیشبینی ارزش نماد تسلا پیشنهاد شده است. در این حالت، دادههای زمانهای مختلف نماد تسلا جمعآوری و از این دادهها برای آموزش شبکهها استفاده شد. در این حالت، به وسیله دادههای فعلی و همچنین مدل آموزش داده شده برای پیشبینی قیمت آینده سهام استفاده شد. در این حالت، دو هدف دنبال میشود، اول اینکه بتوان مدت زمان پیشبینی را طولانی کرد و با کمک دادههای با فاصله زمانی طولانیتر یک پیشبینی قابل قبول ارائه داد و در گام دوم، با استفاده از روشهای متناسبسازی دادهها، الگو و روند کلی تغییر نمادها را بررسی کرد.
3-2. گام دوم: روش جمعآوری دادهها برای تعیین مدل و پیشبینی نمادهای بورس
در این شبکهها برای تعیین مدل مناسب مانند شبکههای عصبی نیاز به تعدادی داده هست که این دادهها برای تعیین دادههای موثر گذشته برای پیشبینی ارزش آینده و همچنین مقداردهی اولیه و بهینهسازی پارامترها مورد استفاده قرار میگیرند. یکی از مشکلاتی که در روشهای شبکه عصبی به خصوص مدلهای پیچیده وجود دارد، بیشبرازش هست. این حالت در شرایطی به وجود میآید که مدل مورد نظر یک مدل پیچیده و غیرخطی هست؛ در صورتی که تعداد داده در دسترس محدود هست. در این حالت، باید یک تعادل بین دقت مورد نیاز و پیچیدگی شبکه که وابسته به تعداد داده هست، ایجاد کرد که بتوان بدون بیشبرازش به دقت مورد نظر دست یافت. در این مقاله، از دادههای نماد تسلا برای آموزش و آزمایش شبکه استفاده شده است. در این حالت، دادههای نماد تسلا در قالب اکسل جمعآوری شده و این دادهها به نرمافزار متلب منتقل شد و پس از آن الگوریتمهای مناسب روی این دادهها آزمایش شد و در نهایت نتایج شبیهسازی آورده شده است.
3-3. گام سوم: روشهای تحلیل
در این پژوهش، ابتدا دادههای نماد تسلا جمعآوری شد، سپس کد شبکههای مختلف و الگوریتمهای مناسب نوشته شد. سپس دادهها به سه قسمت دادههای آموزش، آزمایش و اعتبارسنجی تقسیم شد. در این شرایط، مرتبه مدل مناسب و تعیین پارامترهای گذشته که در پیشبینی موثر هستند و همچنین تعیین پارامترهای شبکهها به وسیله دادههای آموزش انجام میشود و پس از آن مدل مناسب به دست میآید و در نهایت شبکه روی دادههای مجزا از دادههای آموزش آزمایش میشود و نتایج در قسمت شبیهسازی آورده شده است.
3-4. گام چهارم: ارزیابی شبکهها
در نهایت به وسیله دادههای آزمایش، شبیهسازی انجام شد و پس از آن به وسیله شاخص خطای جذر میانگین مربعات به ارزیابی مدل پرداخته شد. در این حالت، نتایج پیشبینی برای شاخص نماد تسلا مورد قبول بود. در این حالت، به وسیله الگوریتمهایی که استفاده شد، تعداد دادههای ورودی کاهش یافت که موجب کاهش حجم شبکه شده است.
4. یافتهها و تئوری پژوهش
4-1. انتخاب مدل مناسب و مرتبه مدل برای پیشبینی
برای پیشبینی دادههای بورس، نیاز به تعیین یک مدل مناسب هست. پس از آن نیاز به تعیین مرتبه مدل هست که بتوان به این نکته پی برد که دادههای فعلی به کدام دادههای قبلی وابسته هستند. در حالت کلی، مدلهای گسسته به صورت (1) بیان میشود[25].
که در آن، y خروجی، u ورودی و e خطا هست.
در این مقاله، مطلوب این است که بدون در نظر گرفتن متغیرهای جهانی مانند نفت، طلا و... بتوان یک مدل برای پیشبینی مناسب به دست آورد. در این حالت، این روش باعث کاهش تعداد ورودی در شبکه شده است. با تطبیق این خواستهها با مدلهای خطی موجود، مدل AR بهترین روش برای تعیین مرتبه مدل هست؛ چراکه از دادههای گذشته نمادهای بورس استفاده میکند و برای کاهش هزینه، ورودی مجزا در نظر گرفته نشده است. در مدل AR رابطه (2) برقرار هست[25].
(2)
در (1)، خروجی و ورودی مدل هست؛ به علاوه در مدل AR، رابطه (3) برقرار هست.
(3)
در این حالت، با استفاده از الگوریتم بهینهسازی ملخ بهبود یافته، مرتبه مدل تعیین شده؛ به صورتی که ضرایب مدل مورد نظر با استفاده از الگوریتم بهینهسازی ملخ بهبود یافته به صورتی به دست آورده شود که رابطه (4) به دست بیاید.
Findwhere:
min (4)
در (4)، n بیانگر تعداد نمونه هست و ضرایبی که بیشترین اندازه را دارند، به عنوان موثرترین عناصر انتخاب میشوند و جملههای مربوط به این ضرایب را نگه میداریم و سایر عبارات حذف میشوند.
4-2. تعیین مرتبه مدل با الگوریتم بهینهسازی ملخ بهبود یافته
در اغلب الگوریتمهای فراابتکاری مراحل جستجو در دو گام پیگیری میشود:
در گام اول همه عاملها به صورت سراسری و تصادفی به جستجو میپردازند و در گام دوم، عاملها به صورت محلی در فضای مورد نظر گردش میکنند. در این روش، رفتار ریاضی عاملها که در این مقاله ملخها هستند به صورت (5) نمایش داده میشود.
(5)
در رابطه (5)، بیانگر تعداد عاملها، موقعیت عاملها، بیانگر تعامل اجتماعی بین عاملها، بیانگر نیروی جاذبه و بیانگر اثر باد هست. در این حالت نحوه رفتار عاملها به صورت (6) نشان داده میشود.
(6)
که پارامترهای (6) بر اساس روابط (7) به دست میآید.
(7)
با جایگذاری (7) در (5) و در نظر گرفتن تاثیر بهترین نتیجه جستجوی قبل، (8) به دست میآید[26].
(8)
که در آن حد بالا، حد پایین، بهترین نتیجه به دست آمده و نرخ یادگیری متناسب با خطا هست. یکی از نوآوریهای این مقاله، ارائه پارامتر نرخ یادگیری به صورت تطبیقی وابسته به خطا هست که در حالتی که حساسیت خطا زیاد هست، به سرعت افزایش مییابد و هنگام کاهش حساسیت خطا و نزدیکی به پاسخ بهینه، با نرخ کمتری اعمال میشود. در [26]، نرخ یادگیری به صورت خطی کاهش پیدا خواهد کرد. نرخ یادگیری خطی در بسیاری از کاربردها مناسب نیست؛ چراکه تا زمانی که خطا زیاد باشد، باید نرخ یادگیری بزرگ انتخاب شود و در صورت رسیدن به نزدیک نقطه بهینه، نرخ یادگیری کاهشی شود. در نتیجه در (9) یک مقدار برای حد بالای نرخ یادگیری به دست آمده است.
(9)
رابطه(9) منتج به یک رابطه تطبیقی برای نرخ یادگیری میشود؛ شیوه عملکرد این رابطه بدین صورت هست:
هنگامی که پارامترهای مجهول به دست آمدند، حساسیت خطا نسبت به پارامترهای به دست آمده سنجیده میشود و این حساسیت تشکیلدهنده حد بالای نرخ یادگیری تطبیقی تکرار بعدی هست. در صورتی که بزرگتر از 1 انتخاب شود و حساسیت خطا نسبت به پارامترها زیاد باشد، نرخ یادگیری نزدیک به مقدار خواهد بود، هنگامی که حساسیت خطا نسبت به پارامتر کم شود، نرخ یادگیری کاهش مییابد و با نرخ یادگیری معرفی شده در [26] به مقدار کمینه میرسد. در نتیجه مزیت نرخ یادگیری پیشنهاد شده در این مقاله نسبت به [26]، تطبیقی بودن این پارامتر بر اساس حساسیت خطا نسبت به پارامترها هست. اگر خطا برای پارامترهای خطی را به صورت(10) در نظر بگیریم، با جایگذاری (10) در (9)، رابطه (11) به دست میآید.
(10)
که در (10)، بردار پارامترها، خروجی، بردار معلوم و خطا هست.
(11) |
|
(12) |
|
| (13) |
(17) |
|
|
(21) |
# | الگوریتم/ روش | حالت | RMSE train | RMSE/MAX | RMSE test |
1 | شبکه عصبی[19]-لونبرگ | سوم | 15.98 | 0.024 | 16.28 |
2 | شبکه عصبی[19]-بیزین | سوم | 8.57 | 0.131 | 9.12 |
3 | شبکه عصبی[19]-گرادیان | سوم | 8.43 | 0.129 | 9.22 |
4 | شبکه GMDH | اول | 4.3729 | 0.00672 | 6.5712 |
5 | شبکه GMDH | دوم | 4.3909 | 0.00675 | 6.5802 |
6 | شبکه GMDH | سوم | 4.05 | 0.0062 | 5.59 |
7 | ANFIS | اول | 4.3653 | 0.0067 | 6.2912 |
8 | ANFIS | دوم | 4.3602 | 0.0067 | 6.3745 |
9 | ANFIS | سوم | 4.3509 | 0.00669 | 6.3812 |
10 | Gaussian-n=1 | اول | 11.42 | 0.017 | 15.86 |
11 | Gaussian-n=5 | اول | 7.32 | 0.011 | 10.95 |
12 | Gaussian-n=8 | اول | 7.35 | 0.011 | 10.83 |
13 | Polynomial-n=1 | اول | 7.27 | 0.0109 | 10.27 |
14 | Polynomial -n=5 | اول | 7.25 | 0.0109 | 9.96 |
15 | Polynomial -n=8 | اول | 7.24 | 0.0108 | 9.75 |
16 | RBF | اول | 4.99 | 0.0075 | 7.76 |
همانطور که در جدول 1 دیده میشود، شبکه GMDH با الگوریتم تعیین مرتبه مدل طراحی شده بهترین نتیجه را داشته است، پس از آن شبکه نروفازی نتایج مناسبی را داشت. با توجه به اینکه از دادههای آموزش برای آموزش شبکه استفاده شده، مقدار خطا برای دادههای آموزش در همه شبکهها به جز RBF نسبت به دادههای آزمایش کمتر بود. در توابع چندجملهای به ازای افزایش تعداد جمله، خطا کاهش یافت؛ ولی این افزایش تعداد جمله و کاهش خطا به حد قابل قبولی جهت مقایسه با شبکه GMDH نبود. به علاوه، در مدل گاوسی دیده میشود که با افزایش تعداد جمله از 5 به 8، خطا به صورت محسوس کاهش پیدا نکرده است و این نشانگر این هست که این روش برای پیشبینی این دادهها مناسب نبوده است.
5-2. پیشبینی شاخص NASDAQ
اطلاعات این شاخص از finance.yahoo استخراج شده است و برای مقایسه با نتایج مقاله [12]، دادههای استخراج شده از تاریخ 14/02/2017 تا تاریخ 27/12/2018 مورد بررسی قرار گرفته که شامل 440 داده هست و 80 درصد دادهها به عنوان آموزش و 20 درصد به عنوان آزمایش انتخاب شدهاند. در این قسمت، هدف اصلی ارائه ویژگیهای مناسب به عنوان ورودی شبکه هست که بتوان پیشبینی مناسبی از شاخص سهام داشت. در این قسمت چند سری ویژگی مطابق جدول 2 ارائه میشود. در این حالت، از روش پنجره گذاری روی سیگنال استفاده میشود، پنجره گذاری به صورت 3 روزه، 5 روزه، 7 روزه، 14 روزه، 21 روزه و 30 روزه هست.
جدول 2. ویژگیهای استفاده شده برای پیشبینی
# | مجموعه ویژگی | ویژگیها |
1 | اول | اطلاعات قبلی سهام |
2 | دوم | اطلاعات قبلی سهام+میانگین، میانه، کمینه، بیشینه، چولگی و انحراف معیار برای پنجرههای 3، 5، 7، 14، 21 و 30 روزه شامل 39 ورودی. |
3 | سوم | اطلاعات قبلی سهام+لگاریتم (میانگین، میانه، کمینه، بیشینه، چولگی و انحراف معیار) برای پنجرهای 3، 5، 7، 14، 21 و 30 روزه شامل 39 ورودی. |
نتایج پیشبینی بر اساس شبکه GMDH در جدول 3 آمده است. همانطور که دیده میشود مجموعه ویژگی سوم بهترین نتیجه را داشته است. چون دادههای آموزش 80 درصد دادههای ابتدایی و دادههای آزمایش 20 درصد بعدی هستند، دادههای آموزش و آزمایش کاملا از یکدیگر مستقل هستند؛ در نتیجه شبکه با دادههای آموزش، تنظیم میشود و به همین علت در جدول 1، خظای دادههای آزمایش بالاتر از آموزش هست. به منظور کاهش خطای دادههای آزمایش، باید از تعداد داده بیشتری استفاده کرد که الگوریتم کلیه الگوها را فرابگیرد.
جدول 3. نتایج پیشبینی
# | مجموعه ویژگی | RMSE TRAIN | RMSE TEST | RMSE TRAIN+TEST |
1 | مقاله[12]-RC | - | - | 78.09 |
2 | مقاله[12]-RNN | - | - | 78.80 |
3 | مقاله[12]-LSTM | - | - | 81.41 |
4 | اول | 58.4844 | 108.854 | 71.5114 |
5 | دوم | 25.5891 | 51.4271 | 32.419 |
6 | سوم | 25.1139 | 43.4015 | 29.6677 |
نتایج شبکه GMDH برای دادههای آموزش و آزمایش در شکلهای 9 تا 19 نشان داده شده است؛ در شکلهای دادههای آموزش، بازه محور افقی از 1 تا 353 و محور عمودی از 5000 تا 8000 و برای شکلهای دادههای تست، بازه محور افقی از 1 تا 90 که شامل 88 داده هست و بازه محور عمودی 6500 تا 8500 هست. همانطور که در جدول3 دیده میشود، به ترتیب مجموعه ویژگی سوم، دوم و اول دارای کمترین خطای پیشبینی بودهاند؛ به عبارتی هر چه از ویژگیهای بیشتری استفاده شده، نتایج بهتر و خطا کمتر شده است. در این شبیهسازیها، آموزش شبکه با استفاده از 80 درصد دادههای ابتدایی انجام شده و از 20 درصد باقیمانده برای آزمایش استفاده شده است که این مورد نشانگر استقلال دادههای آموزش و آزمایش هست که در پیشبینی بورس بسیار مهم هست.
در شکلهای 9 نتایج الگوریتم برای دادههای آموزش، در شکل 10 نتایج برای دادههای آزمایش و در شکل 11 نتایج الگوریتم و شبکه GMDH برای دادههای آموزش و آزمایش نشان داده شده است. همانطور که دیده میشود، از آنجایی که شبکه با دادههای آموزش، بهینه شده و آموزش داده میشود و سپس برای سنجش عملکرد از دادههای مستقل آزمایش استفاده میشود، نتایج پیشبین دادههای آموزش بهتر هست و نسبت به دادههای آزمایش خطای کمتری دارد. در شکلهای 9 تا 11، محور افقی بیانگر شماره روزهای جمعآوری داده و شماره داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیشبینی شده بورس و مقدار خطا هست.
شکل9. نتایج برای دادههای آموزش مجموعه ویژگی اول
شکل10. نتایج برای دادههای آزمایش مجموعه ویژگی اول
شکل11. نتایج برای دادههای آموزش و آزمایش مجموعه ویژگی اول
شکل 12، مجموعه ویژگی دوم را نشان میدهد که در این شکل محور افقی بیانگر شماره داده و محور عمودی بیانگر مقدار هست. در شکل 13 نتایج الگوریتم برای دادههای آموزش، در شکل 14 نتایج برای دادههای آزمایش و در شکل 15 نتایج الگوریتم و شبکه GMDH برای دادههای آموزش و آزمایش نشان داده شده است که در آنها، محور افقی بیانگر شماره روزهای جمعآوری داده و شماره داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیشبینی شده بورس و مقدار خطا هست. در این حالت، تعداد ویژگیهای ورودی شبکه افزایش یافته است و این افزایش در تعداد ویژگی منجر به افزایش دقت پیشبینی و کاهش خطا شده است. در این حالت نیز نتایج شبکه برای دادههای آموزش بهتر از دادههای آزمایش هست.
شکل12. مجموعه ویژگیهای دوم
شکل13. نتایج برای دادههای آموزش مجموعه ویژگی دوم
شکل14. نتایج برای دادههای آزمایش مجموعه ویژگی دوم
شکل15. نتایج برای دادههای آموزش و آزمایش مجموعه ویژگی دوم
در شکل 16، مجموعه ویژگی سوم نشان داده شده است که در این شکل محور افقی بیانگر شماره داده و محور عمودی بیانگر مقدار هست، در شکلهای 17 تا 19، نتایج الگوریتم برای مجموعه داده سوم نشان داده شده است که در آنها، محور افقی بیانگر شماره روزهای جمعآوری داده و شماره داده هست و محور عمودی به ترتیب بیانگر مقدار واقعی و پیشبینی شده بورس و مقدار خطا هست. در این حالت، از یک روش ابتکاری برای به دست آوردن ویژگیها استفاده میشود و لگاریتم این ویژگیها به همراه دادههای تعیین شده توسط الگوریتم تعیین مرتبه مدل، به عنوان ورودی به شبکه داده میشود. همانطور که در جدول 3 و شکلهای 17 تا 19 دیده میشود، نتایج دادههای آموزش و آزمایش نسبت به دو حالت قبل بهبود یافته است که این میتواند بیانگر ساختار غیرخطی بورس باشد. در این حالت نیز نتایج پیشبینی دادههای آموزش دارای خطای کمتری نسبت به دادههای آزمایش هست.
شکل16. مجموعه ویژگیهای سوم
شکل17. نتایج برای دادههای آموزش مجموعه ویژگی سوم
شکل18. نتایج برای دادههای آزمایش مجموعه ویژگی سوم
شکل19. نتایج برای دادههای آموزش و آزمایش مجموعه ویژگی سوم
6. بحث و نتایج
نکتهای که در ابتدا باید اشاره شود، این است که در اغلب مقالات دادههای آزمایش و آموزش از بین کل دادهها به صورت تصادفی انتخاب میشود؛ منتها این روش در حالت آزمایش عملی و کاربردی دچار محدودیتهای بسیار جدی میشود؛ بنابراین در این مقاله، در روش اول ابتدا تعداد داده آموزش از اولین داده تا 70 درصد دادهها انتخاب شد، سپس داده اعتبارسنجی انتخاب شد و در نهایت دادههای آزمایش انتخاب شد؛ بنابراین الگوریتم و شبکه ارائه شده یک روش مناسب هست که میتواند به صورت موثر برای پیشبینی بورس در حالت عملی و واقعی استفاده شود. دلیل تفاوت اندک خطای داده آموزش و آزمایش نیز همین مورد است؛ چراکه شبکه با یکسری داده در شرایط خاص آموزش داده شده و با استفاده از دادههای جدید در شرایط دیگر مورد بررسی قرار گرفته است. در روش دوم، 80 درصد دادههای ابتدایی به عنوان آموزش و 20 درصد باقیمانده به عنوان آزمایش انتخاب شدند.
در این مقاله، یک روش برای پیشبینی ارزش سهام و تحلیل آن بررسی شد؛ در این حالت، در ابتدا یک روش موثر بر اساس مدل AR و الگوریتم بهینهسازی ملخ با نرخ یادگیری تطبیقی و بهبود یافته ارائه شد. در این روش مدل مورد نظر جهت پیشبینی به صورت AR در نظر گرفته شد و برای بررسی اینکه کدام جملات بیشترین تاثیر را در پیشبینی دارند، از الگوریتم بهینهسازی ملخ بهبود یافته استفاده شد که یکی از نوآوریهای این مقاله هست و مزیتی که روش اول نسبت به مقالات قبل دارد این است که در این مقاله صرفاً از قیمت نماد استفاده شده و از شاخصهای نفت، طلا و... استفاده نشده که این موضوع موجب کاهش هزینه و کاهش تعداد داده ورودی و حجم شبکه شده است. در این روش جملاتی که بیشترین ضریب را دارند، دارای بیشترین تاثیر در پیشبینی خروجی هستند. بنابراین در این حالت مشخص گردید که خروجی به کدام جملات قبلی بستگی دارد. سپس از شبکه عصبی GMDH با الگوریتم آموزش ترکیبی حداقل مربعات برای مقداردهی اولیه و الگوریتم حداقل مربعات بازگشتی برای بهینهسازی برخط پارامترها و تطبیق شبکه با دادههای جدید استفاده شد؛ به علاوه برای آموزش شبکه نروفازی از یک الگوریتم جدید شامل روش حداقل مربعات برای مقداردهی اولیه پارامترهای خطی، الگوریتم حداقل مربعات بازگشتی برای آموزش برخط شبکه و الگوریتم بهینهسازی ملخ بهبود یافته استفاده شده است. با توجه به تغییراتی که در الگوریتم ملخ بهبود یافته انجام شده، باعث شد که این الگوریتم به یک الگوریتم تطبیقی تبدیل شود. بدین صورت که دیگر نیازی به تعیین تعداد بیشینه تکرار برای این الگوریتم نیست و حساسیت خطا تعداد تکرار را مشخص میکند؛ به علاوه استفاده از روش حداقل مربعات بازگشتی موجب شده که الگوریتم در مقابل تغییرات دادهها مقاومتر شود و با سرعت بیشتر آموزش داده شود. یکی از مواردی که میتواند در پژوهشهای بعدی مورد توجه قرار بگیرد، استفاده از سیستمهای دو بعدی برای پیشبینی شاخص هست، بدین صورت که شماره ماه و شماره روز در ماه به عنوان دو متغیر در نظر گرفته شود و پس از میتوان با تعداد متغیر کمتر به پیشبینی ارزش بورس پرداخت؛ به علاوه در صورت استفاده از سیستمهای چند متغیره و استفاده از ورودیهای مختلف میتوان به نتایج مناسبتری دست یافت. نکته بعدی این است که به وسیله این الگوریتم و شبکه توانستیم مدت زمان پیشبینی را طولانیتر کنیم، در این حالت با استفاده از دادههای سه روز، ده روز و دوازده روز قبل میتوان ارزش سهام را پیشبینی کرد. در روش دوم که برای مجموعه داده NASDAQ انجام شد، تعداد ویژگیهای ورودی شبکه را افزایش دادیم که منجر به کاهش خطا شد و نتایج مناسبتری به دست آمد. در این روش، از شیوه پنجرهگذاری 3، 5، 7، 14، 21 و 30 روزه استفاده شد و ویژگیهای زمانی و آماری و لگاریتم این دادهها استخراج و برای پیشبینی استفاده شد.
7. نتیجهگیری
در نهایت از دادههای نماد یک شرکت بورسی به نام تسلا و شاخص NASDAQ استفاده شد. در این حالت، دادههای موجود در الگوریتم AR قرار گرفت و در این حالت ضرایب جملات این مدل به گونهای انتخاب شد که خطا کمینه شود، در این حالت ضرایب با بیشترین اندازه انتخاب شد و این ضرایب به عنوان ورودیهای شبکه مورد استفاده قرار گرفت. پس از آن از شبکه GMDH و الگوریتم مناسب بهینهسازی پارامترهای خطی استفاده شد و نتایج مورد نظر در جدول بیان شد. پس از آن، از روشهای مختلف مانند چندجملهایهای درجه دو، سه و... و چندجملهایهای گاوسی استفاده شد. در این حالت، پارامترهای خطی به وسیله الگوریتمهای حداقل مربعات و حداقل مربعات بازگشتی بهینه شدند و پارامترهای غیرخطی به وسیله الگوریتم بهینهسازی سراسری مانند الگوریتم بهینهسازی ملخ بهبودیافته تعیین و بهینه شدند. در نهایت، با انجام یک مقایسه بررسی شد که شبکه GMDH بهترین نتیجه را داشت. نتایج این مقاله به صورت خلاصه به صورت زیر بیان میشود:
- پیشبینی طولانی مدت با استفاده از دادههای سه روز، ده روز و دوازده روز قبل.
- تعیین مرتبه مدل به طور موثر توسط یک روش جدید بر اساس الگوریتم بهینهسازی ملخ بهبود یافته.
- با استفاده از تعیین مرتبه مدل، تعداد ویژگیهای موثر در یادگیری کاهش یافت که منجر به کاهش تعداد ورودی شبکه شد.
- با شبکه و الگوریتم معرفی شده، نماد تسلا به صورت مناسب پیشبینی شده است.
- استفاده از روش پنجره گذاری و کاهش خطای پیشبینی.
- نشان داده شد که استفاده از ویژگیهای آماری در حوزه زمان منجر به کاهش خطا میشود و میتوان با خطای محدود، دادههای روزهای بعدی را پیشبینی کرد.
مراجع
[1]. Buettner R. Predicting user behavior in electronic markets based on personality-mining in large online social networks: A personality-based product recommender framework. The International Journal on Networked Business. Springer, 2016. pp. 1–19.
[2] Lu, T., Zhang, Y., & Li, B. (2019). The value of alternative data in credit risk prediction: Evidence from a large field experiment.
[3] Duan, J. (2019). Financial system modeling using deep neural networks (DNNs) for effective risk assessment and prediction. Journal of the Franklin Institute, 356(8), 4716-4731.
[4] Krauss C, Do XA, Huck N. Deep neural networks, gradient boosted trees, random forests: Statistical arbitrage on the S&P 500. Eur J Oper Res. 2017;259:689–702.
[5] Yolcu, O. C., Egrioglu, E., Bas, E., & Yolcu, U. (2022). Multivariate intuitionistic fuzzy inference system for stock market prediction: The cases of Istanbul and Taiwan. Applied Soft Computing, 116, 108363.
[6] Hiransha M, Gopalakrishnan EA, Menon VK, Soman KP. NSE stock market prediction using deep-learning models. Procedia Comput Sci. 2018;132: 1351–1362.
[7] Ravikumar, Srinath, and Prasad Saraf. "Prediction of stock prices using machine learning (regression, classification) Algorithms." 2020 International Conference for Emerging Technology (INCET). IEEE, 2020.
[8] Sun BQ, Guo H, Karimi HR, et al. Prediction of stock market futures based on fuzzy sets and multivariate fuzzy time series. Neurocomputing. 2015; 151:1528–1536.
[9] Efendi R, Arbaiy N, Deris MM. A new procedure in stock market forecasting based on fuzzy random auto-regression time series model. Inform Sci. 2018;441:113–132.
[10] Khedr AE, Yaseen N. Predicting stock market behavior using data mining technique and news sentiment analysis. Int J Intell Syst Appl. 2017;9:22.
[11] Ahmadi E, Jasemi M, Monplaisir L, et al. New efficient hybrid candlestick technical analysis model for stock market timing on the basis of the Support Vector Machine and Heuristic Algorithms of Imperialist Competition and Genetic. Expert Syst Appl. 2018;94:21–31.
[12] Wang, W. J., Tang, Y., Xiong, J., & Zhang, Y. C. (2021). Stock market index prediction based on reservoir computing models. Expert Systems with Applications, 178, 115022.
[13]. Safari Dehnavi, V., & Shafiee, M. (2020). »LQR for Generalized Systems Using Metaheuristic Algorithms Based on Disturbance Observer«. 28th Iranian Conference on Electrical Engineering (ICEE), 2020, 08, 04, Tabriz, Iran.
[14] Huang, W. (2007). Neural networks in finance and economics forecasting. International Journal of Information Technology & Decision Making, 6 (1), 113-140
[15] Dennis, O. & Mossman, CH. (2003). Neural network forecasts of Canadian stock returns using accounting ratios. International Journal of Forecasting, 19 (3), 453-465
[16] Kelly, J. (2011). »The current stock of money: an aggregation theoretic measure of narrowly defined money«. Applied Economics Letters, 18 (7), 659-664.
[17] Shqair, M. (2020). »Adaptation of conformable residual power series scheme in solving nonlinear fractional quantum mechanics problems«. Applied Sciences, 10 (3), 890-912.
[18] Erik, C., Gálvez, J., & Avalos, O. (2020). »Gravitational Search Algorithm for Non-linear System Identification Using ANFIS-Hammerstein Approach«. Recent Metaheuristics Algorithms for Parameter Identification (Springer), 854 (1), 97-134.
[19] Pourzamani, Z. & Miralavi, H. (2018). »Provide a model for stock price forecasting using meta-innovative methods and neural networks«. Quarterly Journal of Financial Management and Securities, 10 (40), 57-83 (in Persian).
[20] Samadipour, S., Matinfard, R. & Torkashvand, A. (2020). »Investigating and predicting the decline or growth of stock companies in a certain period of time using data mining classification technique«. The Third International Conference on New Strategies in Engineering, Information Science and Technology in the Next Century, 2020, 05, 20, Tehran, Iran (in Persian).
[21] Y. Du, "Application and analysis of forecasting stock price index based on combination of ARIMA model and BP neural network," 2018 Chinese Control And Decision Conference (CCDC), 2018, pp. 2854-2857, doi: 10.1109/CCDC.2018.8407611.
[22] Almasarweh, M., & Alwadi, S. (2018). ARIMA model in predicting banking stock market data. Modern Applied Science, 12(11), 309.
[23] Zhang, Jun, Yu-Fan Teng, and Wei Chen. "Support vector regression with modified firefly algorithm for stock price forecasting." Applied Intelligence 49.5 (2019): 1658-1674.
[24] Chung, H., & Shin, K. S. (2018). Genetic algorithm-optimized long short-term memory network for stock market prediction. Sustainability, 10(10), 3765.
[25] Lugnani, Lucas, et al. "ARMAX-based method for inertial constant estimation of generation units using synchrophasors." Electric Power Systems Research 180 (2020): 106097.
[26] Saremi, S., Mirjalili, S., & Lewis, A. (2017). Grasshopper optimisation algorithm: theory and application. Advances in Engineering Software, 105, 30-47.
[27] Shaghaghi, Saba, et al. "Comparative analysis of GMDH neural network based on genetic algorithm and particle swarm optimization in stable channel design." Applied Mathematics and Computation 313 (2017): 271-286.
[1] 1. Autoregressive integrated moving average
[2] Autoregressive model
3. Group Method of Data Handling