بررسی عملکرد مدل یادگیری عمیق BiLSTM در پیشبینی قیمت سهام شرکت اپل
چکیده
هدف: پیشبینی قیمت سهام بهعنوان یکی از موضوعات حیاتی در حوزه مالی همواره مورد توجه پژوهشگران و فعالان بازار سرمایه بوده است. این مطالعه با هدف ارزیابی عملکرد مدل یادگیری عمیق BiLSTM در پیشبینی قیمت سهام شرکت اپل انجام شده و بهطور خاص، نقش دو مولفه کلیدی یعنی تابع فعالسازی و روش بهینهسازی در بهبود دقت پیشبینی بررسی شده است.
روششناسی پژوهش: در این تحقیق، از مدل حافظه بلند و کوتاهمدت دوطرفه استفاده شد. برای بررسی تاثیر پارامترهای مدل، ترکیبهای مختلفی از توابع فعالسازی (از جمله ReLU) و الگوریتمهای بهینهسازی (از جمله Adam) بر عملکرد مدل آزموده شدند. دادههای مورد استفاده شامل اطلاعات تاریخی قیمت سهام اپل از سال 1980 تا 2024 بودند که از پایگاه Yahoo Finance استخراج شده و پس از پیشپردازش، در محیط Google Colab تحلیل شدند.
یافتهها: نتایج نشان میدهد که ترکیب تابع فعالسازی ReLU با الگوریتم بهینهسازی Adam نسبت به سایر ترکیبها دقت بالاتری در پیشبینی قیمت سهام دارد. این ترکیب باعث افزایش دقت مدل و بهبود توانایی آن در مدلسازی نوسانات بازار شده است. معماری پیشنهادی توانسته است روندهای قیمتی آینده را با خطای کمتر نسبت به مدلهای مرجع پیشبینی کند.
اصالت / ارزش افزوده علمی: نوآوری پژوهش حاضر در بررسی تاثیر ترکیبهای مختلف توابع فعالسازی و روشهای بهینهسازی بر عملکرد مدل BiLSTM در زمینه پیشبینی مالی است. همچنین، استفاده هدفمند از ساختار BiLSTM برای تحلیل دادههای مالی و طراحی مدلی دقیق برای دادههای سریزمانی، ارزش علمی قابلتوجهی به این مطالعه افزوده است.
کلمات کلیدی:
یادگیری عمیق، عمیق، پیشبینی قیمت سهام، تحلیل دادههای مالی، مدل BiLSTM، تابع فعالسازی، الگوریتم بهینهسازیمراجع
- [1] Hondroyiannis, G., & Papapetrou, E. (2001). Macroeconomic influences on the stock market. Journal of economics and finance, 25(1), 33–49. https://doi.org/10.1007/BF02759685
- [2] Mazur, M., Dang, M., & Vega, M. (2021). COVID-19 and the march 2020 stock market crash. Evidence from S&P1500. Finance research letters, 38, 101690. https://doi.org/10.1016/j.frl.2020.101690
- [3] Masoud, N. M. H. (2013). The impact of stock market performance upon economic growth. International journal of economics and financial issues, 3(4), 788–798. https://www.econjournals.com/index.php/ijefi/article/view/557
- [4] Li, Y. D., Işcan, T. B., & Xu, K. (2010). The impact of monetary policy shocks on stock prices: Evidence from Canada and the United States. Journal of international money and finance, 29(5), 876–896. https://doi.org/10.1016/j.jimonfin.2010.03.008
- [5] Ampomah, E. K., Qin, Z., & Nyame, G. (2020). Evaluation of tree-based ensemble machine learning models in predicting stock price direction of movement. Information, 11(6), 332. https://doi.org/10.3390/info11060332
- [6] Patel, J., Shah, S., Thakkar, P., & Kotecha, K. (2015). Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques. Expert systems with applications, 42(1), 259–268. https://doi.org/10.1016/j.eswa.2014.07.040
- [7] Zhang, K., Zhong, G., Dong, J., Wang, S., & Wang, Y. (2019). Stock market prediction based on generative adversarial network. Procedia computer science, 147, 400–406. https://doi.org/10.1016/j.procs.2019.01.256
- [8] Patil, P., Wu, C. S. M., Potika, K., & Orang, M. (2020). Stock market prediction using ensemble of graph theory, machine learning and deep learning models. Proceedings of the 3rd international conference on software engineering and information management. (pp. 85–92) Sydney, Australia. https://doi.org/10.1145/3378936.3378972
- [9] Rana, M., Uddin, M. M., & Hoque, M. M. (2019). Effects of activation functions and optimizers on stock price prediction using lstm recurrent networks. Proceedings of the 2019 3rd international conference on computer science and artificial intelligence (pp. 354–358) Beijing, China. https://doi.org/10.1145/3374587.337462
- [10] Di Persio, L., & Honchar, O. (2017). Recurrent neural networks approach to the financial forecast of google assets. International journal of mathematics and computers in simulation, 11, 7–13. https://iris.univr.it/handle/11562/959057
- [11] Roondiwala, M., Patel, H., & Varma, S. (2015). Predicting stock prices using LSTM. International journal of science and research, 6(4), 2319–7064. https://www.quandl.com/data/NSE
- [12] Hiransha, M., Gopalakrishnan, E. A., Menon, V. K., & Soman, K. P. (2018). NSE stock market prediction using deep-learning models. Procedia computer science, 132, 1351–1362. https://doi.org/10.1016/j.procs.2018.05.050
- [13] McNally, S., Roche, J., & Caton, S. (2018). Predicting the price of bitcoin using machine learning. 2018 26th euromicro international conference on parallel, distributed and network-based processing (PDP) (pp. 339–343). IEEE. https://doi.org/10.1109/PDP2018.2018.00060
- [14] Chung, H., & Shin, K. (2020). Genetic algorithm-optimized multi-channel convolutional neural network for stock market prediction. Neural computing and applications, 32(12), 7897–7914. https://doi.org/10.1007/s00521-019-04236-3
- [15] Xu, Y., Chhim, L., Zheng, B., & Nojima, Y. (2020). Stacked deep learning structure with bidirectional long-short term memory for stock market prediction. Neural computing for advanced applications: First international conference, ncaa 2020, shenzhen, china, july 3-5, 2020, proceedings 1 (pp. 447–460). Springer. https://doi.org/10.1007/978-981-15-7670-6_37
- [16] Lu, W., Li, J., Wang, J., & Qin, L. (2021). A CNN-BiLSTM-AM method for stock price prediction. Neural computing and applications, 33(10), 4741–4753. https://doi.org/10.1007/s00521-020-05532-z
- [17] Wang, Y., Wang, L., Yang, F., Di, W., & Chang, Q. (2021). Advantages of direct input-to-output connections in neural networks: The Elman network for stock index forecasting. Information sciences, 547, 1066–1079. https://doi.org/10.1016/j.ins.2020.09.031
- [18] Dutta, A., Kumar, S., & Basu, M. (2020). A gated recurrent unit approach to bitcoin price prediction. Journal of risk and financial management, 13(2), 23. https://doi.org/10.3390/jrfm13020023
- [19] Qiu, J., Wang, B., & Zhou, C. (2020). Forecasting stock prices with long-short term memory neural network based on attention mechanism. PLoS one, 15(1), e0227222. https://doi.org/10.1371/journal.pone.0227222
- [20] Schuster, M., & Paliwal, K. K. (1997). Bidirectional recurrent neural networks. IEEE transactions on signal processing, 45(11), 2673–2681. https://doi.org/10.1109/78.650093