Hisse senedi fiyat tahmininde ekonometrik ve makine öğrenme yöntemlerinin karşılaştırılması: BIST bankacılık uygulaması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İnsanların gelecek ile maddi kaygılarını azaltmanın bir yolu yatırım yapmaktır. Günümüzde çok çeşitli ve karmaşık yatırım araçlarından hisse senetleri en çok rağbet edilenlerin başında gelmektedir. Özellikle risk algısı veya yatırım beklentisi yüksek yatırımcılar tarafından hisse senetlerinin gelecek dönemlerine ilişkin fiyatları merak unsuru olmuştur. Hisse senedi fiyat tahmin çalışmaları uzun zamanlardan beri yapılmakta olan ve her geçen gün geliştirilen yöntemler ile yapılmaya devam eden bir çalışma alanıdır. Genel itibariyle ekonometrik ve makine öğrenme yöntemleri şeklinde iki grup halinde yapılan çalışmalar gelişen yeni tekniklerin uyumlanması ile birlikte daha da çeşitlenmektedir. Bu tez kapsamında ekonometrik yöntemlerden ARIMA ve ARIMAX ile makine öğrenme yöntemlerinden NNAR ve NNET yöntemleri karşılaştırılmıştır. Bu dört yöntem aynı zamanda otoregresif yöntemler (ARIMA ve NNAR) ve bağımsız değişkenli yöntemler (ARIMAX ve NNET) olarak da gruplanabilmektedir. Bu yöntemlerin performansları Türkiye'de piyasaların en önemli aktörlerinden biri olması, kurumsal yapılarının güçlü olması, ekonomiye yön verme potansiyeline sahip olmaları ve yatırımcı açısından önemli sinyaller barındırması sebebiyle BİST Bankacılık şirketleri (Akbank Türkiye A.Ş., Garanti Bankası A.Ş., Halk Bankası A.Ş., İş Bankası A.Ş., Vakıflar Bankası T. A. O. ve Yapı ve Kredi Bankası A.Ş.) kullanılarak gerçekleştirilmiştir. Uygulama kısmında bağımsız değişkenli yöntemler için dışsal girdilere ihtiyaç duyulması sebebiyle hisse senetlerinin günlük işlemlerinden türetilen 25 adet teknik gösterge ve piyasa değişkenleri kullanılmıştır. Tüm bu değişkenlerin hisse senedi fiyatı üzerinde etkilerinin aynı olmaması ve her hisse senedinin kendine ait dinamik ve karakteristik yapısında farklılık gözeteceği noktalarından hareket ile her bankaya ait kendine özgü model oluşturulmuştur. Bu aşamada on adet değişken azaltma tekniği uygulanmıştır. Bunlardan beş tanesi (SFBS, MARS, RFE, GA ve SA) kapanış fiyatı ile en yüksek ilişkili değişken kümesini herhangi bir ağırlıklandırma yapmadan sunarken, diğer beş tanesi (BORUTA, LM, RF, SVM KNN) tüm değişkenlerin kapanış fiyatını temsil etmesini önem derecesi olarak sunmuştur. Modeli oluşturan değişkenler, yöntemlerde başarılı kümelerde yer alma sıklıkları ve hisse senedi fiyatı ile ilişkisi göz önüne alınarak seçilmiştir. Ekonometrik ve makine öğrenme yöntemleri bankalara özgü model verilerine uygulanan kayan pencere tekniği yardımıyla uygulanmıştır. Yöntem kıyaslamasının yanı sıra veri periyotları 220, 180, 120, 90, 60 ve 30 günlük olarak belirlenmiş ve periyot farklılıklarının etkileri incelenmiştir. Bunun yanı sıra tahmin penceresi de 1 günden 10 güne kadar belirlenmiş ve pencerelerin yöntemler üzerindeki etkileri incelenmiştir. Bankalara ait analizler yıllar kapsamında değerlendirilmiş olup 2016, 2017, 2018, 2019 ve 2020 yılları ayrı ayrı yorumlanmıştır. Analizler neticesinde fiyat tahmini ile gerçekleşen fiyat arasındaki hatalar RMSE, MAE ve MAPE hata ölçütleri kullanılarak raporlanmıştır. Çalışmanın temel noktası bankaya özgü model üzerinden tahmin çalışması olmasına karşın yöntemler açısından genel bir değerlendirme yapıldığında NNET yönteminin pek çok bankanın analizlerinde en başarılı yöntem olarak tespit edildiği görülmektedir. Analizler neticesinde NNET yöntemi İş Bankası ve Halk Bankası'nda %85 üzerinde başarılı olmuştur. Garanti Bankası ve Vakıflar Bankasında %75 civarında iken en az Yapı Kredi Bankası'nda (%45) başarılı olmuştur. ARIMA yöntemi ise en çok Yapı Kredi Bankası'nda başarılı olurken onu Garanti Bankası ve Vakıflar Bankası izlemiştir. ARIMAX yönteminin başarısı çok kısıtlı miktarda kalmasına karşın Yapı Kredi Bankası modelinde önemli düzeyde başarı elde ederken Garanti Bankası'nda da belirgin bir katkı sağlamıştır. NNAR yöntemi ise en ciddi başarısını Akbank'ta gösterirken tüm analizler içerisinde %6 ile sınırlı kalmıştır. Diğer bankaların modellerinde önemli düzeyde bir başarı elde edememiştir. Veri periyodu bakımından en başarılı periyot 18 kez en düşük hata payı ile çalışan 220 günlük periyot olurken, 30 günlük periyot 6, 180 günlük periyot 3, 60 ve 90 günlük periyot 2 kez başarılı olmuştur. 120 günlük periyodun herhangi bir başarısı olmamıştır. Tahmin penceresi bakımından bir çeşitlilik söz konusu değildir. Tüm analizlerde en düşük hata payı ile çalışan pencere 1 günlük pencere olarak tespit edilmiştir. Bu durum hisse senetleri gibi çok çeşitli faktörlerden etkilenen ve hemen reaksiyon gösteren bir finansal varlıklarda uzun süreli tahminlerin istenilen düzeyde başarılı olamayacağının bir göstergesi niteliğindedir. Ekonometrik ve makine öğrenme yöntemleri bağlamında değerlendirme yapıldığında ise Akbank ve Garanti Bankası'nda ekonometrik yöntemler ortalama %24 başarılı olurken, makine öğrenme yöntemleri %76 oranında başarılı olmuştur. Bu oran Halk Bankası ve İş Bankası'da ise %90'a çıkmaktadır. Vakıflar Bankası'nda ekonometrik yöntemler %19 başarılı olurken, makine öğrenme yöntemleri %81 oranında başarılı analizler gerçekleştirmiştir. Tüm bankaların analizleri temel alındığında ekonometrik yöntemler %22.7, makine öğrenme yöntemleri ise %77.3 oranında başarılı olmuştur. Otoregresif yöntemler ve bağımsız değişkenli yöntemler bakımından genel bir değerlendirme yapıldığında, İş Bankası, Garanti Bankası ve Halk Bankası'nda otoregresif yöntemlerin başarısı ortalama %10 ile sınırlı kalmıştır. Vakıflar Bankası ve Akbank'ta bu oran ortalama %20 civarında iken Yapı Kredi Bankası'da ise %38'e kadar çıkmıştır. Bankalara ait tüm analizler göz önüne alındığında otoregresif yöntemler %18.3 oranında başarılı olurken bağımsız değişkenli modeller %81.7 oranında başarılı olmuştur. Analizlere bir bütün olarak bakıldığında bankaların kendi iç dinamikler dikkate alınmadığında makine öğrenme yöntemleri daha başarılı tahminler üretmiştir. Bunun yanında makine öğrenme yöntemleri ve bağımsız değişkenli yöntemlerde NNET, ekonometrik ve otoregresif yöntemlerde ise ARIMA başarılı olmuştur. One way people can reduce their financial worries about the future is to invest. Today, stocks are one of the most popular instrument among various and complex investment instruments. Especially by investors with high risk perception or investment expectation, the prices of stocks for the future periods have been a matter of curiosity. Stock price estimation studies are a field that has been done for a long time and continues to be done with methods developed day by day. In general, studies carried out in two groups as econometric and machine learning methods are becoming more diverse with the adaptation of developing new techniques.Within the scope of this thesis, ARIMA and ARIMAX from econometric methods and NNAR and NNET from machine learning methods were compared. These four methods can also be grouped as autoregressive methods (ARIMA and NNAR) and independent variable methods (ARIMAX and NNET). The performances of these methods have been compared by using BIST Banking companies (Akbank Turkey Inc., Garanti Bank Inc., HalkBank Inc., IşBank Inc., VakıfBank Inc. and YapıKredi Bank Inc.) as they are one of the most important actors in the markets in Turkey, their institutional structures are strong, they have the potential to shape the economy and they have important signals for investors.In the application part, 25 technical indicators and market variables derived from the daily transactions of stocks are used because external inputs are needed for the methods with independent variables. A model specific to each bank has been created by considering the fact that the effects of all these variables on the stock price are not the same and that each stock will differ in its dynamic and characteristic structure. At this stage, ten feature reduction techniques were applied. Five of them (SFBS, MARS, RFE, GA, and SA) present the set of variables that are highest correlated with the closing price without any weighting, while the other five (BORUTA, LM, RF, SVM KNN) consider all variables to represent the closing price in degree of importance. The variables that make up the model have been selected by considering the frequency of being in successful sets and their relationship with the stock price.Econometric and machine learning methods were applied to bank-specific models with the help of the sliding window technique. In addition to the method comparison, the data periods were determined as 220, 180, 120, 90, 60 and 30 days and the effects of the period differences were examined. In addition, the forecast window was determined from 1 day to 10 days and the effects of the windows on the methods were examined. The analyzes of the banks were evaluated within the scope of years, and the years 2016, 2017, 2018, 2019 and 2020 were interpreted separately. As a result of the analysis, the errors between the price prediction and the actual price were reported using the RMSE, MAE and MAPE error criteria.Although the main point of the study is the forecasting the stock prices on the bank-specific model, when a general evaluation is made in terms of methods, it is seen that the NNET method is determined as the most successful method in the analyzes of many banks. As a result of the analyzes, the NNET method was more than 85% successful in İşbank and Halkbank. While it was around 75% in GarantiBank and VakıfBank, it was at least successful in YapıKredi Bank (45%). The ARIMA method was most successful in YapıKredi Bank, followed by GarantiBank and VakıfBank. Although the success of the ARIMAX method was very limited, it achieved significant success in the YapıKredi Bank model. It also made a significant contribution to GarantiBank. The NNAR method, on the other hand, achieved its most significant success with 6% among all analyzes in Akbank, while it could not achieve a significant level of success in other banks' models.In terms of data period, the most successful period was the 220-day period with the lowest error 18 times, while the 30-day period was 6, the 180-day period was 3, the 60 and 90-day period was successful twice. The 120-day period has not had any success. There is no diversity in terms of the forecast window. In all analyzes, the window with the lowest error was determined as the 1-day window. This is an indication that long-term forecasts cannot be successful at the desired level for financial assets such as stocks that are affected by a wide variety of factors and that react immediately.When evaluated in the context of econometric and machine learning, econometric methods were successful at an average of 24% in Akbank and GarantiBank, while machine learning methods were successful at a rate of 76%. This ratio rises to 90% in Halk Bank and İşbank. While econometric methods were 19% successful in VakıfBank, machine learning methods performed 81% successful analysis. Based on the analyzes of all banks, econometric methods were successful by 22.7% and machine learning methods by 77.3%. When a general evaluation is made in terms of autoregressive methods and methods with independent variables, the success of autoregressive methods in İşbank, GarantiBank and Halkbank was limited to 10% on average. While this rate was around 20% in VakıfBank and Akbank, it increased to 38% in YapıKredi Bank. When all analyzes of banks are taken into account, autoregressive methods were successful at a rate of 18.3%, while models with independent variables were successful at a rate of 81.7%. Considering the analyzes as a whole, machine learning methods produced more successful predictions when the internal dynamics of the banks were not taken into account. In addition, NNET was successful in machine learning methods and methods with independent variables, and ARIMA was successful in econometric and autoregressive methods.
Collections