Dalgacık dönüşümü ve destek vektör makineleri ile tahmin: BIST üzerine bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Temelde sinyal analizinde kullanılan bir yöntem olan dalgacık dönüşümü ile veri madenciliği yöntemlerinden bir yapay öğrenme algoritması olan destek vektör makineleri yöntemlerinin birlikte finansal zaman serileri üzerinde kullanılmasının amaçlandığı bu çalışmada; teknik göstergeler, yurtdışı borsa endeksleri, makroekonomik göstergeler ve haftanın günleri gibi bağımsız değişkenler kullanılarak BIST 100 endeksinin yönü tahmin edilmektedir. Analizde, 15 Ekim 1997 tarihi ile 30 Aralık 2014 tarihleri arasındaki borsanın açık olduğu işgünlerini kapsayan 4296 günlük gözlem veri seti kullanılarak günlük, haftalık ve aylık veri setleri oluşturulmuştur.Çalışmada günlük, haftalık ve aylık periyotlarda değişken seçme yöntemleri (temel bileşen analizi, k-en yakın komşuluk, korelasyon, lojistik regresyon, kısmi en küçük kareler, rastgele orman algoritması) yardımıyla çeşitli modeller oluşturulmuş, ayrıca tüm değişkenlerin yer aldığı modeller de oluşturulmuştur.Çalışmanın amacı doğrultusunda; geliştirilen ham ve dalgacık modellerin borsa endeksi üzerindeki tahmin performansları ölçülerek dalgacık dönüşümünün destek vektör makinelerinin tahmin performansına etkisi incelenmiş ve dalgacık dönüşümünün destek vektör makinelerinin tahmin performansını belirgin şekilde artırdığı saptanmıştır. Elde edilen analiz sonuçlarına göre; BIST 100 endeksinin yönünü en iyi tahmin eden modelin günlük veri setindeki tüm teknik gösterge, yurtdışı borsa endeksleri, makroekonomik göstergeler ve gün değişkenlerinden oluşan Dalgacık TÜM55 modeli (%90,84) olduğu, bu modelin ham veri setindeki (%56,90) tahmin oranını yaklaşık %60 artırdığı tespit edilmiştir. Haftalık modellerde ise en yüksek tahmin performansı, lojistik regresyon ile seçilen H-LR<,20 ve H-LR<,05 dalgacık modelleriyle (%84,62) elde edilmiş; aylık modellerde en yüksek tahmin performansı ise k-en yakın komşuluk ile seçilen A-KNN20 ve lojistik regresyon ile seçilen A-LR<,10 dalgacık modellerinde (%74,36) gerçekleşmiştir. Ayrıca elde edilen modellerin tahmin performansları değerlendirildiğinde; günlük veri setinde değişken seçimi ile elde edilen değişkenler kullanılarak haftalık ve aylık modellerin oluşturulabileceği, haftalık ve aylık veri setlerinde ayrıca değişken seçimi yapılmasına gerek olmadığı sonucu elde edilmiştir. Diğer bir önemli sonuç ise, dalgacık dönüşümünün yön tahmininde ham veri setinde karşılaşılan azalış yönündeki sınıflandırma hatalarını azaltarak, artış ve azalışların birbirine yakın oranlarda sınıflandırılmasını sağlamasıdır. In this study where it is aimed to use wavelet transform, a method used essentially in signal analysis, and support vector machines method, a machine learning algorithm of data mining, together on financial time series. BIST 100 index direction is estimated by using independent variables such as technical indicators, overseas stock indices, macroeconomic indicators and days of week. In the analysis daily, weekly and monthly data sets have been established by using observation data set for 4296 days including the weekdays when the stock market is open between 15th October 1997 and 30th December 2014. In the study, several models have been established via variable selection methods (principal component analysis, k nearest neighbors, correlation, logistic regression, partial least squares, random forest algorithm) in daily, weekly and monthly period and models including all variables have also been established. In accordance with the aim of the study, the effect of wavelet transform on estimation performance of support vector machines has been analyzed by measuring estimation performance of the developed raw and wavelet models on stock market index and it has been identified that wavelet transform significantly increases the estimation performance of support vector machines. According to the obtained analysis results, it has been identified that the best estimating model of BIST 100 index direction is Wavelet TÜM55 model (90,84%) which is formed by all technical indicators, overseas stock indices, macroeconomic indicators and day variables in daily data set and this model increases the estimation rate in raw data set (56,90%) about 60 %. However, the highest estimation performance in weekly models has been provided by H-LR<, 20 and H-LR <, 05 wavelet models selected by logistic regression, on the other hand the highest estimation performance in monthly models has occurred in A-KNN20 model selected by k nearest neighbors and A-LR <,10 wavelet model (74,36 %) selected by logistic regression. In addition, when the estimation performance of the obtained models is considered, it has been found that weekly and monthly models can be established by using the variables obtained by the variable selection in daily data set and there is no need for extra variable selection in weekly and monthly data set. Another significant result is also the fact that by reducing the classification errors of decreases encountered in raw data set in direction estimation of wavelet transform, it provides the classification of increases and decreases in almost equal proportions.
Collections