Hisse senedi piyasası birçok makroekonomik değişkenler ve politik faktörlerden etkilendiği için finansal veri madenciliğinde, hisse senedi endeksi hareket yönü tahmini zor bir sınıflandırma problemidir. Bu problemin doğru tahmini kısa vadeli yatırımcılara erken öneri sistemi olarak hizmet verebileceği için birçok araştırmacının ilgisini çekmektedir. Bu çalışma, sınıflamaya dayalı denetimli makine öğrenmesi algoritmaları yardımı ile Borsa İstanbul 100 (BIST100) endeksinin günlük aşağı veya yukarı hareket yönünü tahmin etmeyi amaçlar. İlgilendiğimiz problem, belirli bir günde BIST100 endeksinin yükseleceğini veya düşeceğini tahmin etmektir. Bu amaç doğrultusunda, BIST100 endeks hareket yönü üzerindeki etkisi istatistiksel olarak anlamlı bulunan bağımsız değişkenler kullanılarak çoklu lojistik regresyon ve K-en yakın komşu algoritması modelleri kurulmuştur. Son olarak, örneklem dışı tahminler borsadaki gerçek hareketlerle karşılaştırılmıştır. Performanslar sadece doğruluk ile değil, diğer istatistiksel metrikler ile de ölçülmüştür. Elde edilen sonuçlara göre, lojistik regresyon analizi verilen zaman dilimi içinde BIST100 verileri üzerinde K-en yakın komşu algoritmasına karşı %81 doğruluk oranı ile daha iyi tahmin performansı elde etmiştir.
Endeks hareket yönü K-En yakın komşu algoritması Lojistik regresyon Denetimli öğrenme
In financial data mining, stock index movement direction prediction is a challenging classification problem, since stock index is affected by many economic and political factors. The accurate prediction of this problem is of interest to many researchers as it can serve as an early recommender system for short-term financiers. This study aims to predict daily upward or downward movement direction of Borsa Istanbul 100 (XU100) index with the aid of supervised machine learning algorithms based on classification. Problem we deal with includes whether on a specific day the XU100 index fall into up bucket or fall into down bucket. For this purpose, the multiple logistic regression and K-nearest neighbors algorithm models are fitted using independent variables whose effect on XU100 index movement direction was statistically significant. Lastly, the out-of sample predictions are compared with the actual movements in the stock market. Performances are measured not only with accuracy but also other statistical metrics. According to the results obtained, logistic regression analysis achieves better predict performance with 81% accuracy opposed to K-nearest neighbors algorithm on XU100 data over the given time period.
Index movement direction K-Nearest neighbors algorithm Logistic regression Supervised learning
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 20 Ağustos 2021 |
Yayımlandığı Sayı | Yıl 2021 Cilt: 27 Sayı: 4 |