Bütün sektörler dahilinde finans sektöründe de müşterilere ait fikir ve düşüncelerinin belirlenmesi, firma ve kurumların ileriki dönemler için sunacağı hizmetleri etkilemektedir. Kripto para birimlerinin (Bitcoin, Ethereum, Ripple vb.) ekonomik ve sosyal etkileri hızla artmaya devam ettikçe, ilgili haber makalelerinin ve sosyal medya yayınlarının, özellikle de tweetlerin yaygınlığı da artmaktadır. Bu çalışmada, Twitter kullanıcılarının finans sektörü konularından biri olan Bitcoin ile ilgili yorumları derlenerek bir duygu analizi çalışması yapılmıştır. Kullanıcı yorumları, Twitter’ın sunmuş olduğu API hizmeti vasıtasıyla Python Programlama Dili kullanılarak alınmış; yorumlar olumlu, nötr ve olumsuz etiketler ile ayrıştırılmış, etiket bulutunda toplanmıştır. Naïve Bayes ve Lojistik Regresyon algoritmaları kullanılarak oluşturulan modellerde başarı oranları karşılaştırılmıştır. Naïve Bayes uygulamasının tweetlerin duygularını tahmin etmedeki başarı oranı %72,19 olurken, Lojistik Regresyon uygulamasında bu oran %75,53 olmuştur. Çalışmanın ikinci aşamasında ise, duygu analizinden sonra “Bitcoin” anahtar kelimesi içeren günlük pozitif tweet oranı ile Bitcoin günlük açılış değeri beraber kullanılarak Bitcoin kapanış değeri tahminlemesi yapılmıştır. Finans verileri Yahoo Finance web sitesi üzerinden alınmış; Doğrusal Regresyon ve Rastgele Orman Regresyon yöntemleri ile modeller oluşturulmuştur. Doğrusal Regresyon için r² değeri %88,97 çıkarken, Rastgele Orman Regresyonu için ise %94,16 olmuştur.
Anahtar Kelimeler: Duygu analizi, Twitter, Bitcoin, Makine öğrenmesi, Veri madenciliği, Finans
Eskişehir Teknik Üniversitesi
19ADP048
Bu çalışma Eskişehir Teknik Üniversitesi Bilimsel Araştırma Projeleri Komitesi tarafından desteklenmiştir (ESTÜ ADP proje numarası: 19ADP048).
The identification of actual and potential customers' opinions before and after purchase shapes the services offered by companies in the financial sector as well as in every sector. Cryptocurrencies as their economic and social impact continues to increase rapidly, the prevalence of related news articles and social media posts, especially tweets, also increases. In this study, sentiment analysis was applied by collecting comments and thoughts about Bitcoin on the social media platform Twitter. User comments were received using the Python Programming Language via the API offered by Twitter. Compiled user comments were separated with positive, negative and neutral tags, and the results were analyzed using Naïve Bayes and Logistic Regression. Success rate of sentiment prediction with Naïve Bayes was found 72,19% and for Logistic Regression 75,33%. After sentiment analysis, this study attempts to predict Bitcoin daily closing value using percentage of positive tweets that include “Bitcoin” keyword and Bitcoin daily opening value. Yahoo Finance has been the source of the financial data used in this study. Models were created using Linear Regression and Random Forest Regression. The r² value for Linear Regression was found 88,97%, for Random Forest Regression the r² value was found 94,16%.
Keywords: Sentiment analysis, Twitter, Bitcoin, Machine learning, Data mining, Finance
19ADP048
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Project Number | 19ADP048 |
Publication Date | May 29, 2021 |
Published in Issue | Year 2021 Volume: 9 Issue: 3 - Additional Issue |