İnternetin gelişmesiyle birlikte kullanım oranı
her geçen gün artan sosyal ağlar kirli ve düzensiz verilerin bulunduğu ortamlar
haline gelmiştir. Verileri düzenleyen ve analiz eden sistemler oluşturabilmek
amacıyla bu makalede, twitter sosyal ağından elde edilen Türkçe tweetlerden
duygu çıkarımı yapılarak tweetlerin olumlu, olumsuz, nötr olarak sınıflandırılması
sunulmuştur. Twitter üzerinden çekilen 20000 verinin sözlük tabanlı doğal dil
işleme modeli ile kelimelerin sayısını temel alan özellik vektörleri elde
edilmiştir, Elde edilen tweetlerin 14471
adedi gönüllü bireyler tarafından etiketlenip %60’ı
eğitim %40’ı test verisi olarak kullanılmıştır. Test verisinin sınıflandırılması
DVM, Naïve Bayes ve Karar Ağacına göre yapılmıştır. Elde edilen sonuçlara göre
en yüksek doğruluk oranı Karar Ağacı ile elde edilmiştir.
Primary Language | Turkish |
---|---|
Journal Section | PAPERS |
Authors | |
Publication Date | June 1, 2019 |
Submission Date | October 31, 2018 |
Acceptance Date | December 19, 2018 |
Published in Issue | Year 2019 Volume: 4 Issue: 1 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
A Digital Object Identifier (DOI) is assigned for each published paper.