In this study, sentiment analysis was carried out by applying various machine learning algorithms on the data set consisting of 11412 Turkish comments about electronic devices on e-commerce sites. Mood states obtained from this data set were classified as positive, negative and neutral. The machine learning algorithms used are K-Nearest neighbor (IBK), KStar, Naive Bayes (NB), Naive Bayes Multinomial (NBM), Logistic Regression (LR), Support Vector Machine (DVM), Decision Tree (J48) and Random Forest ( RO) form. The successes obtained according to precision, sensitivity, F-score, AUC criteria were compared using the K-layer cross validation method and machine learning algorithms. The results obtained in separate tables for positive, negative and neutral comments and according to the weighted average are compared. According to these results, the highest AUC value is with NBM and RO algorithms; The weighted average highest AUC value was also obtained with the NBM algorithm. The successes achieved as a study on neutral sentences with large datasets support further studies on neutral sentences. In addition, in this study, the importance of algorithm selection is shown by using 8 different algorithms.
Bu çalışmada e-ticaret sitelerindeki elektronik cihazlar hakkında yapılan Türkçe 11412 yorumdan oluşan veri seti üzerinde çeşitli makine öğrenmesi algoritmaları uygulanarak duygu analizi yapılmıştır. Bu veri setinden elde edilen duygu durumları pozitif, negative,nötr olarak sınıflandırılmıştır. Kullanılan makine öğrenmesi algoritmaları K-En yakın komşu (IBK), KStar, Naive Bayes (NB), Naive Bayes Multinominal (NBM), Lojistik Regresyon (LR), Destek Vektör Makinesi (DVM), Karar Ağacı (J48) ve Rastgele Orman (RO) şeklindedir. K-katmanlı çapraz doğrulama yöntemi ile makine öğrenmesi algoritmaları kullanılarak kesinlik, duyarlılık,
F-skor, AUC kriterlerine göre elde edilen başarılar karşılaştırılmıştır. Pozitif, negative nötr, yorumlar için ve ağırlıklı ortalamaya göre ayrı tablolarda elde edilen sonuçlar kıyaslanmıştır. Bu sonuçlara göre en yüksek AUC değeri NBM ve RO algoritmalar ile; ağırlıklı ortalama en yüksek AUC değeri de NBM algoritması ile elde edilmiştir. Büyük veri setleri ile nötr cümleler üzerine yapılan bir çalışma olarak elde edilen başarılar nötr cümleler üzerine daha fazla çalışma yapılmasını desteklemektedir. Ayrıca bu çalışmada 8 farklı algoritma kullanılarak algoritma seçiminin önemi gösterilmiştir.
Duygu Analizi Makine öğrenmesi algoritmaları Naive Bayes Multinominal F-skor AUC.
Birincil Dil | Türkçe |
---|---|
Konular | Doğal Dil İşleme |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 21 Aralık 2023 |
Yayımlandığı Sayı | Yıl 2023 Cilt: 6 Sayı: 2 |
Dergimizin Tarandığı Dizinler (İndeksler)
Academic Resource Index | Google Scholar | ASOS Index |
Rooting Index | The JournalTOCs Index | General Impact Factor (GIF) Index |
Directory of Research Journals Indexing | I2OR Index
|