Bir metin sınıflandırma problemi olarak duygu analizi, çevrimiçi metin belgelerinden öznel bilgi çıkarmanın kritik bir görevidir. Metin sınıflandırmanın önemli bir sorunu ise yüksek boyutluluktur. Boyut indirgeme, makine öğreniminde sınıflandırma performansını iyileştirmenin etkili bir yoludur. Alakasız özniteliklerin azaltılması eğitim süresini kısaltabilmekte ve sınıflandırma doğruluğunu artırabilmektedir. Farklı öznitelik seçim yöntemlerinin performansı, farklı veri kümelerinin özelliklerine bağlı olarak değişebilmektedir. Bu çalışmada filtre tabanlı 6 farklı öznitelik seçimi yönteminin (Korelasyon tabanlı öznitelik seçimi, Ki-kare, Kazanç oranı, Bilgi kazancı, OneR ve Simetrik belirsizlik katsayısı) performansı duygu sınıflandırmasında sıklıkla kullanılan 9 farklı veri kümesi üzerinde test edilmiş ve karşılaştırılmıştır. Bütün veri kümelerinde her bir öznitelik seçimi yöntemi için filtre puanları hesaplanmıştır. Elde edilen filtre puanları büyükten küçüğe sıralanmıştır. En yüksek filtre puanına sahip öznitelikten en düşük filtre puanına sahip özniteliğe doğru öznitelikler bir önceki alt kümeye eklenerek yeni alt kümeler oluşturulmuş ve sınıflandırılmıştır. Hesaplama sonuçları, önerilen yaklaşımın 9 genel duygu sınıflandırma veri kümesi için Çok terimli Naive Bayes sınıflandırıcısını kullanarak ortalama %94.34 doğruluk oranlarına ulaştığını göstermektedir. Arama uzayı dikkate alındığında, bu yaklaşımın geliştirilebilir ve mevcut yaklaşımlarla rekabet edebilir olduğu sonucuna varılabilir.
Duygu sınıflandırma Öznitelik seçimi Makine öğrenmesi Çok terimli Naive Bayes Doğal dil işleme
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | MBD |
Authors | |
Publication Date | March 28, 2023 |
Submission Date | October 28, 2022 |
Published in Issue | Year 2023 |