Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma

Ensar Arif Sağbaş

doi:10.35234/fumbd.1195908

Araştırma Makalesi

Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma

Yıl 2023, , 239 - 250, 28.03.2023

Ensar Arif Sağbaş

https://doi.org/10.35234/fumbd.1195908

Cited By: 1

Öz

Bir metin sınıflandırma problemi olarak duygu analizi, çevrimiçi metin belgelerinden öznel bilgi çıkarmanın kritik bir görevidir. Metin sınıflandırmanın önemli bir sorunu ise yüksek boyutluluktur. Boyut indirgeme, makine öğreniminde sınıflandırma performansını iyileştirmenin etkili bir yoludur. Alakasız özniteliklerin azaltılması eğitim süresini kısaltabilmekte ve sınıflandırma doğruluğunu artırabilmektedir. Farklı öznitelik seçim yöntemlerinin performansı, farklı veri kümelerinin özelliklerine bağlı olarak değişebilmektedir. Bu çalışmada filtre tabanlı 6 farklı öznitelik seçimi yönteminin (Korelasyon tabanlı öznitelik seçimi, Ki-kare, Kazanç oranı, Bilgi kazancı, OneR ve Simetrik belirsizlik katsayısı) performansı duygu sınıflandırmasında sıklıkla kullanılan 9 farklı veri kümesi üzerinde test edilmiş ve karşılaştırılmıştır. Bütün veri kümelerinde her bir öznitelik seçimi yöntemi için filtre puanları hesaplanmıştır. Elde edilen filtre puanları büyükten küçüğe sıralanmıştır. En yüksek filtre puanına sahip öznitelikten en düşük filtre puanına sahip özniteliğe doğru öznitelikler bir önceki alt kümeye eklenerek yeni alt kümeler oluşturulmuş ve sınıflandırılmıştır. Hesaplama sonuçları, önerilen yaklaşımın 9 genel duygu sınıflandırma veri kümesi için Çok terimli Naive Bayes sınıflandırıcısını kullanarak ortalama %94.34 doğruluk oranlarına ulaştığını göstermektedir. Arama uzayı dikkate alındığında, bu yaklaşımın geliştirilebilir ve mevcut yaklaşımlarla rekabet edebilir olduğu sonucuna varılabilir.

Anahtar Kelimeler

Duygu sınıflandırma, Öznitelik seçimi, Makine öğrenmesi, Çok terimli Naive Bayes, Doğal dil işleme

Kaynakça

A. Abbasi, H. Chen and A. Salem, “Sentiment analysis in multiple languages: Feature selection for opinion classification in web forums”, ACM Trans. Inf. Syst. 2018; 26(3): 1-34.
J.R. Chang, H.Y. Liang, L.S. Chen and C.W. Chang, “Novel feature selection approaches for improving the performance of sentiment classification”, J. Ambient Intell. Hum. Comput. 2020; 1-14.
O. Gokalp, E. Tasci and A. Ugur, “A novel wrapper feature selection algorithm based on iterated greedy metaheuristic for sentiment classification”, Expert Syst. Appl. 2020; 146: 113176.
W. Medhat, A. Hassan and H. Korashy, “Sentiment analysis algorithms and applications: A survey”, Ain Shams Eng. J. 2014; 5(4): 1093–1113.
G. Wang, J. Sun, J. Ma, K. Xu and J. Gu, “Sentiment classification: The contribution of ensemble learning”, Decis. Support Syst. 2014; 57: 77–93.
P. Kumbhar and M. Mali, “A survey on feature selection techniques and classifcation algorithms for efcient text slassifcation”, International Journal of Science and Research, 2013; 14(5): 2319–7064.
J.T. Pintas, L.A. Fernandes and A.C.B. Garcia, “Feature selection methods for text classification: a systematic literature review”, Artif. Intell. Rev. 2021; 54(8): 6149-6200.
G. Wang, Z. Zhang, J. Sun, S. Yang and C.A. Larson, “POS-RS: A Random Subspace method for sentiment classification based on part-of-speech analysis”, Inf. Process. Manage. 2015; 51(4): 458-479.
A. Onan, S. Korukoğlu and H. Bulut, “A multiobjective weighted voting ensemble classifier based on differential evolution algorithm for text sentiment classification”, Expert Syst. Appl. 2016; 62: 1-16.
A. Onan, S. Korukoğlu and H. Bulut, “A hybrid ensemble pruning approach based on consensus clustering and multi-objective evolutionary algorithm for sentiment classification”, Inf. Process. Manage. 2017; 53(4): 814-833.
A. Jalilvand and N. Salim, “Feature unionization: a novel approach for dimension reduction”, Appl. Soft Comput. 2017; 52: 1253-1261.
K. Yang, C. Liao and W. Zhang, “A sentiment classification model based on multiple multi-classifier systems”, In International Conference on Artificial Intelligence and Security, 2019; 287-298.
A. Onan, “Bidirectional convolutional recurrent neural network architecture with group-wise enhancement mechanism for text sentiment classification”, Journal of King Saud University-Computer and Information Sciences, 2022; 34(5): 2098-2117.
C. Shao and X. Chen, “Deep-learning-based financial message sentiment classification in business management”, Comput. Intell. Neurosci. 2022; 3888675.
J. Khan, N. Ahmad, A. Alam and Y. Lee, “Leveraging Semantic and Sentiment Knowledge for User-Generated Text Sentiment Classification”, In Proceedings of the Eighth Workshop on Noisy User-generated Text (W-NUT 2022), 2022; 101-105.
X. Yang, Y. Li, Q. Li, D. Liu and T. Li, “Temporal-spatial three-way granular computing for dynamic text sentiment classification”, Inf. Sci. 2022; 596: 551-566.
E. F. Ayetiran, “Attention-based aspect sentiment classification using enhanced learning through CNN-BiLSTM networks”, Knowledge-Based Syst. 2022; 252: 109409.
K. Karga, M. A. Toçoğlu ve A. Onan, “COVID-19 pandemi döneminde eğitimde derin öğrenmeye dayalı duygu analizi”, Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 2022; 24(72): 855-868.
H. Polat ve Y. Ağca, “Tripadvisor kullanıcılarının Türkçe ve İngilizce yorumları kapsamında duygu analizi yöntemlerinin karşılaştırmalı analizi”, Abant Sosyal Bilimler Dergisi, 2022; 22(2): 901-916.
Ö. Şahinaslan, H. Dalyan ve E. Şahinaslan, “Naive Bayes sınıflandırıcısı kullanılarak Youtube verileri üzerinden çok dilli duygu analizi”, Bilişim Teknolojileri Dergisi, 2022; 15(2): 221-229.
E. Ş. Dinçer, D. Kayaoğlu ve S. Safarlı, “Metin madenciliği ve duygu analizi ile siber zorbalık tespiti”, Eskişehir Türk Dünyası Uygulama Ve Araştırma Merkezi Bilişim Dergisi, 2022; 3(2): 38-45.
M. U. Salur ve İ. Aydın, “Türkçe tweetler için derin özellik çıkarımı tabanlı yeni bir duygu sınıflandırma modeli”, Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 2022; 34(1): 1-13.
M. Whitehead and L. Yaeger, “Building a general purpose cross-domain sentiment mining model”, In 2009 WRI world congress on computer science and information engineering 2019; 4: 472-476.
A. S. Yuksel, F. A. Senel and I. A. Cankaya, “Classification of soft keyboard typing behaviors using Mobile device sensors with machine learning”, Arabian J. Sci. Eng. 2019; 44(4): 3929-3942.
X.W. Chen and M. Wasikowski, “Fast: a roc-based feature selection metric for small samples and imbalanced data classification problems”, In Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining, 2008; 124-132.
S. Dey Sarkar, S. Goswami, A. Agarwal and J. Aktar, “A novel feature selection technique for text classification using Naive Bayes”, International scholarly research notices, 2014; 2014: 717092.
J. Ding and L. Fu, “A Hybrid Feature Selection Algorithm Based on Information Gain and Sequential Forward Floating Search”, Journal of Intelligent Computing, 2018; 9(3): 93.
W. Duch, “Filter methods. In Feature Extraction”, Springer, Berlin, Heidelberg 2006; 89-117.
D. Morariu, R. Cretulescu and M. Breazu, “Feature selection in document classification”, In The fourth international conference in romania of information science and information literacy, 2013; ISSN-L. 2247-0255.
A. McCallum and K. Nigam, “A comparison of event models for naive bayes text classification”, In AAAI-98 workshop on learning for text categorization 1998; 752(1): 41-48.
V. Vapnik, “The nature of statistical learning theory”, New York: Springer, 1995.
T. Joachims, “Text categorization with support vector machines: Learning with many relevant features”, In European conference on machine learning, Springer, Berlin, Heidelberg 1998; 137-142.
J. Han and M. Kamber, “Data mining: concepts and techniques”, 2nd. University of Illinois at Urbana Champaign: Morgan Kaufmann, 2006.
M. Kantardzic, “Data mining: concepts, models, methods, and algorithms”, John Wiley & Sons, 2011.
M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and I.H. Witten, “The WEKA data mining software: an update”, ACM SIGKDD explorations newsletter, 2009; 11(1): 10-18.

Toplam 35 adet kaynakça vardır.

Ayrıntılar

Birincil Dil	Türkçe
Konular	Mühendislik
Bölüm	MBD
Yazarlar	Ensar Arif Sağbaş 0000-0002-7463-1150
Yayımlanma Tarihi	28 Mart 2023
Gönderilme Tarihi	28 Ekim 2022
Yayımlandığı Sayı	Yıl 2023

Kaynak Göster

APA	Sağbaş, E. A. (2023). Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 35(1), 239-250. https://doi.org/10.35234/fumbd.1195908
AMA	Sağbaş EA. Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma. Fırat Üniversitesi Mühendislik Bilimleri Dergisi. Mart 2023;35(1):239-250. doi:10.35234/fumbd.1195908
Chicago	Sağbaş, Ensar Arif. “Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma”. Fırat Üniversitesi Mühendislik Bilimleri Dergisi 35, sy. 1 (Mart 2023): 239-50. https://doi.org/10.35234/fumbd.1195908.
EndNote	Sağbaş EA (01 Mart 2023) Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma. Fırat Üniversitesi Mühendislik Bilimleri Dergisi 35 1 239–250.
IEEE	E. A. Sağbaş, “Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma”, Fırat Üniversitesi Mühendislik Bilimleri Dergisi, c. 35, sy. 1, ss. 239–250, 2023, doi: 10.35234/fumbd.1195908.
ISNAD	Sağbaş, Ensar Arif. “Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma”. Fırat Üniversitesi Mühendislik Bilimleri Dergisi 35/1 (Mart 2023), 239-250. https://doi.org/10.35234/fumbd.1195908.
JAMA	Sağbaş EA. Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma. Fırat Üniversitesi Mühendislik Bilimleri Dergisi. 2023;35:239–250.
MLA	Sağbaş, Ensar Arif. “Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma”. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, c. 35, sy. 1, 2023, ss. 239-50, doi:10.35234/fumbd.1195908.
Vancouver	Sağbaş EA. Filtre Tabanlı Öznitelik Seçim Yöntemleri Kullanılarak Metinlerde Duygu Sınıflandırması Üzerine Karşılaştırmalı Bir Çalışma. Fırat Üniversitesi Mühendislik Bilimleri Dergisi. 2023;35(1):239-50.

Cited By

DERİN TRANSFORMATÖRLERDEN ÇİFT YÖNLÜ KODLAYICI TEMSİLLERİ VE DESTEK VEKTÖR MAKİNELERİ İLE TÜRKÇE FİLM YORUMLARI ÜZERİNE DUYGU ANALİZİ

Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi

https://doi.org/10.17780/ksujes.1241043

Makale Dosyaları

Tam Metin