Metin madenciliği yöntemleri, yapılandırılmamış
metinlerden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak
için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile
büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz
edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma,
sınıflandırma, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin
işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan
duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel
bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde
sunulan çalışmada, sosyal medya paylaşımları, roman, müşteri yorumları gibi
Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni
bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi
yaparken "kelime düzeyinde" çalışmaktadır. Buna ek olarak, duygu
analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son
ekler türünde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime,
ikinci ve üçüncü sözlük yaklaşık 25.000 kelime içermektedir. Geliştirilen iki
yöntemle üç farklı veri seti üzerinde deneyler yapılmıştır. Birinci yöntem bu
veri setlerinde sırasıyla %77,14, %72,78 ve %74,17 doğruluk oranına ulaşmıştır.
İkinci yöntem ise aynı veri setleri üzerinde sırasıyla %82,85, %74,92 ve %77,50
doğruluk oranına erişmiştir. Yapılan deneysel çalışmaların sonuçları
incelendiğinde sistemin hatalı karar
verdiği cümleler incelendiğinde hatalı yazılan kelimeler, kinayeli yorumlar,
art niyetli yazılmış yorumlar, bazı deyimlerin ve kelimelerin birden fazla
anlamının olması, karşılaştırma içeren cümlelerin bir taraf için olumlu duygu
taşırken diğer taraf için olumsuz duygu taşıması gibi durumların hatalı tespit
işleminde etkin olduğu gözlemlenmiştir.Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma,
makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin
işlenmesi ve görselleştirilmesidir.
Text mining sentiment analysis Text classification Machine learning Document classification
Birincil Dil | Türkçe |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Aralık 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 1 Sayı: 2 |
International Periodical of Recent Technologies in
Applied Engineering