Dünya’da ve Türkiye’de artan internet kullanımına bağlı olarak bireyler sosyal medya platformlarını da aktif olarak kullanmaktadır. Kullanıcılar sosyal medya platformlarını kişisel gelişim, alışveriş, ticaret, eğitim, sosyalleşmek, arkadaşlıklar edinmek, çevrimiçi içerik üretmek ve bu içerikleri diğer kullanıcılarla paylaşabilmek amacıyla kullanmaktadırlar. Ama bu iyi niyetli kullanımların yanı sıra karşıdaki kişiye zarar vermek, onu küçük düşürmek, itibarını zedelemek ya da bilerek ve isteyerek zorbalık yapmak amacıyla da kullanımlar söz konusudur. Araştırmadaki amaç sosyal medya platformlarından biri olan Twitter’dan alınan yorumları doğal dil işleme süreçlerine tabi tutarak yorumlar içerisinde siber zorbalık olup olmadığını tespit etmek ve bu verilerin girdi olarak kullanıldığı sınıflandırma algoritmalarından elde edilen sonuçları karşılaştırarak en iyi sonucu elde etmektir. Araştırmada 11114 yorumdan oluşan veri seti doğal dil işleme süreçlerinden geçirilerek sınıflandırma algoritmalarına giriş verisi olarak verilmiştir. Bu verilerin bir bölümü eğitim seti olarak bir bölümü de test seti olarak kullanılmıştır. Sonuçta sınıflandırma algoritmalarından Ekstra Trees algoritmasından %86,95 doğruluk oranı elde edilerek diğer sınıflandırma algoritmasına göre daha başarılı olduğu gözlemlenmiştir.
Due to the increasing internet usage in the world and in Turkey, individuals also actively use social media platforms. Users use social media platforms for personal development, shopping, commerce, education, socializing, making friends, producing online content and sharing these contents with other users. But in addition to these well-intentioned uses, there are also uses to harm the other person, humiliate her/him, damage her/his reputation, or knowingly and intentionally bully her/him. The aim of the research is to subject the comments received from Twitter, one of the social media platforms, to natural language processing processes to determine whether there is cyberbullying in the comments and to obtain the best result by comparing the results obtained from the classification algorithms where these data are used as input. In the research, the dataset consisting of 11114 comments was passed through natural language processing processes and given as input data to classification algorithms. Some of these data were used as the training set and some as the test set. As a result, it was observed that the Extra Trees algorithm, one of the classification algorithms, was more successful than the other classification algorithm, with an accuracy rate of 86.95%.
Primary Language | Turkish |
---|---|
Subjects | Reinforcement Learning |
Journal Section | Research Articles |
Authors | |
Publication Date | June 26, 2024 |
Submission Date | April 1, 2024 |
Acceptance Date | June 9, 2024 |
Published in Issue | Year 2024 Volume: 8 Issue: 1 |