Bu çalışma kapsamında iş tatmini faktörlerini belirlemeye ve analiz etmeye yönelik olarak çalışanların çevrimiçi değerlendirmelerinin sınıflandırıcı topluluklarına dayalı analizi yapılmıştır. Metin sınıflandırma işlemi, önceden tanımlanmış kategoriler veya sınıflar altında metin belgelerinin otomatik olarak sınıflandırılmasıdır. Bu kapsamda makine öğrenmesi teknikleri, dokümanlara anahtar kelimeler atamak ve bunları belirli kategorilerde sınıflandırmak için kullanılır. Makine öğrenmesi, belgeleri otomatik olarak kategorilere ayırmamızı sağlar.
Metin madenciliği, metinleri organize etmek amacıyla önceden tanımlanmış kategorilere dahil etme işlemidir. Son yıllarda dijital ortamdaki verinin artması, bu verilerden bilgi çıkarımını ve bilginin kullanılabilirliğinin artırılması üzerine olan çalışmaları hızlandırmıştır. Metinlerin verimli kullanılabilmesi ve aranılan bilgiye hızlıca ulaşılabilmesi için metinlerin kategorize edilmesi önem kazanmıştır. Büyük belge koleksiyonlarını elle düzenlemek son derece zaman alıcıdır ve hataya açıktır. Otomatik metin sınıflandırma uygulamaları bu noktada hızlı ve maliyeti düşük çözümler sunar. Metin sınıflandırma işleminin, istenmeyen mesaj veya elektronik postaları filtreleme, bilimsel makalelerin otomatik indekslenmesi, web sayfaların etiketlenmesi, belge türünün tanımlanması gibi uygulama alanları mevcuttur.
Çalışanların çevrimiçi değerlendirmelerinin sınıflandırıcı topluluklarına dayalı analizi yapılması amacıyla çalışan kişilerin çalışmış oldukları firmalar hakkındaki düşünceleri tr.indeed.com'da yayınlanan toplam 18 farklı firmadan elde edilen 3023 adet çevrimiçi değerlendirme elde edilmiştir. Her bir veri seti için, öznitelik temsili yöntemlerinden terim sıklığı (TF), terim varlığı (TP) ve TF-IDF ölçütleri için 1-gram, 2-gram ve 3-gram temsilleri ile toplam dokuz farklı veri temsili elde edilmiştir. Yapılan deneysel çalışmalarda beş temel sınıflandırma algoritması topluluk öğrenme yöntemleri ile birleştirilerek doğru sınıflandırma performansları incelenmiştir.
Within the scope of this study, an analysis of the online evaluations of employees based on classifier ensemble was made in order to identify and analyze job satisfaction factors. Text classification is the automatic classification of text documents under predefined categories or classes. In this context, machine learning techniques are used to assign keywords to documents and classify them into specific categories. Machine learning allows us to automatically categorize documents.
Text mining is the process of including texts into predefined categories for the purpose of organizing them. The increase in data in the digital environment in recent years has accelerated the studies on extracting information from these data and increasing the usability of information. It has become important to categorize the texts in order to use the texts efficiently and to reach the sought information quickly. Manually editing large document collections is extremely time-consuming and error-prone. Automatic text classification applications offer fast and cost-effective solutions at this point. Text classification has application areas such as filtering spam or e-mails, automatic indexing of scientific articles, tagging web pages, and defining document type.
In order to analyze the online evaluations of the employees based on their classifier communities, 3023 online evaluations obtained from a total of 18 different companies, which were published on tr.indeed.com, were obtained. For each data set, a total of nine different data representations were obtained with 1-gram, 2-gram and 3-gram representations for term frequency (TF), term presence (TP) and TF-IDF criteria from the feature representation methods. In the experimental studies, the correct classification performances were examined by combining five basic classification algorithms with ensemble learning methods.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | November 30, 2021 |
Published in Issue | Year 2021 Issue: 28 |