Feature selection is one of the preliminary processes applied to data preparation in data analysis. Feature selection is simply the process of selecting the most suitable subset of features from the original feature set. These methods try to identify and remove irrelevant and unnecessary information from the original data set. In this study, a new feature selection method based on the coefficient of variation using class information is proposed. The efficiency of the proposed feature selection method has been evaluated by comparing it with other well-known feature selection methods using real data sets. The performance of feature selection methods was examined in terms of classification accuracy and entropy criteria in quadratic discriminant analysis. Three real data sets consisting of quantitative data with the number of units less than the number of features were used in the study. Quadratic discriminant analysis was carried out using the first d features of the features whose importance order was determined according to each feature selection method. Classification accuracy and entropy values in quadratic discriminant analysis of feature selection methods were calculated according to the number of features. The results of the study revealed that the proposed feature selection method is a strong alternative to other well-known feature selection methods for classification analysis in terms of computational simplicity and efficiency.
Özellik seçimi, veri analizinde veri hazırlamak için uygulanan ön işlemlerden biridir. Özellik seçimi basitçe orijinal özellik kümesinden en uygun özelliklerin alt kümesinin seçim işlemidir. Bu yöntemler, orijinal veri setinde alakasız ve gereksiz bilgiyi belirlemeye ve kaldırmaya çalışır. Bu çalışmada sınıf bilgisi kullanılarak değişim katsayısına dayalı yeni bir özellik seçim yöntemi önerilmiştir. Önerilen özellik seçim yönteminin etkinliği, gerçek veri setleri kullanılarak diğer iyi bilinen özellik seçim yöntemleri ile karşılaştırılarak değerlendirilmiştir. Özellik seçim yöntemlerinin performansı, karesel diskriminant analizinde sınıflama doğruluğu ve entropi kriterleri bakımından incelenmiştir. Çalışmada birim sayısının özellik sayısından fazla olduğu nicel verilerden oluşan üç gerçek veri seti kullanılmıştır. Her bir özellik seçim yöntemine göre önem sırası belirlenen özelliklerinden ilk d adet özellik kullanılarak karesel diskriminant analizi gerçekleştirilmiştir. Özellik sayısına göre özellik seçim yöntemlerinin karesel diskriminant analizindeki sınıflama doğruluğu ve entropi değerleri hesaplanmıştır. Çalışma sonuçları, önerilen özellik seçim yönteminin hesaplama basitliği ve etkinlik açısından sınıflama analizleri için iyi bilinen diğer özellik seçim yöntemleri karşısında güçlü bir alternatif olduğunu ortaya koymuştur.
Primary Language | Turkish |
---|---|
Subjects | Statistics |
Journal Section | Articles |
Authors | |
Publication Date | June 30, 2021 |
Published in Issue | Year 2021 |