Determining the number of components in finite mixture models is an important problem, and normal mixture models are frequently used in finite mixture distributions. In this study, In this study, a new clustering method is proposed for modeling multivariate data set with TOPSIS method. In the proposed method, each variable of multivariate data is modeled with univariate normal mixture distributions and a decision matrix is created by using the information criterion values obtained according to the number of components. The number of components in the variables was determined with TOPSIS method using the decision matrix. Homogeneous variables without components are eliminated and the size is reduced, and alternative component numbers are calculated for mixture models that can be formed according to the number of components in heterogeneous variables. Among the alternative number of components, the most suitable component number and suitable mixture model were determined by TOPSIS method. Thus, in multivariate data, number of clusters were estimated with dimension reduction and variable selection. The success of the proposed approach has been tested on the real dataset and the number of clusters of the data set has been determined correctly. In addition, this approach increased the classification success of the observations.
Information Criteria Model-Based Clustering According to Variable Components Gaussian Mixture Models TOPSIS
Sonlu karma modellerde bileşen (küme) sayısının belirlenmesi önemli bir problem olup normal karma modeller, sonlu karma dağılımlarda sıklıkla kullanılmaktadır. Bu çalışmada, çok kriterli karar verme yöntemlerinden biri olan TOPSIS yöntemi ile çok değişkenli veri setinin modellenmesinde yeni bir kümeleme yöntemi önerilmiştir. Önerilen yöntemde, çok değişkenli verinin her bir değişkeni tek değişkenli normal karma dağılımlarla modellenip, bileşen sayısına göre elde edilen bilgi kriteri değerleri kullanılarak bir karar matrisi oluşturulmuştur. Karar matrisi kullanılarak TOPSIS yöntemi ile değişkenlerdeki bileşen sayısı belirlenmiştir. Bileşen bulunmayan homojen değişkenler elenerek boyut indirgenmiş olup heterojen değişkenlerdeki bileşen sayılarına göre oluşabilecek karma modeller için alternatif bileşen sayıları hesaplanmıştır. Alternatif bileşen sayıları içerisinden en uygun bileşen sayısı ve uygun karma model yine TOPSIS yöntemi ile belirlenmiştir. Böylece çok değişkenli veride boyut indirgeme ve değişken seçimi ile küme sayısı tahmini yapılmıştır. Önerilen yaklaşımın başarısı gerçek veri seti üzerinde test edilmiş olup veri setinin küme sayısı doğru olarak belirlenmiştir. Ayrıca bu yaklaşım, gözlemlerin sınıflandırma başarısını da arttırmıştır.
Bilgi Kriterleri Değişken Bileşenlere Göre Modele Dayalı Kümeleme Normal Karma Modeller TOPSIS
Primary Language | Turkish |
---|---|
Journal Section | Research Articles |
Authors | |
Publication Date | December 29, 2020 |
Submission Date | November 19, 2020 |
Acceptance Date | December 9, 2020 |
Published in Issue | Year 2020 Volume: 8 Issue: 5 |