Özet: Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n³p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.
Anahtar Kelimeler: Kümeleme Analizi, Sayısal Sınıflandırma, Temel Bileşenler Analizi, Ayırım Analizi, Korelasyon Analizi
A Comparison of Different Clustering Methods on the Biological Data with n<p Dimensions
Abstract : This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (n³p) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics.
Keywords: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis
Özet: Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n³p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.
Anahtar Kelimeler: Kümeleme Analizi, Sayısal Sınıflandırma, Temel Bileşenler Analizi, Ayırım Analizi, Korelasyon Analizi.
A Compaision of Different Clustering Methods on the Biological Data with n<p Dimensions
Abstract : This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (n³p) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics.
Keywords: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis.
Birincil Dil | İngilizce |
---|---|
Bölüm | BİYOMETRİ (Biometrics) |
Yazarlar | |
Yayımlanma Tarihi | 1 Şubat 2013 |
Yayımlandığı Sayı | Yıl 2012 Cilt: 15 Sayı: 4 |