BibTex RIS Kaynak Göster

n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi

Yıl 2012, Cilt: 15 Sayı: 4, 26 - 36, 01.02.2013

Öz

Özet: Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n³p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.

Anahtar Kelimeler:  Kümeleme Analizi, Sayısal Sınıflandırma, Temel Bileşenler Analizi, Ayırım Analizi, Korelasyon Analizi

 

A Comparison of Different Clustering Methods on the Biological Data with n<p Dimensions

 

Abstract : This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (n³p) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics.

Keywords: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis

n<p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi

Yıl 2012, Cilt: 15 Sayı: 4, 26 - 36, 01.02.2013

Öz

 

Özet: Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alınan 38 adet değişken üzerinde yapıldı. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n³p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Temel Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelendi. Sonuçta, kümelemede en uygun yöntemin Temel Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu saptandı. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.

Anahtar Kelimeler:  Kümeleme Analizi, Sayısal Sınıflandırma, Temel Bileşenler Analizi, Ayırım Analizi, Korelasyon Analizi.

 

A Compaision of Different Clustering Methods on the Biological Data with n<p Dimensions

 

Abstract : This research was carried out on 38 variables from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (n³p) must be decreased. Principal Component, Discriminant and analysis of correlation were used to decrease the number of variables. The reduced number of variables by using these mentioned methods, was comparatively evaluated by using different clustering methods. Present results shown that the most suitable method for clustering is the Ward method used together with Principle Components variable reducing technique. It was also found out that the most suitable measurement index to determine the number of clusters were Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics.

Keywords: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis.

 

Toplam 0 adet kaynakça vardır.

Ayrıntılar

Birincil Dil İngilizce
Bölüm BİYOMETRİ (Biometrics)
Yazarlar

İrfan Öztürk

Necati Yıldız Bu kişi benim

Yayımlanma Tarihi 1 Şubat 2013
Yayımlandığı Sayı Yıl 2012 Cilt: 15 Sayı: 4

Kaynak Göster

APA Öztürk, İ., & Yıldız, N. (2013). n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi, 15(4), 26-36. https://doi.org/10.18016/ksujns.60622
AMA Öztürk İ, Yıldız N. n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi. Şubat 2013;15(4):26-36. doi:10.18016/ksujns.60622
Chicago Öztürk, İrfan, ve Necati Yıldız. “N < P Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”. KSÜ Doğa Bilimleri Dergisi 15, sy. 4 (Şubat 2013): 26-36. https://doi.org/10.18016/ksujns.60622.
EndNote Öztürk İ, Yıldız N (01 Şubat 2013) n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi 15 4 26–36.
IEEE İ. Öztürk ve N. Yıldız, “n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”, KSÜ Doğa Bilimleri Dergisi, c. 15, sy. 4, ss. 26–36, 2013, doi: 10.18016/ksujns.60622.
ISNAD Öztürk, İrfan - Yıldız, Necati. “N < P Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”. KSÜ Doğa Bilimleri Dergisi 15/4 (Şubat 2013), 26-36. https://doi.org/10.18016/ksujns.60622.
JAMA Öztürk İ, Yıldız N. n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi. 2013;15:26–36.
MLA Öztürk, İrfan ve Necati Yıldız. “N < P Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi”. KSÜ Doğa Bilimleri Dergisi, c. 15, sy. 4, 2013, ss. 26-36, doi:10.18016/ksujns.60622.
Vancouver Öztürk İ, Yıldız N. n < p Boyutlu Biyolojik Verilerde Farklı Kümeleme Yöntemlerinin Karşılaştırmalı Olarak İncelenmesi. KSÜ Doğa Bilimleri Dergisi. 2013;15(4):26-3.