Araştırma Makalesi
BibTex RIS Kaynak Göster

Değişkenlerin Kategori Sayılarının ve Dağılımlarının Korelasyon Katsayılarına Etkisi

Yıl 2022, , 50 - 80, 31.03.2022


Korelasyon katsayıları birçok bilim alanında kullanılmaktadır. Bilim alanlarına göre kullanılan değişkenlerin tipleri de farklılaşabilmektedir. Bu araştırmada farklı örneklem büyüklüklerinde değişkenlerin kategori sayısı ve çarpıklığının korelasyon katsayılarına etkisinin incelenmesi amaçlanmıştır. Bu amaç doğrultusunda gerçekleştirilen Monte Carlo simülasyon çalışmasıyla polikorik / tetrakorik, Pearson momentler çarpımı (PMÇ), Spearman’ın sıra farkları (rho), Kendall’ın Tau, Goodman-Kruskal Gamma ve Lambda katsayıları karşılaştırılmıştır. Araştırma sonucunda polikorik / tetrakorik korelasyon katsayısının diğer yöntemlere göre daha yansız sonuçlar verdiği gözlenmiştir. Kategori sayısının artmasıyla normal dağılan veri setlerinde PMÇ de yansız kestirimler yapabilmiştir. Ancak çarpık dağılan veri setlerinde PMÇ’nin parametrik olmayan alternatifi olan Spearman’ın sıra farkları korelasyon katsayısı, yeterli performansı gösterememiştir. Polikorik korelasyon katsayısı, hem normal hem de çarpık dağılan veri setlerinde diğer yöntemlere nazaran daha yansız ve doğru sonuçlar vermiştir. Araştırma bulgularına göre kategorik verilerle gerçekleştirilen korelasyon analizinde polikorik / tetrakorik korelasyon katsayısının kullanılması önerilmektedir. Kategori sayısı arttıkça değişkenin sürekli kabul edilebileceği belirtilse de korelasyon analizi sonuçlarında PMÇ ve parametrik olmayan karşılığı olan Spearman’ın sıra farkları ile Kendall’ın Tau katsayısı yanlı sonuçlar vermiştir.


The Effect of Categories and Distribution of Variables on Correlation Coefficients

Yıl 2022, , 50 - 80, 31.03.2022


Correlation coefficients are used in many scientific fields. The types of variables used can also vary according to the scientific fields. In the current study, it was aimed to examine the effect of the number of categories and skewness of variables in different sample sizes on the correlation coefficients. Monte Carlo simulation study was conducted and polychoric / tetrachoric, Pearson product moments (PPM), Spearman's rank differences (rho), Kendall's Tau, Goodman-Kruskal Gamma and Lambda coefficients were compared. As a result of the study, it was observed that the polychoric / tetrachoric correlation coefficient had more unbiased results than others. With the increase in the number of categories, unbiased estimates were made by PPM in normally distributed data sets. However, Spearman’s rho could not show sufficient performance in the skewed data sets. The polychoric correlation coefficient gave more unbiased and accurate results in both normal and skewed data compared to other methods. According to the research findings, it is recommended to use the polychoric / tetrachoric correlation coefficient in the correlation analysis performed with categorical data. Although it is stated that the variable can be analyzed as continuous when the number of categories increases, PPM and its non-parametric alternatives Spearman’s rho, Kendall’s Tau coefficient gave biased results.


Birincil Dil Türkçe
Abdullah Faruk Kılıç

Yayımlanma Tarihi 31 Mart 2022
