Kayıp Veriler Yerine Yaklaşık Değer Atamak için Kullanılan Gelişmiş Yöntemlerin Farklı Koşullar Altında Karşılaştırılması

Sait Çüm; Elif Kübra Demir; Selahattin Gelbal; Tarık Kışla

doi:10.21764/maeuefd.332605

Research Article

Kayıp Veriler Yerine Yaklaşık Değer Atamak için Kullanılan Gelişmiş Yöntemlerin Farklı Koşullar Altında Karşılaştırılması

Year 2018, Issue: 45, 230 - 249, 15.02.2018

Sait Çüm , Elif Kübra Demir , Selahattin Gelbal , Tarık Kışla

https://doi.org/10.21764/maeuefd.332605

Cited By: 5

Abstract

Bu araştırmada, farklı oranlarda
(%15 ve %25) ve yapılarda (TROK ve ROK) oluşturulan kayıp veriler yerine farklı
yöntemlerle yaklaşık değer atanması sonucu elde edilen veri setlerinin tam veri
setleriyle karşılaştırılarak incelenmesi amaçlanmıştır. Araştırma verilerinin
toplandığı grup, PISA’ya (2012) Türkiye’den katılan 15 yaş grubundaki 4848
öğrenci arasından matematik özyeterliği anketine katılan ve eksiksiz bir
şekilde yanıtlayan 3129 öğrencinin puanlarından oluşan veri seti üzerinde
yürütülmüştür. Söz konusu veri seti içerisinden farklı yapılar oluşturulacak
şekilde farklı oranlarda veri silinerek eksik veri setleri oluşturulmuştur. Bu eksik
veri setleri BM, BVA, ESE, MUA, MZMC ve RA olmak üzere altı farklı gelişmiş
değer atama yöntemiyle tamamlanmıştır. Söz
konusu yöntemlerle yapılan yaklaşık değer atamaları sonucu elde edilen ölçek
puanları ile tam veri ölçek puanları arasındaki korelasyon değerlerinin yüksek
olduğu görülmüştür. Benzer şekilde farklı yöntemlerle tamamlanmış veri
setlerinden elde edilen ölçek puanları arasındaki korelasyon değerleri de
yüksek bulunmuştur. Tam veri seti ile tamamlanmış veri
setlerinden hesaplanan ölçek puanları arası farkların mutlak değer toplamları
ve ortalamaları göz önünde bulundurulduğunda belirlenen
koşullar altında en iyi çalışan yaklaşık değer atama yöntemlerinin MZMC ve BM
olduğu sonucuna ulaşılmıştır.

Keywords

Kayıp Veri, Yaklaşık Değer, Yaklaşık Değer Atama Yöntemleri

References

Akbaş, U. ve Tavşancıl, E. (2015). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(1), 38-57.
Allison, P.D. (2001) Missing Data. CA: Sage University Paper.
Allison. P. D. (2003). Missing data techniques for structural equation modeling. Journal of Abnormal Psychology. 4(1), 545-557.
Alpar. R. (2011). Çok değişkenli istatistiksel yöntemler. Ankara: Detay Yayıncılık.
Cool. A. L. (2000). A review of methods for dealing with missing data (rapor). Annual Meeting of the Southwest Educational Resarch Association. Dallas.
Çüm, S. ve Gelbal, S. (2015). Kayıp veriler yerine yaklaşık değer atamada kullanılan farklı yöntemlerin model veri uyumu üzerine etkisi. Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi, 35, 87-111.
Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3(2), 47-68.
Enders, C. K. (2004). The impact of missing data on sample reliability estimates: implications for reliability reporting practices. Educational and Psychological Measurement, 64(3), 419-436.
Little. R. ve Rubin. D. (1987). Statistical analysis with missing data. New York: Wiley.
Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin farklı kayıp veri koşulları altında ölçeklerin psikometrik nitelikleri ve ölçme sonuçları bağlamında karşılaştırılması. International Online Journal of Education Sciences, 7(4), 252-265.
Osborne. J. W. (2013). Best practices in data cleaning. California: Sage Publication. Inc.
Pigott. T. D. (2001). A review of methods for missing data. Educational Resarch and Evaluation. 7(1), 353-383.
Roth. P. L. (1994). Missing data: A conceptual review for applied psychologists. Personnel Psychology. 3(1), 537-560.
Schafer. J. L. (1999). Multiple imputation: a primer. Statistical Methods on Medical Resarch. 8(1), 3-15.
Şahin Kürşad, M., ve Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin ölçeklerin geçerlik ve güvenirliği bağlamında karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(2), 254-267.
Tabachnick. B. ve Fidell. L. (1996). Using multivariate statistics (3th ed.). New York: Herper Collins College Publishers.

A Comparison of Advanced Methods used for Missing Data Imputation under Different Conditions

Year 2018, Issue: 45, 230 - 249, 15.02.2018

Sait Çüm , Elif Kübra Demir , Selahattin Gelbal , Tarık Kışla

https://doi.org/10.21764/maeuefd.332605

Cited By: 5

Abstract

In this study, it is aimed to
comparatively research of data sets obtained
imputation for missing values that is formed by different ratios(%15 and
%25) and in different structures (MCAR and MAR) with different methods. This
study has been conducted on data set formed by points of 3129 students who
participated in mathematics self-efficacy survey and answered it completely
among 4848 students- age group of 15-who participated in PISA 2012 from
Turkey. Missing data sets have been
constituted by deleting data in different ratios to be constitute different
structures in the data set. These data sets have been completed by six
different nearby value imputation including EM, BIM, PSM, MCMC, MDIM, and RIM.
Obtained data sets have been compared with full data sets by scale
points of students. In
the scope of the research, correlation between obtained scale points and scale
points of real data has been seen quite high.
Similarly, when scale points is considered, correlation of missing data
imputation methods with each other have also been found quite high. Considering
the difference between the totals and avarages of student scores calculated
from the full data set and imputed data sets EM and MCMC is founded that the
best missing data imputation methods under all conditions.

Keywords

Missing Data, Missing Values

References

Akbaş, U. ve Tavşancıl, E. (2015). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(1), 38-57.
Allison, P.D. (2001) Missing Data. CA: Sage University Paper.
Allison. P. D. (2003). Missing data techniques for structural equation modeling. Journal of Abnormal Psychology. 4(1), 545-557.
Alpar. R. (2011). Çok değişkenli istatistiksel yöntemler. Ankara: Detay Yayıncılık.
Cool. A. L. (2000). A review of methods for dealing with missing data (rapor). Annual Meeting of the Southwest Educational Resarch Association. Dallas.
Çüm, S. ve Gelbal, S. (2015). Kayıp veriler yerine yaklaşık değer atamada kullanılan farklı yöntemlerin model veri uyumu üzerine etkisi. Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi, 35, 87-111.
Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3(2), 47-68.
Enders, C. K. (2004). The impact of missing data on sample reliability estimates: implications for reliability reporting practices. Educational and Psychological Measurement, 64(3), 419-436.
Little. R. ve Rubin. D. (1987). Statistical analysis with missing data. New York: Wiley.
Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin farklı kayıp veri koşulları altında ölçeklerin psikometrik nitelikleri ve ölçme sonuçları bağlamında karşılaştırılması. International Online Journal of Education Sciences, 7(4), 252-265.
Osborne. J. W. (2013). Best practices in data cleaning. California: Sage Publication. Inc.
Pigott. T. D. (2001). A review of methods for missing data. Educational Resarch and Evaluation. 7(1), 353-383.
Roth. P. L. (1994). Missing data: A conceptual review for applied psychologists. Personnel Psychology. 3(1), 537-560.
Schafer. J. L. (1999). Multiple imputation: a primer. Statistical Methods on Medical Resarch. 8(1), 3-15.
Şahin Kürşad, M., ve Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin ölçeklerin geçerlik ve güvenirliği bağlamında karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(2), 254-267.
Tabachnick. B. ve Fidell. L. (1996). Using multivariate statistics (3th ed.). New York: Herper Collins College Publishers.

There are 16 citations in total.

Details

Primary Language	Turkish
Journal Section	Makaleler
Authors	Sait Çüm Elif Kübra Demir Selahattin Gelbal Tarık Kışla
Publication Date	February 15, 2018
Submission Date	August 3, 2017
Published in Issue	Year 2018 Issue: 45

Cite

APA	Çüm, S., Demir, E. K., Gelbal, S., Kışla, T. (2018). Kayıp Veriler Yerine Yaklaşık Değer Atamak için Kullanılan Gelişmiş Yöntemlerin Farklı Koşullar Altında Karşılaştırılması. Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi(45), 230-249. https://doi.org/10.21764/maeuefd.332605