Examination the Effect of Missing Data Techniques of Item Parameters

Ayfer Sayın; Alperen Yandı; Esra Oyar

doi:10.21031/epod.355506

Research Article

Kayıp Veri ile Baş Etme Yöntemlerinin Madde Parametrelerine Etkisinin İncelenmesi

Year 2017, Volume: 8 Issue: 4, 490 - 510, 29.12.2017

Ayfer Sayın , Alperen Yandı , Esra Oyar

https://doi.org/10.21031/epod.355506

Cited By: 3

Abstract

Bu araştırmada
madde bazında kayıp veri oranlarının bulunduğu farklı örneklem büyüklüğündeki
verilere ait madde ve test parametrelerinin kayıp veri ile baş etme
yöntemlerinden nasıl etkilendiğini belirlemek amaçlanmıştır. PISA 2015
uygulamasına katılan ve çalışma içerisinde yer alan “hırs algısı” ölçeğine
cevap veren 5073 öğrenci içerisinden rastgele seçilen 500, 100 ve 2500 öğrenci,
araştırmanın çalışma grubunu oluşturmaktadır. Öncelikle her bir veri setinde
normallik, tek boyutluluk, yerel bağımsızlık ve model-veri uyumu varsayımları
incelenmiştir. Ölçekte 5 madde yer almaktadır ve kayıp veriler madde bazında
oluşturulmuştur. Bu doğrultuda tamamen rastsal olacak şekilde her bir maddeden
sırasıyla %5, %10, %15 ve %20’lik kayıp veriler oluşturulmuş, ölçek
maddelerinden birinde ise hiç kayıp veri olmayacak şekilde analizler
gerçekleştirilmiştir. Kayıp verilerin tamamen rastsal dağılım gösterdiği
belirlendikten sonra öncelikle tam ve eksik verilerle; daha sonra silme,
ortalama atama, yakın noktalar ortalama ataması, yakın noktalar medyan ataması,
doğrusal değerleme, noktada doğrusal eğilim, regresyon atama ve beklenti
maksimizasyonu yöntemleri sonucunda elde edilen tam veri setleri ile
hesaplamalar gerçekleştirilmiştir. Hesaplama sürecinde betimsel istatistikler
ve Cronbach-alfa güvenirlik katsayısı; ardından Madde Tepki Kuramına dayalı
Aşamalı Tepki Modeline göre ayırıcılık ve güçlük indeksleri ile marjinal
güvenirlik katsayısı hesaplanmıştır. Araştırma sonucunda madde ve test
parametrelerinin eksik veriden ve kayıp veri ile baş etme yöntemlerinden
etkilendiği; tam veri setine en yakın kestirimi sunan sonuçların doğrusal
değerleme yöntemi ile elde edildiği belirlenmiştir.

Keywords

kayıp veri, tamamen rastsal kayıp veri, madde tepki kuramı

References

Acar, T., ve Kelecioğlu, H. (2010). Maddenin farklı fonksiyonlaşmasını belirleme tekniklerinin karşılaştırılması: GADM, LR ve MTK-OO. Kuram ve Uygulamada Eğitim Bilimleri, 10(2), 639-649.
Akbaş, U. (2014). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Doktora Tezi, Ankara Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara.
Akbaş, U. ve Tavşancıl, E. (2015). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(1), 38-57.
Allison, P.D. (2002). Missing data. California: Sage Publication, Inc.
Bal, C. (2003). Çok gruplu veri setlerinde eksik gözlem sorununun çözümlenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, İstanbul Üniversitesi, Sağlık Bilimleri Enstitüsü, İstanbul.
Baygül, A. (2007). Kayıp veri analizinde sıklıkla kullanılan etkin yöntemlerin değerlendirilmesi. Yayımlanmamış Doktora Tezi, Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
Bernaards, C. A. ve Sijtsma, K. (2000). Influence of imputation and EM methods on factor analysis when item nonresponse in questionnaire data is nonignorable. Multivariate Behavioral Research, 35(3), 321 – 364.
Carpita, M., & Manisera, M. (2011). On the imputation of missing data in surveys with Likert-type scales. Journal of Classification, 28(1), 93-112.
Çokluk, Ö., Şekercioğlu, G., ve Büyüköztürk, Ş. (2014). Sosyal bilimler için çok değişkenli istatistik: SPSS ve LISREL uygulamaları. PegemA Akademi: Ankara.
Çokluk, Ö. ve Kayrı, M. (2011). Kayıp değerlere yaklaşık değer atama yöntemlerinin ölçme araçlarının geçerlik ve güvenirliği üzerindeki etkisi. Kuram ve Uygulamada Eğitim Bilimleri, 11(1), 289-309.
Çüm, S. ve Gelbal, S. (2015). Kayıp veriler yerine yaklaşık değer atamada kullanılan farklı yöntemlerin model veri uyumu üzerindeki etkisi. Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi, 35, 87-111.
Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3(2), 48-68.
Demir, E., ve Parlak, B. (2012). Türkiye’de eğitim araştırmalarında kayıp veri sorunu. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 3(1).
Field, A. (2005). Discovering statistics with SPSS. California: Sage Publication, Inc.
Garrett, P. L., (2009). A Monte Carlo study investing ating missing data, differential item functioning and effect size. (Unpublished doctoral dissertation). Georgia State University.Atlanta.
Goegebeur, Y., De Boeck, P. ve Molenberghs, G. (2010). Person fit for test speededness: normal curvatures, likelihood ratio tests and empirical bayes estimates. Methodology: European Journal of Research Methods for the Behavioral and Social Sciences, 6(1), 3 – 16.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory (Vol. 2). California: Sage Publication, Inc.
Josse, J. ve Husson, F. (2012). Handling missing values in exploratory multivariate data analysis methods. Journal de la Société Française de Statistique, 153(2), 79-99.
Koçak, D. ve Çokluk Bökeoğlu, Ö. (2017). Kayıp veriyle baş etme yöntemlerinin model veri uyumu ve madde model uyumuna etkisi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 8(2), 200-223.
Köse, A. ve Öztemur, B. (2014). Kayıp veri ele alma yöntemlerinin t-testi ve ANOVA parametreleri üzerine etkisinin incelenmesi. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 14(1), 400-412.
McNeish, D. (2016). Exploratory factor analysis with small samples and missing data. Journal of Personality Assessment, 99(6), 637-652.
Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin farklı kayıp veri koşulları altında ölçeklerin psikometrik nitelikleri ve ölçme sonuçları bağlamında karşılaştırılması. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 7(4), 252-265.
Sezgin E. ve Çelik Y.(2013). Veri madenciliğinde kayıp veriler için kullanılan yöntemlerin karşılaştırılması, Akademik Bilişim Konferansı, Akdeniz Üniversitesi, 23-25 Ocak 2013.
Soysal, S. ve Akın Arıkan, Ç. (2017). Kayıp veri atama yöntemlerinin faktörleşme teknikleri üzerindeki etkisi. Küreselleşen Dünyada Eğitim, 22. Bölüm. PegemA Yayıncılık: Ankara.
Şahin Kürşad, M. ve Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin ölçeklerin geçerlik ve güvenirliği bağlamında karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(2), 254-267.
Tabachnick, B. G. & Fidell, L. S. (2014). Using multivariate statistics. USA: Pearson Education Limited.
Weaver, B. ve Maxwell, H. (2014). Exploratory factor analysis and reliability analysis with missing data: A simple method for SPSS users. The Quantitative Methods for Psychology, 10(2), 143-152.
Witta, E. L. (2000). Comparison of missing data treatments in producing factor scores (rapor). Annual Meeting of the American Educational Resarch Association. Honolulu.
Yılmaz, H. (2014). Random forests yönteminde kayıp veri probleminin incelenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, Eskişehir Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.

Examination the Effect of Missing Data Techniques of Item Parameters

Year 2017, Volume: 8 Issue: 4, 490 - 510, 29.12.2017

Ayfer Sayın , Alperen Yandı , Esra Oyar

https://doi.org/10.21031/epod.355506

Cited By: 3

Abstract

In this study,
the aim is to determine how the item and test parameters affect the missing
data techniques for different sample sizes and different items with different
missing data rates. 500, 100 and 2500 students randomly selected from the 5073
students who participated in the PISA 2015 study and responded to the
"ambition perception" scale included in the study constitute the
study group of the research. First of all, the assumptions of normality,
unidimensionality, local independence and model-data fit were examined for each
data set. Afterwards, 5%, 10%, 15%, and 20% missing data were formed for four
out of five items and there was no missing data in one item, then analyses were
carried out. Once it is determined that the missing data are missing completely
random, first with complete and incomplete data, then with serial mean, median
of nearby points, mean of nearby points, linear interpolation, linear trend at
point, regression, expectation maximization algorithm data item and test
parameters were estimated. In the estimated process, descriptive statistics and
cronbach alpha reliability coefficient and marginal reliability coefficient;
the threshold parameters and the difficulty indices were estimated according to
the graded response theory, which is one of the IRT models. The results of the
study showed that the item and test parameters were influenced by incomplete
and missing data techniques; it was determined that the best estimation results
were obtained by linear interpolation method with different data.

Keywords

Missing data, missing data techniques, item response theory, graded response theory

References

Acar, T., ve Kelecioğlu, H. (2010). Maddenin farklı fonksiyonlaşmasını belirleme tekniklerinin karşılaştırılması: GADM, LR ve MTK-OO. Kuram ve Uygulamada Eğitim Bilimleri, 10(2), 639-649.
Akbaş, U. (2014). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Doktora Tezi, Ankara Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara.
Akbaş, U. ve Tavşancıl, E. (2015). Farklı örneklem büyüklüklerinde ve kayıp veri örüntülerinde ölçeklerin psikometrik özelliklerinin kayıp veri baş etme teknikleri ile incelenmesi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(1), 38-57.
Allison, P.D. (2002). Missing data. California: Sage Publication, Inc.
Bal, C. (2003). Çok gruplu veri setlerinde eksik gözlem sorununun çözümlenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, İstanbul Üniversitesi, Sağlık Bilimleri Enstitüsü, İstanbul.
Baygül, A. (2007). Kayıp veri analizinde sıklıkla kullanılan etkin yöntemlerin değerlendirilmesi. Yayımlanmamış Doktora Tezi, Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
Bernaards, C. A. ve Sijtsma, K. (2000). Influence of imputation and EM methods on factor analysis when item nonresponse in questionnaire data is nonignorable. Multivariate Behavioral Research, 35(3), 321 – 364.
Carpita, M., & Manisera, M. (2011). On the imputation of missing data in surveys with Likert-type scales. Journal of Classification, 28(1), 93-112.
Çokluk, Ö., Şekercioğlu, G., ve Büyüköztürk, Ş. (2014). Sosyal bilimler için çok değişkenli istatistik: SPSS ve LISREL uygulamaları. PegemA Akademi: Ankara.
Çokluk, Ö. ve Kayrı, M. (2011). Kayıp değerlere yaklaşık değer atama yöntemlerinin ölçme araçlarının geçerlik ve güvenirliği üzerindeki etkisi. Kuram ve Uygulamada Eğitim Bilimleri, 11(1), 289-309.
Çüm, S. ve Gelbal, S. (2015). Kayıp veriler yerine yaklaşık değer atamada kullanılan farklı yöntemlerin model veri uyumu üzerindeki etkisi. Mehmet Akif Ersoy Üniversitesi Eğitim Fakültesi Dergisi, 35, 87-111.
Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3(2), 48-68.
Demir, E., ve Parlak, B. (2012). Türkiye’de eğitim araştırmalarında kayıp veri sorunu. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 3(1).
Field, A. (2005). Discovering statistics with SPSS. California: Sage Publication, Inc.
Garrett, P. L., (2009). A Monte Carlo study investing ating missing data, differential item functioning and effect size. (Unpublished doctoral dissertation). Georgia State University.Atlanta.
Goegebeur, Y., De Boeck, P. ve Molenberghs, G. (2010). Person fit for test speededness: normal curvatures, likelihood ratio tests and empirical bayes estimates. Methodology: European Journal of Research Methods for the Behavioral and Social Sciences, 6(1), 3 – 16.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory (Vol. 2). California: Sage Publication, Inc.
Josse, J. ve Husson, F. (2012). Handling missing values in exploratory multivariate data analysis methods. Journal de la Société Française de Statistique, 153(2), 79-99.
Koçak, D. ve Çokluk Bökeoğlu, Ö. (2017). Kayıp veriyle baş etme yöntemlerinin model veri uyumu ve madde model uyumuna etkisi. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 8(2), 200-223.
Köse, A. ve Öztemur, B. (2014). Kayıp veri ele alma yöntemlerinin t-testi ve ANOVA parametreleri üzerine etkisinin incelenmesi. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 14(1), 400-412.
McNeish, D. (2016). Exploratory factor analysis with small samples and missing data. Journal of Personality Assessment, 99(6), 637-652.
Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin farklı kayıp veri koşulları altında ölçeklerin psikometrik nitelikleri ve ölçme sonuçları bağlamında karşılaştırılması. Abant İzzet Baysal Üniversitesi Eğitim Fakültesi Dergisi, 7(4), 252-265.
Sezgin E. ve Çelik Y.(2013). Veri madenciliğinde kayıp veriler için kullanılan yöntemlerin karşılaştırılması, Akademik Bilişim Konferansı, Akdeniz Üniversitesi, 23-25 Ocak 2013.
Soysal, S. ve Akın Arıkan, Ç. (2017). Kayıp veri atama yöntemlerinin faktörleşme teknikleri üzerindeki etkisi. Küreselleşen Dünyada Eğitim, 22. Bölüm. PegemA Yayıncılık: Ankara.
Şahin Kürşad, M. ve Nartgün, Z. (2015). Kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin ölçeklerin geçerlik ve güvenirliği bağlamında karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(2), 254-267.
Tabachnick, B. G. & Fidell, L. S. (2014). Using multivariate statistics. USA: Pearson Education Limited.
Weaver, B. ve Maxwell, H. (2014). Exploratory factor analysis and reliability analysis with missing data: A simple method for SPSS users. The Quantitative Methods for Psychology, 10(2), 143-152.
Witta, E. L. (2000). Comparison of missing data treatments in producing factor scores (rapor). Annual Meeting of the American Educational Resarch Association. Honolulu.
Yılmaz, H. (2014). Random forests yönteminde kayıp veri probleminin incelenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, Eskişehir Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.

There are 29 citations in total.

Details

Journal Section	Articles
Authors	Ayfer Sayın Alperen Yandı Esra Oyar This is me
Publication Date	December 29, 2017
Acceptance Date	December 15, 2017
Published in Issue	Year 2017 Volume: 8 Issue: 4

Cite

APA	Sayın, A., Yandı, A., & Oyar, E. (2017). Examination the Effect of Missing Data Techniques of Item Parameters. Journal of Measurement and Evaluation in Education and Psychology, 8(4), 490-510. https://doi.org/10.21031/epod.355506

Cited By

Mesleki Değerlerle İlişkilendirilen Etkinliklerin Öğretmen Adaylarının Farkındalık ve Tutumlarına Etkisi

Pamukkale University Journal of Education

https://doi.org/10.9779/pauefd.1230429

Benzetimli Tavlama Algoritması İle Eksik Veri Tamamlama

Fırat Üniversitesi Mühendislik Bilimleri Dergisi

https://doi.org/10.35234/fumbd.818935

BORSA İSTANBUL İŞLETMELERİNİN VERİ MADENCİLİĞİ İLE KÜMELENMESİ - CLUSTERING THE COMPANIES LISTED ON STOCK EXCHANGE ISTANBUL BY DATA MINING

Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi

https://doi.org/10.20875/makusobed.469617

Download Cover Image

Article Files

Full Text