The statistical process of converting the scores of two forms of a test measuring the same latent trait with similar difficulties is defined as test equating. This study is a stochastic simulation study aiming to compare the errors obtained from test equating methods based on Classical Test Theory and Item Response Theory in the process of equating test forms consisting of polytomously scored items. In the study, 25 sub-conditions were determined for 2 varying conditions with sample sizes of 50, 100, 300, 1000, and 3000 people and test lengths of 10, 20, 30, 40 and 50 items. In accordance with these sub-conditions, simulative data compatible with the Generalized Partial Credit Model, which is scored as 0 (incorrect), 1 (partially correct), and 2 (fully correct), were used. WinGen3 program was used to generate the data sets in the study. The equating process of the generated data sets was carried out with the R program. In this study, three Classical Test Theory (CTT) methods, namely linear, mean, and equipercentile equating methods, and two Item Response Theory (IRT) methods, namely mean-mean and mean-sigma, were used. Using the test forms produced, the standard errors of equating obtained from the three CTT methods and the two IRT methods were calculated, and the error amounts obtained from the methods were compared. As a result of the study, it was found that the method that equalized with the least error in the process of equating the test forms produced according to different sample sizes and different test lengths was the equipercentile equating method and the method that equalized with the most error was the mean-mean method. The results of the study were found to be consistent with the literature. When the test equating methods were analyzed in terms of sample length, it was determined that the test equating error decreased as the sample size increased. When the methods were evaluated in terms of test length, it was concluded that the amount of error calculated increased as the number of items increased.
Test equating Item Response Theory Classical Test Theory Equating error Polytomously scored tests
Aynı örtük özelliği ölçen testin benzer zorluklara sahip iki formunun puanlarının birbirine dönüştürülmesini içeren istatistiksel süreç test eşitleme olarak tanımlanır. Bu çalışma* çok kategorili puanlanan maddelerden oluşan test formlarının eşitlenmesi sürecinde Klasik Test Kuramı ve Madde Tepki Kuramı’na dayalı test eşitleme yöntemlerinden elde edilen hataların karşılaştırılmasını amaçlayan bir olasılıksal simülasyon çalışmasıdır. Yürütülen çalışmada örneklem büyüklüğü 50, 100, 300, 1000 ve 3000 kişi ve test uzunluğu 10, 20, 30, 40 ve 50 madde olmak üzere 2 değişimlenen koşul için 25 alt koşul belirlenmiştir. Bu alt koşullara uygun olarak 0 (yanlış), 1(kısmen doğru) ve 2 (tam doğru) şeklinde puanlanan genelleştirilmiş kısmi puan modeline uyumlu simülatif veriler kullanılmıştır. Çalışmada veri setlerini üretmek için WinGen3 programından faydalanılmıştır. Üretilen veri setlerinin eşitlenme süreci R programı ile yürütülmüştür. Bu çalışmada doğrusal, ortalama ve eşit yüzdelikli eşitleme yöntemleri olmak üzere üç Klasik Test Kuramı yöntemi (KTK) ve ortalama-ortalama ve ortalama-standart sapma olmak üzere iki Madde Tepki Kuramı (MTK) yöntemi kullanılmıştır. Üretilen test formları kullanılarak üç KTK yönteminden ve iki MTK yönteminden elde edilen eşitlemenin standart hataları hesaplanmış ve yöntemlerden elde edilen hata miktarları karşılaştırılmıştır. Araştırma sonucunda, farklı örneklem büyüklüğü ve farklı test uzunluğuna göre üretilen test formlarının eşitlenmesi sürecinde en az hata ile eşitleme yapan yöntemin eşit yüzdelikli eşitleme yöntemi ve en fazla hata ile eşitleme yapan yöntemin ortalama-ortalama yöntemi olduğu saptanmıştır. Çalışmanın sonucunun literatürle uyumlu olduğu görülmüştür. Test eşitleme yöntemleri örneklem uzunluğu bağlamında incelendiğinde örneklem büyüklüğü arttıkça test eşitleme hatasının azaldığı belirlenmiştir. Yöntemler, test uzunluğu bağlamında değerlendirildiğinde ise madde sayısı arttıkça hesaplanan hata miktarının da arttığı sonucuna ulaşılmıştır.
Test eşitleme Madde Tepki Kuramı Klasik Test Kuramı Eşitleme hatası Çok kategorili puanlanan testler
Birincil Dil | Türkçe |
---|---|
Konular | Eğitim Üzerine Çalışmalar (Diğer) |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 28 Aralık 2023 |
Yayımlandığı Sayı | Yıl 2023 |