Artı değer özelliğine sahip alt testlerde eşitleme yöntemlerinin karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada denk olmayan gruplarda ortak maddelere dayalı eşitleme deseninde artı değer özelliğine sahip olan alt testlerin alt test ve genişletilmiş alt test puanları kullanılarak eşitleme yöntemlerinin, örneklem büyüklüğüne, alt testeler arasındaki ortalama güçlük düzeyi farkına ve alt test uzunluğuna göre karşılaştırılmasının yanı sıra hangi koşullar altında hangi yöntemin daha iyi sonuç verdiği araştırılmıştır.Veri üretiminde R 3.1.1 programı kullanılmış ve iki parametreli lojistik modele (2PLM) uygun olarak; X formu ve Y formu için 1-0 şeklinde iki kategorili veri üretilmiştir. X ve Y formları iki alt testten oluşmaktadır. Ankor test toplam test formu gibi iki alt testten oluşmaktadır. Ankor testin alt test uzunluğu, toplam testin alt test uzunluğunun %40'ı oranında madde sayısına sahiptir. 20, 25, 50, 100, 200 ve 500 örneklem büyüklükleri için alt testleri arasında 0.70, 0.80 ve 0.90 korelasyonlu; formlar arasında 0.0, 0.40, 0.70 ortalama güçlük düzeyi farkı olan; alt test uzunluğu 10, 15, 30, 50 ve 80 olan X ve Y formları oluşturulmuştur. Çalışmada birim dönüşüm, zincirlenmiş lineer eşitleme, Braun/Holland ve dairesel yay eşitleme yöntemleri kullanılarak 100 replikasyon sonucunda alt testler eşitlenmiştir. Yöntemlerin eşitleme sonuçları, eşitlemenin standart hatası (SEE), eşitleme yanlılığı (BIAS) ve eşitleme hatası (RMSE) ölçütlerine göre değerlendirilmiştir.Genel olarak, 100, 200 ve 500 örneklem büyüklüğüne sahip, alt test uzunluğu 30 ve eşitlemenin yapılacağı test formları arasındaki ortalama güçlük düzeyi farkı 0.0 olduğunda eşitleme yapılması uygun görünürken dairesel yay eşitleme yöntemi diğer yöntemlere göre daha az hata değerleri göstermiştir. Çalışma sonucunda ortalama güçlük düzeyi farkı ve test uzunluğu arttıkça eşitlemenin yapıldığı tüm durumlarda hata değerlerinde de artış meydana gelmiştir. In this study, it was aimed to compare the equating methods for nonequivalent common item group desing using subscores of subtest which had added value, using augmented subscore of subtest which had added value by the variables such as sample size, average difficulty differences between forms, test length and correlation. In addition to this which method gave better results under what conditions was also investigated.In this study dichotomous data which was according with two parameter logistic model (2PLM) was produced for form X and form Y. R 3.1.1. programming language was used to produce data. Each test form had two subtest. Ancor test had two subtest, too. Its' subtest length was 40% of total test form X (Y). For both X and Y forms, corelation between subtests were altered in three level (0.70, 0.80 and 0.90). Moreover, average difficulty difference between subtest of form X and Y were altered in three levels (0.0, 0.4 and 0.7). Simulated forms were equated by using identity, chained linear, Braun/Holland and circle-arc methods fors ix different sample size (20, 25, 50, 100, 200 and 500) with 100 replications. The results obtained from this simulation study were evaluated based on standart error of equating (SEE), equating bias (BIAS) and equating error (RMSE) criterions.Generally, the findings indicated in the case when sample size was 100 and more, subtest length was 30 and the level of average difficulty difference between form 0.4, it was concluded that equating forms would give better results than not equating. Furthermore circle-arc method was found to less equating error than other equating methods under most of the conditions studied. Finally, increasing the test length and average difficulty difference between forms caused to increasing equating error values of all equating methods.
Collections