Çapraz-sınıflandırılmış kategorik verilere loglinear modellerin uydurulması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Biyoloji, tıp ve sosyal bilim dallarındaki araştırmalarda ölçülen karekterlerin kalitatif olması nedeniyle, elde edilen kesikli değişkenlerin analizinde bilinen parametrik metotlar elverişli olmamaktadır. Bu özellikteki veriler genellikle, çapraz-sınıflanmış tablolar şeklinde takdim edilir. Çapraz-sınıflanmış kategorik verilerin iki-boyutlu olması durumunda Pearsonhin %2 istatistiği ve G2 olabilirlik-oran istatistiği kuUanılmaktadır. Birçok durumda, bir sonuca tesir eden faktör sayısı ikiden fazladır. Bu nedenle yaygın olarak karşılaşılan çapraz-sıruflandırılmış tablolar, çok boyutludur. Böyle tabloların analizi için, çok boyutlu tablodan mümkün olan iki-boyutlu marjinal toplamların ayrı ayrı analiz edilmesi ve tüm faktörlerin birlikte değerlendirilmesine imkan veren loglinear modellerin verilere uydurulması şeklinde İM yol vardır. Bu araştırmada, çapraz-sınıflandınlrnış kategorik verilerin analizinde loglinear modeller ve x2 analizi kullanılmış ve bunlardan elde edilen sonuçlar karşılaştırılmışlar. Ayrıca aritmetik skalada linear olan logit modeller üzerinde de durularak, loglinear modeller ile iogit modeller arasındaki ilişkiler incelenmiştir. Çapraz-sınıflandınlrnış ihtimal tablolarının sabit veya örnekleme sıfirlan ihtiva etmesi durumunda, böyle tablolara quasi-loglinear modeller uygulanmıştır. Üç-boyutlu çapraz-sırmlandırıhnış tabloların analizinde, tüm mümkün iki-boyutlu marjinal toplamlara x2 testinin uygulanması ve bu üç-boyutlu tabloya loglinear modellerin uydurulması durumu karşriaştırılmıştir. %2 testinin uygulanması ile, hem yüksek dereceden interaksiyonlann ihmal edilmesine; hem de üçüncü faktörün tesiri dikkate alınmadığından dolayı bilgi kaybma sebep olduğu görülmüştür. Çapraz-çarpım oranlan ile parametreler arasındaki ilişkiler araştinlmıştır.Üç-boyutlu çapraz-sınıflandınlmış verilere uyan 8 mümkün hiyerarşik loglinear model vardır. Bu modeller için beklenen değerlerin doğrudan tahminleri, u123 = 0 modeli dışında verilmiştir. u123 = 0 modeline ait beklenen değerlerin tahminini elde etmek için tekrarlı tahmin yöntemi verilmiştir. Bu tekrarlı tahmin yönteminin, küçük bir değişiklik ile diğer modellere ait tahminlenmiş beklenen değerleri hesaplamak için de kullanılabüeceği gösterilmiştir. Modellerin uyumunu test etmek için, %2 ve G2 istatistikleri kuüamlmıştir. Verilere uyan birden fazla modelin olması durumunda, hangi modelin verilere en iyi uyum göstereceğinin belirlenmesi için, model seçim yöntemleri verilmiştir. Üç-boyutlu tablolarda model seçimi için, şartlı test istatistiği ve G2 'nin parçalanması yöntemleri kullanılmıştir. Model seçiminde önemli yeri olan rezidüyal analiz ve standarize parametre tahminleri için de teorik esaslar verilmiştir. Üç-boyutlu çapraz-sınıflandınlmış verilerin analizinde kullanılan model ve metotların tümü daha yüksek boyutlu tablolara kolayca genişletilebilir. Döıt-boyutlu çapraz-sınıflandınlmış ihtimal tablolarının analizi için metot ve modeller verilerek, uygulaması yapılmıştır. Hücre değerlerinin ençok olabilirlik tabjninlerini elde etmek için, doğrudan tahmin metotlan verilmiştir. Direkt tahminlerin mevcut olmadığı durumlarda, iteratif yöntem kullanılmıştır. Dört-boyutlu çapraz-sınıflandınlmış verilere en uygun modelin belirlenmesi için, şarüı test istatistiği ve G^nin parçalanması yöntemlerine ilave olarak, tüm mümkün etkilere bakma ve stepwise seçim yöntemi verilmiştir. Rezidüyal analiz ve standarize parametre tahminleri elde edilerek, model uyumu için kullanılmıştir. Cevap değişkeninin üri-şıkh olduğu dört-boyutlu bir tabloya logit modeller uydurularak, verilere uyan en uygun logit model ve bu modele tekabül eden loglinear model verilmiştir. Son olarak, yapısal sıfirlar ihtiva ettiği farz edilen üç-boyutlu bir tabloyu analiz etmek İçin quasi-loglinear modeller uydurulmuştur. Sonuç olarak, çapraz-sınıflandınlmış tam ve eksik tabloların analizinde kullanılan loglinear modellerin uydurulması metodu, araştıncılann ihtiyaç duyduğu bilgileri temin edecek tarzda yapılabilmektedir. Günümüzde bilgisayar imkanlarının fevkalade geniş olması, metodun uygulamasındaki karmaşıklığı da ortadan kaldırmaktadır. Fitting the Log-Linear Models to Cross-Classified Categorical Data. Some of the paramatric methods of analysis are not convenient for non-normal-discrete data obtained from social, biological, and medical research. This type of data are generally presented in the cross-classified categorical data. Well known Pearson's %2 and likelihood-ratio G2 statistics can be used for the analysis of two-dimentional contingency tables. In many cases, more than two factors have effects on the result. Thus cross-classified tables, which are commonly run into have multi-dimensions. To analyze these tables, there are two ways. First one is to analyze two-dimensional marginal totals seperately computed from multi-dimensional tables. Second İs to fit the log-linear models that make them possible to analyze all of the factors. In this study, chi-square and log-linear models were used for cross-classified categorical data, and the results were compared to each other. Moreover, logit models, which are usually linear in arithmetic scale, were studied, and their relationships between loglinear and logit models were examined. In case of cross-classified contingency tables that include fixed and sampling zeros, guasi-loglinear models were applied to these tables. Application of chi-square statistics to two-dimensional marginal totals and fitting loglinear models to three-dimensional table were compared in the analysis of three dimensional cross-classified tables Applying %2 statistics has been observed to cause both ignoring high interaction and loosing information because of ignoring the impact of third factor. The relationships between the ratio of cross-product and parameters were examined.
Collections