Koşullu ve sınırlandırılmış lojistik regresyon yöntemlerinin karşılaştırılması ve bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZET Sağlık alanında karşılaşılan olayların bazıları var-yok, ölü-sağ, hasta- sağlam gibi iki ya da daha çok kategoriler şeklinde sonuçlanmaktadır. Bu sonuçların ortaya çıkmasında bir çok faktör etkili olmaktadır. Kategoriler halinde sonuçlanan olaylar ile bu olayları etkileyen faktörler arasındaki neden sonuç ilişkisini belirlemede lojistik regresyon modelleri kullanılmaktadır. Sınırlandırılmış ikili veri, gruplar halinde gözlenen ve her grupta en az iki birimin bulunduğu ve her bir grup için en az bir pozitif cevabın elde edildiği veri yapısıdır. Bağımlı değişken olarak sınırlandırılmış ikili veri kullanılan lojistik regresyon modelleri, koşullu ve sınırlandırılmış lojistik regresyon modelleridir. Bu modellerin seçiminde, modele katılan bağımsız değişkenler önemli rol oynamaktadırlar. Eğer modeldeki bağımsız değişkenler birim düzeyinde bağımsız değişkenler ise, her iki modelden biri kullanılabilir. Fakat modele grup düzeyinde bağımsız değişkenler katılmak zorundaysa, sınırlandırılmış lojistik regresyon modeli kullanılmalıdır. Bundan dolayı sınırlandırılmış lojistik regresyon modeli, koşullu lojistik regresyon modeline göre daha etkin bir modeldir. Bu çalışmada, uygulama olarak Eskişehir Trafik il Şube Müdürlüğün'den alınan trafik kazalarına ait veriler kullanılmıştır. Bu veri yapısında önden çarpma sonucu oluşan otomobil kazaları kullanılmıştır. Toplam 20 otomobil ele alınmış ve bu otomobiller grup olarak belirlenmiştir. 20 otomobilde toplam 76 birim yer almaktadır. Önden çarpma sonucu oluşan otomobil kazalarında; emniyet kemeri kullanımı, bireyin yaşı, bireyin otomobildeki oturduğu yer ve otomobilin çarpma hızı ölüm riskini etkileyen faktörler olarak ele alınmış ve bu faktörlerin ölüm riski üzerine etkileri koşullu ve sınırlandırılmış lojistik regresyon modeli kullanılarak araştırılmıştır. Koşullu lojistik regresyon analizi EGRET for WINDOWS Version 2.0.3 paket programı kullanılarak yapılmıştır. Sınırlandırılmış lojistik regresyon analizi ise MATLAB 5.3 programlama dili kullanılarak yazılan bir program ile yapılmıştır. İÜKoşullu lojistik regresyon analizinde emniyet kemeri kullanımının, bireyin yaşının ve bireyin otomobildeki oturma yerinin ölüm riski üzerine etkileri araştırılmıştır. Otomobilin çarpma hızı otomobil düzeyinde (grup düzeyinde) bağımsız değişken olduğundan koşullu lojistik regresyon analizinde kullanılamamıştır. Sınırlandırılmış lojistik regresyon analizinde ise, emniyet kemeri kullanımının, bireyin yaşının, bireyin otomobildeki oturma yerinin ve otomobilin çarpma hızının ölüm riski üzerine etkileri incelenmiştir. Her iki modelden de elde edilen analiz sonuçlarına göre; önden çarpma sonucu oluşan otomobil kazalarında emniyet kemeri takmak, otomobilin arka tarafında oturmak ölüm riskini önemli derecede azaltmaktadır. Ancak bireyin yaşının ölüm riski üzerine bir etkisi bulunmamıştır. Otomobilin çarpma hızı sadece sınırlandırılmış lojistik regresyon modelinde analiz edilmiş ve ölüm riski üzerine önemli derecede etkisi olduğu saptanmış ve hız arttıkça ölüm riskinin de arttığı bulunmuştur. Anahtar Kelimeler: Sınırlandırılmış Kategorik İkili Veri, Koşullu Lojistik Regresyon, Sınırlandırılmış Lojistik Regresyon, Önden Çarpma Sonucu Oluşan Trafik Kazaları, Fisher Information Matrisi, Score Vektörü, Newton- Raphson Algoritması, ODDS Oranı. iv SUMMARY In the area of health some events occurred like that present-absent, death-alive, case-control or in more categories. Occurring of these events affected by many factors. Logistic regression models are used in the determination of cause-effect relation between these categorical events and factors. Truncated binary data occurs when a group of individuals, who each have a binary response, are observed if one or more of the individuals have a positive response. In conditional and truncated logistic regression models truncated binary data are used. Independent variables are very important in choosing of these models. If the independent variables used in the models are individual level variables, both of the models can be applied. However group level independent variables want to be used in analysis, truncated logistic regression model must be applied. For this reason, truncated logistic regression model is more efficient than conditional logistic regression. In this research, as an application traffic accident data, which obtained from Eskişehir Traffic Office Department, are applied. These data consist of frontal impact car accidents. Total 20 cars considered and these cars were determined as groups. There are 76 individuals in these 20 cars. In the frontal impact car accidents, usage of safety belt, age of individual, location of individual in the car and collision speed of the car were considered as factors affecting death risk and the effects of these factors on death risk were analyzed by using conditional and truncated logistic regression models. Conditional logistic regression analysis was performed by using package program of EGRET for WINDOWS version 2.0.3. However, truncated logistic regression analysis was performed by using a program written in MATLAB 5.3 programming language.In the conditional logistic regression analysis, the effects of usage of safety belt, age of individual and location of individual in the car, on death risk were investigated. While collision speed of the car is a group level independent variable, it was not used in the truncated logistic regression analysis. In the truncated logistic regression analysis, the effects of usage of safety belt, age of individual, location of individual in the car and collision speed of the car, on death risk were analyzed. According to the results obtained from the both models; in the frontal impact car accidents fasten safety belt and locate in the back seat of the car decreased death risk significantly. But the effects of age of individual on death risk didn't find. Because collision speed of the car is a group level independent variables, it analyzed only in the truncated logistic regression model. The effect of collision speed of the car on death risk was found significantly. When the collision speed of the car increases, death risk of individual in the car increases. Key Words: Truncated Binary Data, Conditional Logistic Regression, Truncated Logistic Regression, Front Impact Car Accidents, Fisher Information Matrix, Newton-Raphson Algorithm, ODDS Ratio. VI
Collections