Eksik gözlemli uzun süreli (longitudinal) verilerde marjinal ve marjinal olmayan çok seviyeli genelleştirilmiş doğrusal karışık modellerde optimizasyon tekniklerinin karşılaştırılması ve model seçimi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışma, eksik gözlemli ve eksik gözlemlerin tahmin edildiği uzun süreli veri setinin analizinde, marjinal model yaklaşımları ile birey özel modellerde farklı optimizasyon teknikleri kullanılarak, kovaryans yapılarının belirlenmesi ve model seçiminin yapılması amacıyla gerçekleştirilmiştir. Araştırmanın materyali, 5 yıl süresince 1044 bireyden elde edilmiştir. Çalışmada, bireylerin sigara kullanım sıklığı üzerine etkili olabileceği düşünülen değişkenler yer almıştır. Cevap değişkeninin Poisson dağılışı gösterdiği veri setinde, marjinal model yaklaşımında Genelleştirilmiş Tahmin Eşitlikleri (GEE) kullanılmıştır. GEE'de gözlemler arası korelasyon yapısının belirlenmesi amacıyla, dört farklı korelasyon yapısı incelenmiştir. Bu yapılar; Değişebilir, Bağımsız, Birinci dereceden Otoregresif (AR(1) ve Yapısal Olmayan korelasyon yapılarıdır. Uygun korelasyon yapısının belirlenmesinde, QIC (Quasi Information Criterion) uyum ölçütü kullanılmıştır. Marjinal olmayan yöntemlerde ise Genelleştirilmiş Doğrusal Karışık Model (GLMM) ele alınmıştır. Parametre tahmin yöntemi olarak Penalized Quasi Olabilirlik (PQL) kullanılmıştır. GLMM için 4 ayrı model kurulmuştur. Bu modeller; sadece hataların şansa bağlı olduğu (Model 1), interseptin şansa bağlı olduğu (Model 2), zamanın şansa bağlı olduğu (Model 3) ve hem interseptin hem de zamanın şansa bağlı olduğu (Model 4) modellerdir. Bu modellerin analizinde, beş farklı optimizasyon tekniği; Quasi-Newton (QUANEW), Newton-Raphson (NEWRAP), Trust Region (TRUREG), Newton-Raphson Ridge (NRRIDG) ve Double-Dogleg (DBLDOG) kullanılmıştır. Ayrıca bu optimizasyon teknikleriyle beraber; Bileşik Simetri (CS), Yapısal Olmayan (UN), Birinci dereceden Otoregresif (AR(1)) ve Varyans Bileşenleri (VC) olmak üzere dört farklı kovaryans yapısı kullanılmıştır.Eksik gözlemlerin tahmininde, eksik gözlemlerin şansa bağlı (MAR) olduğu kabul edilmiş ve MCMC (Markov Chain Monte Carlo) tekniği ile Çoklu atama (MI) yöntemi uygulanmıştır. Eksik gözlemlerin tahmin edildiği veri setinde, marjinal model ve birey özel modeller tekrar uygulanarak sonuçlar elde edilmiştir. Bu sonuçlar, tez bünyesinde marjinal modellerde MI-GEE ve birey özel modellerde ise MI-birey özel modeller olarak ifade edilmiştir.Marjinal model yaklaşımında uygulanan GEE ve MI-GEE sonuçlarında, QIC ölçütüne göre uygun korelasyon yapısının bağımsız olduğu belirlenmiş ve parametre tahminleri elde edilmiştir.Eksik gözlemli birey özel model sonuçlarında ise; Model 1 için AIC ve BIC uyum ölçütlerine göre, uygun optimizasyon teknikleri QUANEW, NEWRAP, TRUREG, NRRIDG ve DBLDOG ve bu optimizasyon tekniklerinde en iyi kovaryans yapısı AR(1) olarak belirlenmiştir. Model 2 için NEWRAP, TRUREG, NRRIDG, DBLDOG ve UN; Model 3 için QUANEW, NRRIDG, DBLDOG ve UN; Model 4 için QUANEW, NEWRAP, NRRIDG ve UN yapılarının uygun olduğu belirlenmiştir. MI-birey özel model sonuçlarında ise Model 1 için QUANEW ve CS; Model 2 için QUANEW, NEWRAP, TRUREG, NRRIDG, DBLDOG ve UN; Model 3 için QUANEW, TRUREG, NRRIDG ve DBLDOG ve UN; Model 4 için ise QUANEW, NEWRAP, TRUREG, NRRIDG ve UN yapılarının uygun olduğu saptanmıştır.Çalışma sonucunda, marjinal modellerde korelasyon yapısının bağımsız olduğu yani, gözlemlerin birbirinden bağımsız olduğu sonucuna varılmıştır. Birey özel model sonuçlarında ise Model 1 haricinde diğer modellerdeki optimizasyon tekniklerine en iyi uyum gösteren kovaryans yapısının heterojen bir yapıya sahip olan UN olduğu belirlenmiştir.Anahtar kelimeler: Marjinal modeller, Birey özel modeller, Genelleştirilmiş tahmin denklemleri, Genelleştirilmiş doğrusal karışık modeller, Penalized quasi olabilirlik, Çoklu atama, Optimizasyon teknikleri, Kovaryans yapıları The aim of this study was to determine the structure of covariance and selection of the model to analyses the longitudinal data sets that have missing observation and estimated missing observation with subject specific model and marginal model approaches using different optimization techniques. The research were material obtained from 1044 individual observations during 5 years. In the study, variables included that will be affect on the frequency of smoking of individuals. Generalized Estimating Equations (GEE) as marginal model were used in response of the data sets that have Poisson distribution. Four different correlations structure were examined to determine the structure correlations between observations in GEE. These structures are exchangeable, independent, first-order autoregressive (AR(1) and unstructure. Determining the appropriate correlation structure, QIC (Quasi Information Criterion) was used as a measure of the goodness of fit. Generalized Linear Mixed Model (GLMM) was used in non-marginal methods. Four different models were used for GLMM. Penalized Quasi Likelihood (PQL) was used as a method of parameter estimation. These models are only residuals are due to random (Model 1); intercept is due to random (Model 2); time is due to random (Model 3); both intercept and time are due to random (Model 4). Five different optimization techniques were used for analyzing these models. These are Quasi-Newton (QUANEW), Newton-Raphson (NEWRAP), Trust Region (TRUREG), Newton-Raphson Ridge (NRRIDG) and Double-Dogleg (DBLDOG). In addition to these, four different covariance structures were used. These are Compound Symmetry (CS), Unstructured (UN), First-order autoregressive (AR(1)) and Variance components (VC). Missing observations has been accepted as missing at random (MAR) when the estimation of missing observations. Markov Chain Monte Carlo (MCMC) and Multiple Imputation (MI) were used in analysis. Results were obtained by marginal models and subject specific models were reapplied on the data set that has estimated missing observations. Missing observations were estimated on the set of data, marginal models and subject specific models, individual results have been obtained by applying again. These results were explained with marginal model as MI-GEE and subject specific model as MI-subject specific models the thesis.Marginal model was determined the appropriate correlation structure is independent and found the estimation of parameters by QIC criteria in the result of GEE and MI-GEE that used marginal model approach. Subject specific was determined that AR(1) is the best covariance structure in the QUANEW, NEWRAP, TRUREG, NRRIDG and DBLDOG optimization techniques which were found these are the most suitable optimization techniques according to AIC and BIC accordance criteria for Model 1 in the results of subject specific model that has missing observations. It was found that the most suitable optimization techniques are NEWRAP, TRUREG, NRRIDG, DBLDOG and UN for the Model 2; QUANEW, NRRIDG, DBLDOG and UN for the Model 3 and QUANEW, NEWRAP, NRRIDG and UN for the Model 4, respectively. In addition to this, it was determined that the most suitable optimization techniques are QUANEW and CS for the Model 1; QUANEW, NEWRAP, TRUREG, NRRIDG, DBLDOG and UN for the Model 2; QUANEW, TRUREG, NRRIDG, DBLDOG and UN for the Model 3; QUANEW, NEWRAP, TRUREG, NRRIDG and UN for the Model 4 according to the result of MI-subject specific model.As a result, it was concluded that the correlation structure is independent in marginal models that means the observations are independent from each other. It was determined that UN is the best fitted covariance structure that has heterogenic structure to the optimization techniques except Model 1 in the result of subject specific models.Key words: Marginal models, Subject specific models, Generalized estimating equations, Generalized linear mixed model, Penalized quasi likelihood, Multiple imputation, Optimization techniques, Covariance structures
Collections