Log-doğrusal modellerin olumsallık çizelgelerine uygulanması
dc.contributor.advisor | Erar, Mehmet Aydın | |
dc.contributor.author | Acar, Nihan | |
dc.date.accessioned | 2020-12-09T12:02:02Z | |
dc.date.available | 2020-12-09T12:02:02Z | |
dc.date.submitted | 2011 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/210699 | |
dc.description.abstract | Genelleştirilmiş doğrusal modeller (GDM) yanıt değişkeni ile açıklayıcı değişkenler arasında basit doğrusal bir ilişki bulunmayan, Binom, Poisson ya da Gamma gibi üssel dağılım ailesi üyesi dağılımların analizinde kullanılır. GDM, yanıt değişkeninin bu dağılımlardan birine sahip olması durumunda kullanılan modelleme tekniklerinin bir çerçevesi olarak tanımlanabilir. Özellikle kesikli veriler için analiz yöntemleri içeren GDM'nin bir uzantısı yanıt ve açıklayıcı değişkenler arasında ayrım yapılmadığı zaman kullanılabilen log-doğrusal modellerdir. Log-doğrusal modeller çevrebilim, tıp, bankacılık gibi sektörlerde sıklıkla karşılaşılan kategorik değişkenler arasındaki ilişki örüntülerinin ortaya çıkarılmasını sağlar. Bu modeller genellikle olumsallık çizelgelerinin analizinde kullanılır.Olumsallık çizelgelerinde beklenen hücre frekanslarının hesaplanması aykırı değerlerin tespiti için önemli bir adım teşkil etmektedir. Bilinen ve sıklıkla kullanılan En Çok Olabilirlik (EÇO) yöntemine alternatif olarak sağlam bir yöntem olan ?Medyan Polish (MedPol)? yöntemi de beklenen hücre frekanslarının belirlenmesinde kullanılabilir. Bu çalışmada, sağlam olan ?MedPol? ve sağlam olmayan ?EÇO? yöntemlerinden elde edilen hücre frekanslarının karşılaştırılması ve EÇO ve MedPol kestirimleri üzerinden ? - aykırı değer bölgesi? yöntemi uygulanarak aykırı hücrelerin belirlenmesi amaçlanmıştır.Bu çalışmanın amacı, olumsallık çizelgesi şeklinde verilen üç farklı veri kümesine log-doğrusal modellerin uygulanıp ilişki örüntülerinin ortaya çıkarılmasıdır. Bu amaçla çalışmanın ilk uygulamasında, sürücülerin son üç yılda yaptıkları kaza sayıları ile uyku alışkanlıkları arasında bir ilişki olup olmadığı ve sürücülerin verdiği yanıtların güvenilirliği incelenecektir. Bunun yanı sıra takip eden diğer iki uygulamada ?Kanser lezyonlarına ait özellikler arasındaki ilişki örüntüleri nelerdir?? ile ?Kredi başvurusu yapan kişilerde birikim miktarları, çalışma hayatındaki süreleri ve konut sahibi olma durumları arasında bir ilişki var mıdır?? sorularına yanıt aranacaktır. | |
dc.description.abstract | Generalized linear models (GLM) are used in the analysis of exponential distribution families such as Normal, Binomial, Poisson and Gamma distributions where a simple linear relationship is not found between response variable and explanatory variables. Generalized linear models can be defined as a framework of statistical modeling techniques which are used in the case that the response variable comes from one of those distributions. One of the extensions of GLM, that includes analyzing techniques especially for discrete data, is log-linear models which are applicable when there is no distinction between response and explanatory variables. Log-linear models help to reveal association patterns among categorical variables that are widely encountered in sectors such as ecology, medicine and banking. These models are generally used in the analysis of contingency tables.The calculation of expected cell frequencies has importance in identifying outliers in the analysis of contingency tables. As an alternative to known and widely used Maximum Likelihood (ML) Method, Median Polish (MedPol) Method can also be used in determining expected cell frequencies. In this study, comparing the cell frequencies obtained from the robust method ?MedPol? and the non-robust method ?ML? and determining outlying cells by using ? - outlier region? method over ML and MedPol estimators were aimed.The aim of this study is to reveal association patterns among variables in three different data sets given in the form of contingency tables by applying log-linear models. With this aim, in the first application of the study, the association between the number of accidents that drivers made in the last three years and the sleeping habits of drivers and the reliability of the answers of drivers were analyzed. Besides, in the following two applications the answers to the questions: ?What are the association patterns among the properties of cancer lesions?? and ?Is there any relationship between savings account balance, years working and home ownership of people who made credit applications?? will be sought. | en_US |
dc.language | Turkish | |
dc.language.iso | tr | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | İstatistik | tr_TR |
dc.subject | Statistics | en_US |
dc.title | Log-doğrusal modellerin olumsallık çizelgelerine uygulanması | |
dc.title.alternative | The application of log-linear models on contingency tables | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | İstatistik Anabilim Dalı | |
dc.subject.ytm | Generalized linear models | |
dc.identifier.yokid | 403050 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | MİMAR SİNAN GÜZEL SANATLAR ÜNİVERSİTESİ | |
dc.identifier.thesisid | 304795 | |
dc.description.pages | 94 | |
dc.publisher.discipline | İstatistik Bilim Dalı |