Normal dağılım gösteren verilerin analizinde Gaussian karışımlı regresyonun kullanılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Gaussian karışımlı regresyon modelleri, sınırlı bir latent sınıf kümesi aracılığıyla populasyon heterojenliğini tahmin edebilir. Bu modeller özellikle bağımsız değişkenlerin bağımlı değişkenler üzerindeki etkisindeki farklılıkların tanımlanmasına odaklanmaktadır. Bu tez çalışmasında, solunum fonksiyon testinin (SFT) bir sonucu olan FEV1/FVC gibi bir bağımlı değişken üzerinde karışımlı regresyon modeli kurulmuştur. FEV1/FVC, özellikle akciğerin obstrüktif ve restriktif hastalıklarının ayrımında kullanılan en önemli SFT parametresidir. Bağımsız değişkenler olarak, yaş, cinsiyet, boy ve kilo seçilmiştir. AIC ve BIC değerlerine bakılarak, veri setinin 5 alt grubun karışımından oluştuğu saptanmıştır. Bu alt gruplardaki FEV1/FVC ortalama değerleri, ilk alt grupta en düşük, beşinci alt grupta en yüksek olacak şekilde küçükten büyüğe doğru sıralandığı görülmüştür. ilk alt gruptan son alt gruba doğru düzenli şekilde büyüyen FEV1/FVC değerlerine bakılarak, obstrüktif patternden restriktif patterne doğru düzenli ve anlamlı bir geçiş gözlenmiştir. Birinci alt grubun, kilo değişkeni açısından en yüksek, fakat FEV1/FVC değişkeni açısından en düşük değerlere sahip olduğu bulunmuştur. Dolayısıyla, obstrüktif paternin en belirgin olduğu alt grup birinci alt gruptur. Bu sonuç, KOAH ile obezite arasındaki ilişkinin bir göstergesidir. Buna karşın, beşinci alt grubun, kilo değişkeni açısından en düşük, fakat FEV1/FVC değişkeni açısından en yüksek değerlere sahip olması, kilo bağımsız değişkeninin, SFT sonuçlarında oldukça önemli bir rol oynadığını göstermektedir. Bu tez çalışması, heterojen bir yapıya sahip olan verilerin analizinde, karışımlı regresyon modellerinin kullanılmasının veriyi anlamlandırmada etkili bir yol olduğunu göstermiştir. Gaussian mixture regression models could estimate population heterogeneity through a finite set of latent classes. These models specifically focus on the identification of differences in the effect of independent variables on a dependent variable. In this thesis, a mixed regression model was established on a dependent variable such as FEV1 / FVC which is a result of pulmonary function test (PFT). FEV1 / FVC is the most important PFT parameter used to differentiate obstructive and restrictive diseases of the lung. Age, gender, height and weight were chosen as independent variables. Based on the AIC and BIC values, it was determined that the dataset was a mixture of 5 subgroups. The mean values of FEV1 / FVC in these subgroups were found to be the smallest in the first subgroup and the highest in the fifth subgroup. A regular and meaningful transition from obstructive pattern to restrictive pattern was observed by looking at FEV1 / FVC values growing from the first subgroup to the last subgroup. The first subgroup was found to be the highest in terms of weight variable but the lowest for the FEV1 / FVC variable. Therefore, the subgroup with the most obstructive pattern is the first subgroup. This result is an indication of the relationship between COPD and obesity. On the other hand, the fifth subgroup was the lowest in terms of weight, but the highest for the FEV1 / FVC variable, indicating that the weight independent variable plays an important role when it is filled in the results of the PFT. The results of this thesis showed that the use of mixture regression models in the analysis of data with a heterogeneous structure is an effective way to make sense of the data.
Collections