Çoklu doğrusal regresyonda aykırı, etkili değerlerin araştırılması ve bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZET Bu çalışmanın amacı, çoklu doğrusal regresyonda kuşkulu gözlemleri, bir başka deyişle aykırı, uç değerleri ve etkili gözlemleri incelemek; uygulama verileri üzerinde çeşitli yöntemlerle kuşkulu gözlemleri saptayıp hangi yöntemin daha iyi sonuç verdiğini araştırmaktır. Beş bölümden oluşan çalışmanın birinci bölümünde, çoklu doğrusal regresyonla ilgili ön bilgilerin yanısıra `artık` kavramı üzerinde duruldu. Artıklar çeşitli sınıflara ayrılıp açıklandı. Daha sonra, sırasıyla aykırı değerler, uç değerler ve etkili gözlemler açıklanıp aralarındaki ilişkiler belirtildi. İkinci bölümde, tek kuşkulu gözlemleri saptamada kullanılan çeşitli grafikler ve çeşitli istatistikler tanıtıldı. Üçüncü bölümde, gizleme ve sürükleme etkileri tanımlandı ve bu etkilerin varlığında çoklu kuşkulu gözlemlerin, tek kuşkulu gözlemleri saptamada kullanılan yöntemler ile doğru biçimde belirlenemeyeceği vurgulandı. Bu nedenle, çoklu kuşkulu gözlemleri saptamada kullanılan sağlam yöntemler açıklanıp bu yöntemlerden elde edilen sonuçların çeşitli grafiklerle gösterimi sunuldu. Dördüncü bölümde, iki ayrı gerçek veri kümesi için tek ve çoklu kuşkulu gözlemler, anlatılan yöntemler ile incelendi ve hangi yöntemin daha iyi sonuç verdiğini saptamak üzere geçerlilik çözümlemesi yapıldı. Sonuç olarak, iki ayrı gerçek veri kümesi için farklı sonuçlar elde edildiğinden kuşkulu gözlemlerin saptanmasında hangi yöntemin daha iyi olduğunun çalışılan veri kümesine bağlı olarak değiştiği belirlendi. Anahtar Kelimeler: Regresyon, aykırı değer, uç değer, etkili gözlem, çoklu aykırı değer. SUMMARY The aim of this study is to examine suspicious observations i.e. outlier, leverage, influential observations in multiple linear regression and to investigate which method gives better result on determining suspicious observations. In the first chapter of the study consisting of five chapters, residual as a concept was explained in multiple linear regression. Then, outlier, leverage, influential observations were defined respectively and relationships among them were stated. In the second chapter, various graphs and statistics used for detennining single suspicious observations were introduced. In the third chapter, masking and swamping effects were defined and it was stressed that multiple suspicious observations can't be determined correctly by methods used for determining single suspicious observations in the presence of these effects. Therefore, robust methods used for determining multiple suspicious observations were explained and results obtained from these methods have been displayed by using various graphs. In the fourth chapter, single and multiple suspicious observations were examined on two real data sets and validation analysis has been applied to determine which method gives better result. Finally, because of different results obtained from two different real data sets it has been determined that a good method used for determining suspicious observations changes according to data sets. Keywords: Regression, outlier, leverage, influential observation, multiple outlier. u
Collections