Dağılımı belli olmayan dairesel verilerde aykırı değer tespiti için bir yöntem önerisi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Açısal veya yönsel olarak ölçülmüş dairesel veri tipi, biyoloji, coğrafya, jeoloji, tıp, meteoroloji, jeofizik, okyanus bilimi gibi pek çok alanda karşımıza çıkmaktadır. Aykırı gözlemlerin varlığı, doğrusal verilerde olduğu gibi dairesel veriler için de modelleme ve tahmin sürecinde karşılaşılan önemli sorunlardan bir tanesidir ve yapısı nedeniyle bu tip verilerde aykırı gözlem olması durumu özel bir inceleme gerektirmektedir. Bu tez çalışmasında, dairesel verilerde aykırı gözlem tespiti için, dairesel medyana dayalı bir uzaklık ölçüsü tanımlayan parametrik olmayan bir yöntem önerilmiştir. Önerilen yöntemin performansı tek boyutlu dairesel veriler ve parametrik olmayan dairesel regresyon bağlamında incelenmiştir. Yöntem, tek değişkenli simülatif ve gerçek veri setlerinde literatürde yer alan diğer tespit yöntemleriyle karşılaştırıldığında yüksek performans göstermiştir. Açıklayıcı değişkeni doğrusal ve yanıt değişkeni dairesel olan, doğrusal-dairesel parametrik olmayan regresyon modellerinden Nadaraya Watson ve Yerel Lineer Kernel yöntemleri ele alınarak, yanıt değişkeninde aykırı gözlem bulunması halinde, ilgili yöntemlerin ve önerilen tespit yönteminin performansı, gerçek veri setleri ve kapsamlı bir simülasyon çalışması ile incelenmiştir. Önerilen yöntemin parametrik olmayan dairesel regresyon bağlamında da aykırı gözlemleri yüksek oranlarda tespit ettiği gözlenmiştir. Angular or directional circular data type appears in many fields such as biology, geography, geology, medicine, meteorology, geophysics, and ocean science. The existence of outliers is one of the most important problems that are encountered in modelling and forecasting process for circular data as well as linear data, and because of the nature of such observations, outliers require a special examination. In this thesis, a non-parametric outlier detection procedure for circular data is proposed which defines a distance based on circular median. The performance of the proposed method was examined in the context of one dimensional circular data and non-parametric circular regression. The proposed method performs better than the other detection methods in the literature for simulative and real data sets in univariate circular data. Linear-circular non-parametric regression models Nadaraya Watson and Local Linear Kernel methods are discussed when the explanatory variable is linear and the response variable is circular, and the performance of the proposed method was examined with a comprehensive simulation study and a real data set when the the response variable contains outlier. It has been observed that the proposed method has high detection rates in the context of non-parametric circular regression.
Collections