Çok değişkenli fonksiyonel verilerin kümeleme yöntemleri ile incelenmesi: Türkiye iklim örneği
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İstatistiksel analizlerde, analiz edilmek istenen gözlemlerin sayısı arttıkça, bu gözlemler reel değerli bir fonksiyondan örneklenmekte olduğu kabul edilmektedir. Bu durumda türetilen veriler bir fonksiyonel yapının örnekleri olmaktadır. Araştırmada yer alan birimlere ait özelliklerin belirli bir zaman içerisinde incelenmesi durumunda, her birime ait veri yapısı bir fonksiyonel yapı gösterecektir. Bu tür verilerin analiz edilmesinde klasik tek değişkenli ve çok değişkenli yöntemler yetersiz kalmaktadır. Bu yüzden bu türde verilerin analiz edilmesinde fonksiyonel veri analizinin kullanılması daha uygun olacaktır. Fonksiyonel veri analizinde ilk önce ayrık noktalarda gözlenen verileri reel fonksiyonlardan oluşan bir veri örneğine dönüştürmek gerekir. Fonksiyonların oluşturulması sürecinde baz fonksiyon ve pürüzlü ceza yaklaşımı kullanılmaktadır. Oluşturulan bireysel fonksiyonların analizi için fonksiyonel temel bileşenler analizi, kümeleme analizi ve fonksiyonel ANOVA kullanmak mümkündür.Bu çalışmada Türkiye'de bulunan 81 ilin bazı iklimsel değişkenlerine ait (günlük ortalama sıcaklık, günlük toplam yağış, günlük sıcaklık değişimi, günlük güneşlenme süresi ve günlük buharlaşma süresi) veriler 365 ayrık noktada incelendi. Veriler periyodik bir yapı izlediklerinden baz fonksiyon yaklaşımı olarak Fourier baz fonksiyonu kullanıldı. Veriler Fourier baz ve pürüzlü ceza yaklaşımları kullanılarak sürekli bir fonksiyon haline dönüştürüldü. Değişkenlere ait düzgünleştirme parametresinin bulunmasında genelleştirilmiş çapraz geçerlilik yöntemi kullanıldı. Değişkenlere ait değişimlerin temel nedenini belirleyebilmek için fonksiyonel temel bileşenler analizinden yararlanıldı. Oluşturulan bireysel fonksiyonların sınıflandırılmasında model tabanlı kümeleme yöntemi kullanıldı. Kümelerin, ortalama fonksiyonları bakımından aralarında istatistiksel açıdan fark olup olmadığının belirlenmesi işleminde FANOVA uygulandı. Observations to be analyzed are sampled from a real-valued function as they increase in number. The derived data are, therefore, samples of a functional structure. When the properties of units are analyzed within a certain time period, the data structure of each unit corresponds to a functional structure. Classical single variable and multivariate methods fall short of analyzing such data. It would, therefore, be more appropriate to use functional data analysis, in which data observed at discrete time points should first be converted into a data sample consisting of real functions. Base function and roughness penalty approaches are used to create functions. Functional principal component analysis, cluster analysis and functional ANOVA can then be used for the analysis of individual functions.This study examined the mean daily temperature, daily total precipitation, daily temperature changing, daily sunshine duration and daily evaporation data of 81 cities in Turkey at 365 discrete time points. Data had a periodic structure, and therefore, the Fourier base function was used. Data were transformed into a continuous function using Fourier base and roughness penalty approaches. Generalized cross validity method was used to find the smoothing parameter of variables. Functional principal component analysis was used to determine the main cause of the change in variables. Model-based clustering method was used to classify individual functions. Functional ANOVA was used to determine whether there was a statistical difference in mean functions between clusters.
Collections