Consensus clustering of time series data
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmanın amacı Devingen Zaman Eşleştirme (DZE) ve Ortak Kümeleme yaklaşımlarını bir araya getiren bir metodun oluşturulmasıdır. Zaman serisi verilerinin birbiri ile karşılaştırılmasında en sık kullanılan uzaklık metrikleri verilerin aynı boyutta olmasını gerektirir. Bu uzaklık metrikleri genelde verilerin zaman bazında karşılıklı gelen noktalarının yakınlıklarını kullanmaktadır. DZE zaman serisi verilerinin yakınlıklarının belirlenmesinde kısmen yeni bir metrik olup, arasında faz farkı bulunan, aynı boyutta olmayan ya da frekansları farklı olan verilerin karşılaştırılmasında kullanılabilmektedir. DZE iki zaman serisini birbirileri ile farkları en az olacak şekilde hizalamaktadır. Literatürde DZE metodu yaygın olarak tek değişken ve standart kümeleme algoritmaları ile birlikte kullanılmaktadır. Bu doğrultuda çalışmanın amacı DZE'nin ve ortak kümeleme metodolojilerinin avantajlarını bir araya getiren ve birden fazla değişkene sahip problemler için de kullanılabilecek bir algoritmanın oluşturulmasıdır. Çalışmanın sonuçları, bu çalışmaya özel yaratılan veri setleri, literatürde sık kullanılmış olan örnek veri setleri ve Türkiye'nin 1950-210 yılları arasını kapsayan uzun dönem meteorolojik zaman serisi verileri ile test edilmiştir. Tüm test verilerinde, DZE ile birlikte kullanılan ortak kümeleme algoritması standart Euclid uzaklığı ile gerçekleştirilen kümelemelerden daha iyi sonuçlar vermiştir. Bununlar birlikte bazı test durumlarında görülen fark çok küçüktür. Bu kapsamda, DZE ve ortak kümeleme algoritmasının çözümle sürelerinin uzunluğu da dikkate alındığında bu test durumları için DZE ve ortak kümeleme algoritmasının birlikte kullanımını gereksiz kılmaktadır. Tez, çalışma sonuçlarının ve gelecek dönem çalışmalarının bir özeti ile sonlanmaktadır.Anahtar Kelimeler: Ortak Kümeleme, Devingen Zaman Eşleştirme, Zaman Serisi Kümeleme, Türkiye'nin iklim Bölgeleri In this study, we aim to develop a methodology that merges Dynamic Time Warping (DTW) and consensus clustering in a single algorithm. Mostly used time series distance measures require data to be of the same length and measure the distance between time series data mostly depends on the similarity of each coinciding data pair in time. DTW is a relatively new measure used to compare two time dependent sequences which may be out of phase or may not have the same lengths or frequencies. DTW aligns two time series data so that the distance between them is minimized. However, DTW is a similarity measure that is employed for single variable with standard clustering methods rather than consensus clustering. Thus our motivation is to create an algorithm that can combine the benefits of the DTW with benefits of consensus clustering, which will also provide a solution for multivariate applications. We present the results of our study both with simulated data, well known datasets from the literature and Turkey's long-term meteorological time series data between years 1950 and 2010. In all the cases we experimented with, when used with consensus clustering DTW performs better than Euclidian Distance measure. However in some cases the performance difference was insignificant, making it unnecessary to use both DTW and Consensus Clustering, due to time consuming computations. This thesis ends with a conclusion and the outlook to future studies.Keywords: Consensus Clustering, Ensemble Clustering, Dynamic Time Warping, Time Series Clustering, Turkey Climate Regions
Collections