Parallelization study on the clustering technique to mine large datasets
dc.contributor.advisor | Özdoğan, Cem | |
dc.contributor.author | Yildirim, Ahmet Artu | |
dc.date.accessioned | 2020-12-04T11:27:17Z | |
dc.date.available | 2020-12-04T11:27:17Z | |
dc.date.submitted | 2011 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/78819 | |
dc.description.abstract | Bu tezde, mesaj geçirme arayüzü (MPI) ve birleşik aygıt mimarisi hesaplaması (CUDA) modelini uygulayarak geliştirilen paralel öbekleme algoritmaları, çok geniş veri kümeleri üzerindeki uygulamaları ile birlikte tanıtılmıştır. WaveCluster, wavelet dönüşümü tabanlı yenilikçi bir öbekleme analizi yaklaşımıdır. Bu yaklaşımın etkinliğine rağmen, çok boyutlu geniş veri kümeleri üzerinde çalıştırıldığında çalışma zamanı fazla olmaktadır. Geliştirilen MPI algoritmasında; yüksek verimlilik değerlerini elde etmek için işlemciler arasındaki haberleşme en az seviyede tutulmuştur. Yapılan deneysel çalışmalarda, MPI algoritması yüksek hızlanma değerleri vermiştir ve ayrıca artan işlemci sayısı ile birlikte doğrusal bir çalışma karakteristiği göstermiştir. WaveCluster yaklaşımı ayrıca grafik işlemci ünitesi (GPU) üzerinde CUDA modeli uygulanarak paralelleştirilmiştir. Geliştirilen CUDA algoritmasında, wavelet dönüşümü ve bağlı parçaları işaretleme algoritmaları geliştirilmiştir. CPU üzerinde sıralı çalışan WaveCluster yaklaşımına kıyasla CUDA algoritmalarında yüksek hızlanma değerleri elde edilmiştir. | |
dc.description.abstract | Parallel clustering algorithm implementations concerning message passing interface (MPI) and compute unified device architecture (CUDA) model with their applications to very large datasets have been presented in the thesis. WaveCluster is a novel clustering approach based on wavelet transforms. Despite it?s novelty, it requires considerable amount of time to collect results for large sizes of multidimensional datasets. In the MPI algorithm; divide and conquer approach has been followed and communication among processors are kept at minimum to achieve high efficiency. Developed parallel WaveCluster algorithm exposes high speedup and scales linearly with the increasing number of processors. Parallel behavior of WaveCluster approach has been also investigated by executing the algorithm on graphical processing unit (GPU). High speedup values have been obtained in the computation of wavelet transform and connected component labeling algorithms in the GPUs with respect to the sequential algorithms running on the CPU. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Parallelization study on the clustering technique to mine large datasets | |
dc.title.alternative | Geniş veri kümelerini işleme amacıyla öbekleme tekniği üzerine paralelleştirme çalışması | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Bilgisayar Mühendisliği Anabilim Dalı | |
dc.subject.ytm | Data mining | |
dc.subject.ytm | Parallel algorithms | |
dc.identifier.yokid | 400367 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | ÇANKAYA ÜNİVERSİTESİ | |
dc.identifier.thesisid | 297632 | |
dc.description.pages | 104 | |
dc.publisher.discipline | Diğer |