Show simple item record

dc.contributor.advisorGündem, Taflan İmre
dc.contributor.authorErdem, Atakan
dc.date.accessioned2020-12-04T10:32:37Z
dc.date.available2020-12-04T10:32:37Z
dc.date.submitted2014
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/74109
dc.description.abstractGen ifadesi deneylerinin bir aşamasında veriler manuel yöntemlerle elde edildiği için verilerin güvenilirliği düşüktür. Bu verilerin bir veri madenciliği algoritmasına ya da modele direkt girdi olması durumunda varılmak istenen sonuçların güvenilirliğinin olumsuz yönde etkilemesi kaçınılmazdır. Çalışmamızda, elde edilen verilerin belirsizliğini azaltmak için her verinin, örnek veri üretme teknikleriyle elde edilen veri kümeleriyle temsil edilmesini sağladık. Örnek veri yaklaşımı verilerin belirsizlik yüzdesini azaltırken işlem yapılan veri setinin örnek veri kümesi eleman sayısı oranında artmasına, dolayısıyla da ilgili veri işleme algoritmalarının sonuç üretme zamanının artmasına neden olmaktadır. Çalışmamızın ilk kısmında belirsiz verilerin hızlı bir biçimde kümelenebilmesi için çok çekirdekli sistemler üzerinde eş zamanlı çalışabilen M-FDBSCAN adını verdiğimiz bir `belirsiz veri kümeleme` algoritması geliştirdik. Algoritmada önerilen yöntemle yalnızca çok çekirdekli sistemlerde değil tek çekirdekli sistemlerde de veri işleme hızında büyük artışlar sağlandığı gösterdik. Çalışmamızın ikinci kısmında M-FDBSCAN algoritmasını, zaman serisi verilerinin hızlı ve etkin bir biçimde işlenebildiği, E-MFDBSCAN adı verilen bir `evrimsel kümeleme` algoritmasına dönüştürdük. Bu yeni algoritma global kümelerin oluşturulmasını sağlamaktadır. Çalışmamızın son aşamasında oluşturulan global kümelerin zaman bazlı evrimsel desenlerini kullanarak bir öngörü modeli geliştirdik. Bu öngörü modeliyle bir sonraki zaman noktasına ait bir global kümenin benzerlik ve desen bilgilerinin kestiriminin yapılabilmesini sağladık.
dc.description.abstractBecause of using manual methods in some parts of gene expression experiments, reliability of the data is low. If this data is directly utilized as input to a data mining algorithm or a model for evaluating gene expression data, then the adverse affects to the desired results will be inevitable. In order to eliminate aforementioned adverse affects and reduce the fuzziness, we represent the data with sample data sets that are generated by using uncertain data management techniques. Sample data approach not only reduces the percentage of fuzziness, but also it causes the output generation time to be increased due to an increase in the amount of processed data, which is directly proportional to the cardinality of the sample data set. In the first part of the study, we introduce an uncertain data clustering algorithm, named M-FDBSCAN, for enabling one to cluster uncertain data rapidly, which runs on multi-core systems in a concurrent fashion. We show that by using the proposed method, the algorithm yields considerable performance improvement on single core systems, as well. In the second part of the study, M-FDBSCAN algorithm is converted into an evolutionary clustering algorithm, named E-MFDBSCAN, by which time series data can be processed rapidly and efficiently. This new algorithm enables to generate global clusters. In the last part of the study, using time-based evolutionary patterns of global clusters a prediction model is constructed. The proposed prediction model enables us to predict the patterns and the similarities of a global cluster that will be generated at the next time point.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectBiyomühendisliktr_TR
dc.subjectBioengineeringen_US
dc.subjectGenetiktr_TR
dc.subjectGeneticsen_US
dc.titleAn efficient evolutionary clustering and prediction model for gene expression time series data
dc.title.alternativeGen ifadesi zaman serisi verileri için etkin bir evrimsel kümeleme ve öngörü modeli
dc.typedoctoralThesis
dc.date.updated2018-08-06
dc.contributor.departmentBilgisayar Mühendisliği Anabilim Dalı
dc.subject.ytmHierarchical clustering
dc.subject.ytmGene analysis
dc.subject.ytmLinear prediction models
dc.identifier.yokid10038913
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityBOĞAZİÇİ ÜNİVERSİTESİ
dc.identifier.thesisid371814
dc.description.pages82
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess