Y-DNA haplogrupları için filogenetik ağaç oluşturma
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzde Y kromozomu bireyler veya ırklar arasındaki kökensel ilişkileri bulmak amacıyla sıklıkla incelenmektedir. Y-DNA insanların yüzyıllar önce yaptıkları göçlerin haritalarını tahmin etmek için de kullanılmaktadır.Bu tez çalışmasında, Y kromozomu kısa bitişik tekrarları kullanılarak filogenetik ağaç oluşturmak için dört adımlı bir yöntem öneriyoruz. Yöntemimizi, Y-DNA G haplogrubuna ait 145 örnek üzerinde 12 kısa bitişik tekrar belirteci kullanarak uyguladık. Yöntemimizin birinci adımında örnekler arası uzaklıkları hesaplayarak bir uzaklık matrisinde tutuyoruz. İkinci adımda ise örnekleri kümelere bölüyoruz. Üçüncü adımda her bir küme için bir filogenetik ağaç oluşturuyoruz. Dördüncü adımda ise ağaçları birleştirerek tek bir büyük ağaç elde ediyoruz.Verilerimizi filogenetik ağaç oluşturmadan önce kümelere bölmek ağaç oluşturma adımını dağıtık veya paralel hale getirebilme olanağı sağlayarak büyük miktardaki verileri daha hızlı şekilde işlememizi sağlar. Kümeleme adımında bölümleme ve yoğunluk tabanlı algoritmalarını kullandık ve sonuçlarını karşılaştırarak verilerimiz için hangi yöntemin daha etkin olduğu belirttik. Filogenetik ağaç oluşturma adımında Komşu Birleştirme algoritması kullandık. Son adımda ise oluşan ağaçların her birinden bir kök seçerek onlar için Komşu Birleştirme algoritmasını uyguladık ve tüm örnekleri kapsayan büyük bir ağaç elde ettik. Today, Y chromosome is frequently examined to find ancestral relationships between individuals or ethnic groups. Y-DNA is also used for estimating the migration that humans made centuries ago.In this thesis, we propose a four-step method for constructing phylogenetic trees by using short tandem repeats of Y chromosome. We implemented our method for 12 different short tandem repeat markers on 145 samples from Y-DNA Haplogroup G. In the first step of our method we calculate pairwise distances between samples and keep them in a distance matrix. In the second step we divide the samples into clusters. In the third step we construct a phylogenetic tree for each cluster. In the fourth step we connect the trees and obtain one large tree.Clustering our data before constructing phylogenetic trees enables us to process large of data sets faster by making tree construction step parallel or distributed. In clustering process we use partitioning-based and density-based algorithms and according to the resulting clusters we show which approach is more efficient for our data. We use neighbor-joining algorithm in the phylogenetic tree construction step. In the final step, we select roots from each tree and connect the trees into one large tree by using neighbor-joining algorithm again for these roots.
Collections