Show simple item record

dc.contributor.advisorTurhan, Kemal
dc.contributor.authorToprak, Uğur
dc.date.accessioned2020-12-29T14:05:28Z
dc.date.available2020-12-29T14:05:28Z
dc.date.submitted2015
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/438259
dc.description.abstractVeri madenciliği, büyük miktardaki veriler arasından kolaylıkla öngörülemeyen anlamlı örüntülerin çıkarılmasını sağlayan çalışma alanına denilmektedir. Günümüzde yaygın bir şekilde kullanılan veri madenciliği metotlarından biri de birliktelik analizidir. Bu analizin amacı mevcut veri kümesinde birlikte görülen parametreleri tespit ederek, karar verme sürecine faydalı olacak örüntüler ortaya çıkarmaktır. Ayrıca büyük miktarlardaki veri kümelerini budayarak, üzerinde analiz yapması kolay ve anlamlı veri kümeleri elde etmek için kullanılmaktadır. Bayesci ağlar, değişkenleri temsil eden düğümler ve nedensel ilişkileri gösteren oklardan oluşan grafiksel modellerdir. Bayesci ağlar, yönlü döngüsüz grafik oluşturmak ve değişkenlerin koşullu olasılık değerlerini bulmayı esas alır. Bu iki işlem öğrenme olarak tanımlanır. Bayesci ağlarda yapı ve parametre öğrenme olmak üzere iki tür öğrenme yöntemi vardır.Bu tez çalışmasında The Cancer Genom Atlas (TCGA) veritabanından elde edilen küçük hücreli dışı akciğer kanserine ait genetik mutasyonların evrimsel geçmişi ilk paragrafta belirtilen veri madenciliği teknikleri kullanılarak araştırılmıştır. Öncelikle TCGA veritabanından elde edilen yüksek miktardaki genetik veriden birliktelik kuralı analizi ile en sık görülen mutasyonların birlikte görülme kuralları çıkarılmıştır. Bu kurallar yardımıyla belirlenen en çok birlikte görülen on yedi mutasyonun atasal sıralanması Bayesci ağlarla yapılmıştır. Bayesci ağlar oluşturulurken iki farklı yapı öğrenme algoritması ve bu algoritmaların kullandığı dört farklı skorlama metodu kullanılmıştır. Mevcut veri seti ile oluşturulan Bayesci ağların tepe tırmanma ve tabu arama gibi yapısal öğrenme algoritmalarına göre değil, bu algoritmaların içinde mutasyonların ağdaki en iyi olasılıksal yerini belirleyen skorlama metoduna göre farklılık gösterdiği ortaya konulmuştur. Ayrıca mutasyonların veri setindeki görülme sıklıklarının, hastalığın birikimli yapısı hakkında önemli bilgiler içerdiği görülmüştür.
dc.description.abstractData mining can be described as an extraction of meaningful patterns from large amounts of data. Recently, one of the widely used data mining metods is association analysis. This analysis, aims to identify parameter pairs which has seen together in data set and uncover helpful patterns that will be useful to desicion-making process. Association analysis also used to prune data sets in large quantities to perfrom this analysis easily and obtain meaningful smaller data sets. Bayesian networks are the graphical models that nodes represents variables and causal relationships shown with arcs. Bayesian networks, bases on creating direcred acyclic graphs and finding conditional probablity values of variables. These two processes are defined as a learning process. There are two learning methods in Bayesian networks which are structure learning and parameter learning.In this thesis study, data mining techniques used on non-small cell lung adenocarcinoma's genetic mutation data to investigate evolutionary history of mutations which obtained from The Cancer Genom Atlas (TCGA). First, association rules analysis applied on dataset obtained from TCGA which contains large amount genetic of data to extract most common association rules. Seventeen genetic mutations determined with association rules to build ancestral sequence with Bayesian networks. Bayesian networks created with two different structure learning algorithms and four different scoring methods which are used by these algorithms. Bayesian networks created with obtained data showed us these networks differs not according to structure learning algorithms but according to scoring function which shows us best probable location of mutations in network. In addition, prevalence of the mutations in data set gave us important information about the cumulative nature of the disease.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBiyoistatistiktr_TR
dc.subjectBiostatisticsen_US
dc.subjectGenetiktr_TR
dc.subjectGeneticsen_US
dc.titleKarsinogenezde mutasyonlar arası ilişkilerin veri madenciliği metotları ile tespiti
dc.title.alternativeDetermining relations between mutations in carcinogenesis with data mining methods
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentBiyoistatistik ve Tıbbı Bilişim Anabilim Dalı
dc.subject.ytmBioinformatics
dc.subject.ytmBioistatistics
dc.subject.ytmCarcinogens
dc.subject.ytmCarcinoma
dc.subject.ytmMutation
dc.subject.ytmData mining
dc.subject.ytmBioistatistics
dc.subject.ytmNeoplasms
dc.subject.ytmCarcinoma-non small cell-lung
dc.subject.ytmLung neoplasms
dc.identifier.yokid10074355
dc.publisher.instituteSağlık Bilimleri Enstitüsü
dc.publisher.universityKARADENİZ TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid393955
dc.description.pages115
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess