Show simple item record

dc.contributor.advisorTimor, Mehpare
dc.contributor.authorKalemci, Özin
dc.date.accessioned2020-12-07T12:40:14Z
dc.date.available2020-12-07T12:40:14Z
dc.date.submitted2019
dc.date.issued2019-07-01
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/147533
dc.description.abstractVeri madenciliği, karar vericilerin eldeki verilerden yola çıkarak doğru ve etkin kararlar almasına yardımcı olan yöntemler topluluğudur. Veri madenciliği yöntemleri, özellikle tıp alanında daha çok tahmin edici yönüyle kullanılmaktadır. Son yıllarda yapılan çalışmalar veri madenciliği yöntemlerinin kanser de dahil olmak üzere bir çok hastalığın teşhis edilmesinde umut verici sonuçlar ortaya koyduğunu göstermektedir. Bu çalışmada amaç, veri madenciliği yöntemleri kullanılarak, prostat kanserinin erken ve doğru teşhis edilebilmesi için anlamlı bir model oluşturmaktır. Çalışmanın diğer teşhis etme çalışmalarından farkı, PSA veya rektal tuşe vb. gibi hiçbir tıbbi sonuç değişkeni içermemesi, sadece genetik ve fiziksel değişkenler içermesidir. Çalışmada stacking topluluk metodu altında bayes sınıflandırıcılar, k en yakın komşuluk ve karar ağacı yöntemleri kullanılarak bir topluluk modeli oluşturulmuştur. Bu model ile prostat kanseri olan ve olmayanların en doğru şekilde sınıflandırılması amaçlanmaktadır. Yapılan çalışmada 989 kişiden oluşan, her kişiye ait 200 bin SNP ve 18 adet fenotip değişken içeren prostat verisi kullanılmıştır. Modelin performans sonuçlarına bakıldığında; doğruluk, kesinlik ve duyarlılık değerleri sırasıyla %84,13, %89,84 ve %74,23'dür. Bu sonuçlara bakıldığında modelin prostat kanserini tahmin etme yeteneği başarılıdır. Anahtar Sözcükler: Sağlıkta Veri Madenciliği Uygulamaları, Karar Ağaçları, Stacking Yöntemi, K En Yakın Komşuluk Yöntemi, Naive Bayes Yöntemi, Bütünsel Genom İlişkilendirme, Tekli Nükleotid Polimorfizm
dc.description.abstractData mining is a collection of methods that help decision makers to make accurate and effective decisions based on available data. Data mining methods are being used more often in the field of medicine, especially for predicting disease. Recent studies have shown that data mining methods have promising results in diagnosing many diseases, including cancer. The aim of this study is to establish a meaningful model for the early and accurate diagnosis of prostate cancer using data mining methods. The difference of the model from other diagnostic studies is that it does not involve any medical outcome variables, such as PSA or rectal key, but only genetic and physical variables. In the study, an ensemble model was constructed by using Bayesian classifiers, k nearest neighbor and decision tree methods under the stacking ensemble method. With this model, it is aimed to classify individials with and without prostate cancer in the most accurate way. In the study, prostate data consisting of 989 individuals, 200 thousand SNPs per each person and 18 phenotype variables were used. When the performance results of the model are considered; accuracy, precision and sensitivity values are 84,13%, 89,84% and 74,23% respectively. Given these results, the model has a good ability to predict prostate cancer.Keywords: Data mining applications in healthcare, Decision Trees, Stacking Method, K Nearest Neighbor Method, Naive Bayes Method, Genome Wide Association Studies, Single Nucleotide Polymorphismen_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBiyoistatistiktr_TR
dc.subjectBiostatisticsen_US
dc.subjectİstatistiktr_TR
dc.subjectStatisticsen_US
dc.subjectİşletmetr_TR
dc.subjectBusiness Administrationen_US
dc.titleVeri madenciliği yöntemi ile prostat kanseri için erken uyarı protokollerinin geliştirilmesi
dc.title.alternativeDevelopment of early warning protocols for prostate cancer by data mining method
dc.typedoctoralThesis
dc.date.updated2019-07-01
dc.contributor.departmentSayısal Yöntemler Anabilim Dalı
dc.subject.ytmNeoplasms
dc.subject.ytmProstatic neoplasms
dc.subject.ytmEarly warning systems
dc.subject.ytmClinical protocols
dc.subject.ytmData mining
dc.subject.ytmComputer protocols
dc.subject.ytmDecision tree
dc.subject.ytmBayes Estimation Method
dc.identifier.yokid10232650
dc.publisher.instituteSosyal Bilimler Enstitüsü
dc.publisher.universityİSTANBUL ÜNİVERSİTESİ
dc.identifier.thesisid537732
dc.description.pages145
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess