Turkish medical text parsing and classification
dc.contributor.advisor | Parlak, İsmail Burak | |
dc.contributor.author | Bardiz, Ahmet | |
dc.date.accessioned | 2020-12-04T13:09:19Z | |
dc.date.available | 2020-12-04T13:09:19Z | |
dc.date.submitted | 2019 | |
dc.date.issued | 2019-10-02 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/86872 | |
dc.description.abstract | Bu çalışma hastane yönetim sistemlerinde yer alan, uzman hekimler tarafından muayene edilen hastalara ait kayıtları referans alarak, hastaların şikayetleriyle ilgilenebilecek en muhtemel hastane branşını makine öğrenmesi yöntemleriyle tespit etmeyi kapsamaktadır. Fakat sınıflandırma aşamasından önce Türkçe dilinin yapısal ve anlamsal çözümlemesini yapmak gerekmektedir. Ayrıca bu çözümlemeyi medikal uzayda özelleştirmek de gerekir. Bu kapsamda Türkçe' nin sondan eklemeli bir dil olma özelliğini ve kendine özgü dil bilgisi kurallarını göz önünde bulundurmakla beraber, medikal sözlüklerle destekli bir şekilde metin ayrıştırma yöntemleri uygulanır. Bu çalışma kapsamında sınıflandırma performansını artırmak için Türkçe medikal kelime veya kelime gruplarını ayrıştıran ve semantik olarak anlamladıran bir medikal Türkçe doğal dil işleme servisi geliştirilmiştir. Bu servis üzerinde işlenip anlamlandırılan medikal metin verileri karar destek makineleri, çok terimli Naïve Bayes ve evrişimsel sinir ağları yöntemleri kullanılarak sınıflandırılmış ve yapılan testler sonucu en yüksek doğruluk oranı %98.16 olarak hesaplanmıştır. Ayrıca medikal Türkçe doğal dil işleme ve sınıflandırma katmanları paketlenerek, herhangi bir sistem veya web ortamına entegre olabilecek şekilde bir API olarak yayınlanmıştır. Sonuç olarak hastanenelerin online randevu sistemlerinde bu hizmetin kullanılmasıyla, hastaların şikayetleriyle örtüşen daha doğru ve özelleşmiş bir hastane branşına yönlendirilmesi hedeflenmiştir. | |
dc.description.abstract | This study includes approaches to identify the hospital departments with the methods of machine learning by referencing narratives of patients typed by expert physicians in the hospital information management systems. The main challenge is the preservation of semantic integrity while resolving the complex Turkish grammar rules on medical context. A Turkish medical parser was built and was characterized by specific abilities to extract medical entities and to act according to Turkish grammar. This parser identifies the syntactic, morphological, lexical and semantic features on the medical text. This parser basically discovers the misspellings, disassembles the possible morphemes of a term, assigns the optimal part of speech tags, gets rid of the morphemes that do not affect the semantic intensely and then decides to the best parse regarding the language and word2vec models. A medical corpus which includes patients' medical narrative records and hospital departments that corresponds to those narratives has become the basis for these studies. Additionally, a Turkish medical lexicon has been generated to extract medical entities. It consists of clinically favored terms that specify and differentiate diagnoses. These overall parsing steps provide to perform an exhaustive analysis of Turkish texts through the medical and agglutinative linguistic perspective. Secondly, the features extracted by this medical parser were used to predict hospital departments from patients' narrative records. The accuracies of the Multinomial Naïve Bayes, Support Vector Machines and Convolutional Neural Networks are evaluated to classify the medical content. The Support Vector Machines approach has acquired 98.16 % accuracy rate to classify hospital departments from medically parsed patients' narrative text. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilim ve Teknoloji | tr_TR |
dc.subject | Science and Technology | en_US |
dc.title | Turkish medical text parsing and classification | |
dc.title.alternative | Türkçe medikal metin ayrıştırma ve sınıflandırma | |
dc.type | masterThesis | |
dc.date.updated | 2019-10-02 | |
dc.contributor.department | Bilgisayar Mühendisliği Anabilim Dalı | |
dc.identifier.yokid | 10232288 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | GALATASARAY ÜNİVERSİTESİ | |
dc.identifier.thesisid | 563834 | |
dc.description.pages | 60 | |
dc.publisher.discipline | Diğer |