Literatürden bilgi çıkarımı; bir gerçek zamanlı web tabanlı metin madenciliği uygulaması

Oğuz Yolcular, Başak

dc.contributor.advisor	Zayim, Neşe
dc.contributor.author	Oğuz Yolcular, Başak
dc.date.accessioned	2020-12-02T12:06:57Z
dc.date.available	2020-12-02T12:06:57Z
dc.date.submitted	2016
dc.date.issued	2018-08-06
dc.identifier.uri	https://acikbilim.yok.gov.tr/handle/20.500.12812/31069
dc.description.abstract	Amaç: Bu çalışmanın amacı, Pubmed literatür veri tabanında bulunan makale özetleri kullanılarak, sağlık bakım profesyonellerine hasta bakımında veya klinik araştırmalarda ihtiyaç duydukları bilgiye (kanıta) erişimlerinde ve bilgiyi değerlendirmelerinde yardımcı olacak web tabanlı bir sistem geliştirmektir.Yöntem: Sistem geliştirme süreci, Pubmed literatür veri tabanından makale özetlerine erişim, metin madenciliği teknikleri kullanılarak metnin ön işlenmesi, medikal varlıkların etiketlenmesi, özetlerden amaç ve istatistiksel terimlerin çıkarımı ve web ara yüzü aracılığı ile gösterimini kapsamaktadır. Özetlere erişim için Biopython Kütüphanesi, medikal varlıkları etiketlemek için Becas Annotator web servisi, istatistiksel terimler için ise NCBO Annotator ve terimleri içeren bir liste kullanılmıştır. Özetlerdeki amaç cümleleri sözlük tabanlı olarak geliştirilen yeni bir algoritma ile çıkartılmaktadır. Etiketlenen varlıklar arasındaki ilişki örüntülerinin bulunması amacıyla birlikte bulunma frekansları hesaplanmaktadır. Bulgular: Özetler içerisinde etiketlenen varlıklar farklı renklerle vurgulanarak Pubmed benzeri bir ara yüzle kullanıcıya sunulmaktadır. Sistem erişilen makalenin amacını, çalışmada kullanılan istatistiksel terimleri otomatik olarak belirlemekte ve makaleye ait bazı özellikler ve etiketlenen medikal varlıklar ile birlikte tablo biçiminde kullanıcıya sunmaktadır. Farklı sınıflara ait kavramların birlikte bulunma frekansları tablo biçiminde ve grafiksel olarak sunulmaktadır. Amaç çıkarma modülünün kesinlik, hassasiyet ve f-ölçütü değerleri sırasıyla %95, %83,5, %90, istatistiksel terimleri çıkarma modülünün kısmi eşleşme değerlendirme sonuçları %95,4 kesinlik, %88,3 hassasiyet ve %91,7 f-ölçüt, tam eşleşme değerlendirme sonuçları sırasıyla %94,1, %67,8 ve %78,8 şeklindedir.Sonuç: Sistem Pubmed'te yer alan özetleri analiz ederek medikal bilgiye hızlı erişimi web tabanlı olarak sunmaktadır. Ayrıca literatürdeki diğer sistemlerle karşılaştırıldığında; (i) geniş çaptaki sınıflara ait varlıkları çıkartması (ii) farklı ara yüzlerle kullanıcıya daha hızlı gözden geçirme imkanı sunması ve (iii) ikiden fazla sınıfa ait varlıklar arasındaki ilişki örüntülerini çıkarması ile ayrıcalıklı olduğu görülmektedir.
dc.description.abstract	Objective: The aim of this study is to develop a web based literature mining system which retrieves Pubmed abstracts to provide tools for information search and evaluation needs of healthcare professionals and researchers in their research and clinical routines. Method: System development process includes retrieving abstracts from Pubmed literature database, text preprocessing by using text mining techniques, annotating and extracting medical entities, aim sentences and statistical methods of studies, and presenting the results through the web interfaces. In order to retrieve abstracts from Pubmed, a library called BioPython has been used. Becas annotator has been prefered to annotate the medical entities like disease, gene and protein, drug etc. A new algorithm based on dictionary-based method was developed to extract aim sentence of studies. Frequency distribution has been calculated to discover relationship between the tagged entities. Results: The system tags entities in different color in accordance with their classes and presents the results in a similar interface with Pubmed. It automatically extracts aim of a study and statistical terms used in a study and it demonstrates the results in a different interface with tabular format along with several features of article and the tagged medical entities. Based on the selected entity class by user, co-occurrence frequency of entities are calculated and presented in a table format and visualized with a bar chart. The aim extraction module achieved 83.5% recall, 95% precision and 90% f-measure and statistical term extraction module achieved 95.4% precision, 88.3% recall ve 91.7% f-measure in partial evaluation, 94.1% precision, 67.8% recall and 78.8% f-measure in exact evaluation.Conclusion: The system provides a web-based platform for mining medical information from Pubmed and it is unique in that it (i) extracts a wide range of entity classes; (ii) allows users to rapid review the results with different interfaces; and (iii) extracts not only binary relation but also relation between more than two entity types with multiple selection choices.	en_US
dc.language	Turkish
dc.language.iso	tr
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	Attribution 4.0 United States	tr_TR
dc.rights.uri	https://creativecommons.org/licenses/by/4.0/
dc.subject	Bilim ve Teknoloji	tr_TR
dc.subject	Science and Technology	en_US
dc.title	Literatürden bilgi çıkarımı; bir gerçek zamanlı web tabanlı metin madenciliği uygulaması
dc.title.alternative	Literature mining; A REAL-time WEB-based text mining application
dc.type	doctoralThesis
dc.date.updated	2018-08-06
dc.contributor.department	Biyoistatistik ve Tıbbı Bilişim Anabilim Dalı
dc.subject.ytm	Literature review
dc.subject.ytm	Knowledge
dc.subject.ytm	Information extraction
dc.subject.ytm	Real time search
dc.subject.ytm	Data mining
dc.subject.ytm	Web page
dc.subject.ytm	Text mining
dc.subject.ytm	Scientific information
dc.identifier.yokid	10123367
dc.publisher.institute	Sağlık Bilimleri Enstitüsü
dc.publisher.university	AKDENİZ ÜNİVERSİTESİ
dc.identifier.thesisid	435564
dc.description.pages	100
dc.publisher.discipline	Diğer

Files in this item

Name:: yokAcikBilim_10123367.pdf
Size:: 2.080Mb
Format:: PDF
Description:: File_10123367

View/Open

This item appears in the following Collection(s)

TEZLER

Show simple item record

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess