A framework for ranking and categorizing medical documents
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tezde, tıbbi alandaki yazılı dökümanların bilgi erişim sistemlerinde sıralanması ve sınıflandırılmasını için bir model çerçeve sunulmaktadır.Bu çalışmanın katkıları tıbbi metin belgelerinn erişim ve sıralanması için bir benzerlik modelin ve bu belgelerin sözlüksel sentaktik kalıp özelliklerine dayanan bir kural- tabanlı sınıflandırma yönteminin öne sürülmeleridir.Benzelik modelini üç özelliği birleştirerek,belgeler ve belgelerin yapıları arasındaki ilişkileri biçimlendirmek için formüle edilmiştir. Erişilen metinleri, konularına dayanarak; yüksek derecede ilgili belgeleri listenin en üst sıralarına yerleştirmek sıralama amaçlanmıştır. Bu model OHSUMED (TREC-9) koleksiyonunda konuya ait sıralama,anımsama ve hassaslık metriklerine dayanarak fayda performansını göstermek için uygulanmıştır.Ayrıca, Rolex-SP (Rules of Lexical Syntactic Patterns) adında, metin belgelerini sınıflandırmak için özellikler dizisi olarak sözlüksel sentaktik kalıp özelliklerine dayanan kural tabanlı metin sınıflandırıcıların otomatik sonuç çıkarabilecekleri bir metod sunmaktayız. Önerilen yöntem çok sınıflı tasnif problemlerini çözmek ve alana özel metin belgelerindek Idengesizlik alanındaki dengesizlik problemlerini aşabilmek için önerilmiştir. Bunun yanında sunulan metod önceden tanımlanabilen karakteristiklere dayanarak metinleri kategorize edebilir. Bu karakteristikler içinde kullanıcıya özel tanımlamalar, alana özel tanımlamalar, ve arama motorlarında belge taramaya yardımcı olup sorguyla ilgili belgeler arasında kullanıcının seçim yapabilmesine yardımcı olan sorguya dayalı sıralamala tanımları sayılabilir Rolex-SP uygulanabilirliğini göstermek için, OHSUMED üzerinde deneyler yapılmıştır. Sonuçlar, Rolex-SP'nin kısa tıbbi metin belgelerinin sıralandırılmasında, var olan teknolojilerin son durumundan daha iyi verim verdiğini göstermiştir. In this dissertation, we present a framework to enhance the retrieval, ranking, and categorization of text documents in medical domain. The contributions of this study are the introduction of a similarity model to retrieve and rank medical text-documents and the introduction of rule-based categorization method based on lexical syntactic patterns features.We formulate the similarity model by combining three features to model the relationship among document and construct a document network. We aim to rank retrieved documents according to their topics; making highly relevant document on the top of the hit-list. We have applied this model on OHSUMED collection (TREC-9) in order to demonstrate the performance effectiveness in terms of topical ranking, recall, and precision metrics.In addition, we introduce ROLEX-SP (Rules Of LEXical Syntactic Patterns); a framework for automatically inducing rules to build text classifiers based on lexical syntactic patterns as a set of features to categorize text-documents. The proposed method is dedicated to solve the problem of multi-class classification and feature imbalance problems in domain specific text documents. Furthermore, our proposed method is able to categorize documents according to a predefined set of characteristics such as: user-specific, domain-specific, and query-based categorization which facilitates browsing documents in search-engines and increase users ability to choose among relevant documents. To demonstrate the applicability of ROLEX-SP, we have performed experiments on OHSUMED (categorization collection). The results indicate that ROLEX-SP outperforms state-of-the-art methods in categorizing short-text medical documents.
Collections