An analysis of peculiarity oriented interestingness measures on medical data
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Diğer verilerden dikkat çekici şekilde ayrılan ve göreceli olarak az sayıda bulunan örüntüler olağandışı veri olarak nitelenmekte ve bu tip veriler ilginçlik ölçümü için en çarpıcı adaylar arasında yer almaktadır. Klinik çalışmalarda olağandışı veriler hemen müdahale edilmesi gereken bir tümör ya da hastalığa ilişkin sinyal niteliği taşımaktadır. Bu verilere ilişkin kuralların ve bu verileri oluşturan düzeneklerin keşfi, daha gelişmiş tıbbi karar destek sistemlerinin oluşması için anlamlı bir katkı olacaktır.En ilginç veri ve örüntülerin bulunabilmesi için olağandışılık kavramını temel alan pek çok ilginçlik ölçütü ortaya atılmış, ancak bu ölçütler gereksinimin ancak kısıtlı bir bölümünü karşılamıştır. Bu çalışmada LOF(?Local Outlier Factor?; Yerel Aykırılık Ölçütü), CBLOF(?Cluster Based Local Outlier Factor?; Küme Temelli Yerel Aykırılık Ölçütü) ve RPF (?Record Peculiarity Factor?; Kayıt Olağandışılık Ölçütü) ilginçlik ölçütleri karşılaştırılmış, söz konusu ölçütlerin teorik altyapılarından kaynaklı öngörüler sentetik veriler ve gerçek tıbbi veri kullanılarak deneysel olarak değerlendirilmiştir. Sonuçlar ilginçlik bağlamında tartışılmış ve veri tabanlarında bilgi keşfi için daha gelişmiş bir yöntemin altyapısını oluşturacak hareket noktaları ortaya konmuştur. Peculiar data are regarded as patterns which are significantly distinguishable from other records, relatively few in number and they are accepted as to be one of the most striking aspects of the interestingness concept. In clinical domain, peculiar records are probably signals for malignancy or disorder to be intervened immediately. The investigation of the rules and mechanisms which lie behind these records will be a meaningful contribution for improved clinical decision support systems.In order to discover the most interesting records and patterns, many peculiarity oriented interestingness measures, each fulfilling a specific requirement, have been developed. In this thesis well-known peculiarity oriented interestingness measures, Local Outlier Factor (LOF), Cluster Based Local Outlier Factor (CBLOF) and Record Peculiar Factor (RPF) are compared. The insights derived from the theoretical infrastructures of the algorithms were evaluated by using experiments on synthetic and real world medical data. The results are discussed based on the interestingness perspective and some departure points for building a more developed methodology for knowledge discovery in databases are proposed.
Collections