Tıbbi görüntü veri setlerinde matlab ile büyük veri teknikleri uygulaması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Son yıllarda tıbbi görüntüler, hastalık teşhisi, tıbbi araştırma ve eğitimde önemli bir rol oynamaktadır. Günümüzde teknolojinin gelişmesiyle tıbbi görüntü çeşitleri de artmıştır. Bu artan görüntülerin geleneksel yöntemlerle etkin ve verimli bir şekilde depolanması, aranması, paylaşımı ve analiz edilmesi için de zorluklar ortaya çıkmıştır. Bu çalışmada, MATLAB ile Hadoop MapReduce kullanarak akciğer nodüllerinin iyi huylu ya da kötü huylu olup olmadığının sınıflandırılması için Bilgisayar Destekli Tanı (Computer Aided Diagnosis - CAD) sistemini önerdik. Sistem, radyologlar tarafından Bilgisayarlı Tomografi (Computed Tomography - CT) görüntü veri setinden benzer nodüllerin görüntülerini kullanıcıya aktarmaktadır. Tıbbi görüntü veri seti, Hadoop'un Dağıtılmış Dosya Sistemi'nde (Hadoop Distributed File System - HDFS) saklanıp, görüntülere MATLAB aracılığıyla erişim sağlanmaktadır. MapReduce kullanılarak çoklu özniteliklerin paralel olarak elde edilmesi için İçerik-tabanlı Görüntü Erişimi (Content-based Image Retrieval - CBIR) yaklaşımı kullanılmıştır. Şekil, doku ve radyolog sayısal görüntü (Radiologist Quantified Image - RQI) öznitelikleri dâhil olmak üzere en uygun 26 öznitelik kümesi tanımlanmıştır. Bu öznitelikleri değerlendirmek için farklı SVM ve KNN sınıflandırıcıları kullandık. Deney sonuçlarımız, MATLAB'ta yerel MapReduce yönteminin, Hadoop küme MapReduce yönteminden ~ 5 kat daha hızlı olduğunu göstermektedir. SVM, sınıflandırıcılara göre %95.27 doğruluk (accuracy), %96.32 anma (recall), %94.76 kesinlik (precision) ve %95.53 F-skoru oranıyla daha başarılı sonuçlar elde edilmiştir. In the recent years, medical images played an important role in disease diagnosis, medical research and education. Today with the advances in technology in medical image capture devices and the huge increase in the number of medical images, challenges have emerged to retrieve and store relevant images to the user query efficiently and accurately. Furthermore, it is impossible to maintain and handle with this image using the conventional method. In this work, we presented a Computer-Aided Diagnosis (CAD) system for classifying lung nodules as either benign or malignant by using Hadoop MapReduce with MATLAB. The system retrieves images of similar nodules from a big publicly available Computed Tomography (CT) images dataset annotated by radiologists. They are stored in Hadoop Distributed File System (HDFS) and accessed via the MATLAB. A content-based image retrieval (CBIR) approach was used in order to extract multiple features parallely by using the MapReduce. An optimal set of 26 features was defined, including shape, texture, and Radiologist Quantified Image (RQI) features. We used different SVM and KNN classifiers to evaluate these features. Our experimental results show that the Local MapReduce method is ~5 times faster than Hadoop cluster MapReduce method in MATLAB. The proposed method improves the retrieval result to 95.27%, 96.32%, 94.76% and 95.53% in accuracy, recall, precision and F-score respectively using the SVM classifier.
Collections