Bulanık yerel bilgi c-ortalamalar algoritmasıyla histopatolojik görüntü bölütleme
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzün en ciddi sağlık problemlerinden biri olan kanser dünya üzerindeki ölüm sebepleri arasında üst sıralarda yer almaktadır. Farklı yaşlarda ve özelliklerde milyonlarca insan kanser türlerinden birine yakalanmakta ve birçoğu bu hastalık sebebiyle hayatını kaybetmektedir. Kanser hastalığında en önemli hususlardan biri hastalığın erken safhalarda teşhis edilmesidir. Erken teşhisle hastalığın yenilmesi mümkün olabilmektedir. Kanserin teşhisi ile ilgili çalışmalar yapan bilim dalı patoloji, bu alanda uzmanlaşan doktorlar patolog olarak adlandırılmaktadır. Hastalıklı dokuların incelenmesi zor ve zaman alıcı bir iş olduğundan kanserin erken teşhisinde patoloji bilimine önemli görevler düşmektedir. Ayrıca uzman doktorun tecrübesi doğru teşhis açısından önem arz etmektedir. Zaman zaman doktor tecrübesizliği nedeniyle hatalı teşhis ve tedaviler yapılabilmektedir. Gelişen teknoloji sağlık alanına da her geçen gün yeni katkılar sunmaktadır. Görüntüleme tekniklerinin gelişmesiyle patolojik görüntülerin sayısal ortama aktarılabilmesi mümkün olmuştur. Sayısal ortama aktarılan görüntüler sayısal histopatolojik görüntü olarak adlandırılmaktadır. Histopatolojik görüntüler bir çok doktor tarafından ortak bir mekanda aynı anda incelenebilmekte ve bu durum hastalıkların teşhisinin daha isabetli olmasını sağlamaktadır. Ayrıca bu yöntem uzaktan bağlantı ile aynı ortamda bulunmayan patologların da desteklerinin alınabilmesini sağlamaktadır. Patolojik görüntülerin sayısallaştırılmasının bir diğer avantajı ise histopatolojik görüntülerin bilgisayar ortamında işlemeye uygun olmasıdır. Bu sayede doktorların üzerine düşen iş yükünü hafifletecek bilgisayar destekli teşhis sistemlerinin geliştirilmesi mümkün olmaktadır.Kanserin teşhisi için hücresel yapıların analizi büyük bir öneme sahiptir. Özellikle hücre çekirdeklerinin şekli, boyutu ve belirli bir alandaki sayısı kanserin teşhisinde belirleyici rol oynamaktadır. Bu nedenle literatürde hücresel yapıların bölütlenmesi ve elde edilen sonuçların yorumlanması üzerine çeşitli çalışmalar yapılmaktadır. Bilgisayar destekli teşhis sistemlerinin ilk kademesini histopatolojik görüntünün işlenmesi ve hücresel yapıların doğru bir şekilde bölütlenmesi oluşturur. Bu tez çalışmasında bilgisayar destekli teşhis sistemlerinin ilk kademesini oluşturacak şekilde görüntünün işlenmesine ve hücre çekirdeklerinin bölütlenmesine yönelik algoritmalar geliştirilmiştir. Yapılan çalışmada ilk olarak histopatolojik görüntünün elde edilme süreci incelenmiştir. Bu süreçte hücresel yapılar üzerinde hangi işlemlerin uygulandığı ve ne tür bozulmalar olduğu araştırılmıştır. İnceleme sonucu, kullanılacak yöntemlerin başarımını arttıracak değerlendirmeler yapılmıştır. Sonrasında görüntünün işlenmesi ve bölütlenmesi gerçekleştirilmiştir. Bölütleme işleminde ilk olarak bölütleme süresini kısaltmak amacıyla histopatolojik görüntülerin boyutu küçültülmüştür. Bu işlem görüntüyü bozmayacak ve bölütleme başarımını azaltmayacak oranda yapılmıştır. Sonrasında görüntüye gürültüyü bastırırken aynı zamanda görüntünün keskinliğini koruyan medyan filtre uygulanmıştır. Uygulanan önişlem adımlarının ardından histopatolojik görüntüler üç farklı yöntem ile kümelenmiştir.Görüntü öncelikle K-ortalamalar ve Bulanık C-ortalamalar yöntemleriyle kümelenmiştir. Bu yöntemlerle yapılan kümeleme işlemlerinde benzer sonuçlar elde edilmiştir. Her iki yöntemde de bölütleme için küme sayısı 2 olarak seçildiğinde çekirdeklerle birlikte hücre çeperleri de çekirdek olarak kümelenmiştir. Küme sayısı 4 olarak seçildiğinde ise birçok çekirdek, çekirdek olarak kümelenememiştir. Görüntüler 3 kümeye ayrıldığında daha başarılı kümeleme sonucu elde edilmiştir. Ancak bu yöntemlerin homojen olmayan bazı hücre çekirdeklerini bölütleyemedikleri görülmüştür. Homojen olmayan yapıların düzgün bir şekilde kümelenmesine yönelik görüntüyü hem global hem de yerel olarak inceleyen Bulanık Yerel Bilgi C-ortalamalar Algoritmasının başarımı araştırılmıştır. Bu yöntem görüntünün incelenmesi esnasında yerel bir pencere kullanmakta ve o bölgedeki komşu pikselleri bir arada değerlendirmektedir. Pencere boyutunun değişimi kümeleme başarımını etkilemektedir. Yapılan analizlerde çeşitli pencere boyutları ve küme sayılarına göre testler gerçekleştirilmiş ve optimum pencere boyutu 3x3 ve küme sayısı 4 olarak tespit edilmiştir. Uygun boyutta seçilen yerel pencere ve Bulanık Yerel Bilgi C-ortalamalar Algoritması kümeleme başarımının oldukça artmasını sağlamıştır. Bu yöntemle homojen olmayan hücre çekirdekleri de doğru bir şekilde kümelenebilmiştir. Kümeleme sonrasında görüntü bölütleme başarımını arttıracak bazı son işlem adımlarıyla işlenmiştir. Kümelenen görüntü ilk olarak morfolojik işlem uygulanabilecek şekilde ikili yapıya (binary) dönüştürülmüştür. Bu işlemin sonrasında görüntü, morfolojik aşınma ve genişletme işlemlerinin art arda uygulanması olan açma işlemine tabi tutulmuştur. Açma işlemi ile görüntü içindeki küçük nesnelerin temizlenmesi sağlanmıştır. Ayrıca birbirine yakın olan ve temas eden çekirdeklerin bir miktar ayrılmaları sağlanmıştır. Açma işleminin ardından görüntüye ikili büyük nesne analizi uygulanmıştır. Analiz ile görüntü içindeki bütün nesneler tespit edilmiş, hücre çekirdeği olamayacak kadar küçük nesneler elenmiştir. Bazı hücrelerin temas etmesi veya üst üste gelmesi nedeniyle normalde çekirdek olamayacak kadar büyük yapılar bu hususlar göz önünde bulundurularak elenmemiştir. Çekirdek harici nesnelerin elenmesi ile bölütleme işlemi sonlandırılmıştır. Yapılan çalışmada algoritmaların bölütleme başarımlarının test edilmesi amacıyla Harvard Üniversitesi Beck Laboratuvarında elde edilen, aynı zamanda uzman doktorlar tarafından işaretlenmiş kesin referans görüntüleri bulunan, böbrek hücre karsinomuna ait veri seti kullanılmıştır. Veri setinde bulunan görüntülerden, daha önceki çalışmalarda da kullanılan 64 adet histopatolojik görüntünün bölütlenmesi yapılmıştır. Bölütleme başarımının ölçülmesi için daha önce bu veri seti kullanılarak yapılan çalışmalarla aynı başarım ölçütleri kullanılmıştır. K-ortalamalar Algoritması ile bölütlenen görüntüler için Gerçek Pozitif Oranı %65.91, Bulanık C-ortalamalar Algoritması ile yapılan bölütlemede Gerçek Pozitif Oranı %66.04 olarak hesaplanmıştır. Görüntüye uygulanan önişlem ve son işlem adımları sayesinde bu iki yöntemin başarımı literatürde daha önce yapılan çalışmalara göre daha yüksek çıkmıştır. Ayrıca hesaplanan diğer başarım ölçütleri Kesin İsabet, F-Ölçütü, Gerçek Negatif Oranı ve Örtüşme değerlerinde de iyileşmeler meydana gelmiştir. Çekirdek bölütlemesini daha yüksek başarımla gerçekleştiren Bulanık Yerel Bilgi C-ortalamalar Algoritması için ise Gerçek Pozitif Oranı %73.10 olarak hesaplanmıştır. Bu değer literatürde yapılmış diğer çalışmalarda elde edilen en başarılı sonuçlara oldukça yakındır. Ayrıca Gerçek Pozitif Oranı kendinden daha yüksek olan yöntemlerle karşılaştırıldığında Bulanık Yerel Bilgi C-ortalamalar Algoritması en yüksek Kesin İsabet, F-Ölçütü, Gerçek Negatif Oranı ve Örtüşme değerlerine sahiptir. Bu yöntemin çekirdekleri bölütlemede oldukça başarılı olduğu görülmüştür. Bu tez çalışmasında geliştirilen algoritmalarla hücre çekirdeklerinin başarılı bir şekilde bölütlenmesi sağlanmıştır. Gerçekleştirilen görüntü işleme adımları ve kümeleme algoritmaları bilgisayar destekli teşhis sistemlerinin ilk kademesini oluşturacak niteliktedir. Bu aşama sonrasında bölütlenen hücre çekirdeklerinin boyut, sayı ve şekillerini detaylı olarak yorumlayacak otonom sistemlerin oluşturulması mümkün olmaktadır. Cancer which is one of the most serious health problem of today is one of the leading causes of death in the world. Millions of people of different ages and characteristics develop one of the cancer types and many of them die from this disease. One of the most important issue for cancer is finding the disease at an early stage. It is more likely to overcome the disease with early diagnosis. The science which makes research on diagnosis of cancer is called as pathology and doctors specializing in this science are called as pathologists. Because the examination of diseased tissues is difficult and time consuming, the pathology science has an important role in early detection of cancer. Furthermore, the experience of the specialist doctor has great importance for the correct diagnosis. Sometimes, doctors may make misdiagnosis and malpractice because of inexperience.Developing technology presents new contributions to health field every day. With the development of imaging techniques, it is possible to transfer pathological images to digital media. Images transferred to digital media are called digital histopathological images. Histopathological images can be examined by many doctors at the same time in a common place and this makes the diagnosis of diseases more accurate. Furthermore, opinion of the doctors who are far from consultation place can be got with the remote connection. Another advantage of digitization of pathological images is that histopathological images are suitable for processing on computer. With the aid of histopathological images, it is possible to develop computer aided diagnosis (CAD) systems that will reduce the workload on the doctors.The analysis of cellular structures has a great importance for the diagnosis of cancer. Especially the number of nuclei in specified area, nuclei shape and size play a decisive role in the diagnosis of cancer. Owing to this reason, various studies have been carried out in the literature on the segmentation of cellular structures and the interpretation of the obtained results. The processing of the histopathological images and accurate segmentation of the cellular structures create the first stage of computer aided diagnosis systems. In this thesis study , algorithms for image processing and accurate segmentation of cell nuclei have been developed to form the first stage of computer aided diagnosis systems.The process of obtaining the histopathological images is examined firstly in this thesis study. It has been investigated what processes are applied on cellular structures and what kind of artefacts occur during obtaining images. As a result of the examination, evaluations are made to enhance the performance of the methods to be used. After that, processing and segmentation of histopathological images are carried out.Firstly, the size of the histopathological images is reduced in order to shorten the time of segmentation in the pre-processing stage. This down sampling is applied the histopathological images in a such way that it does not reduce segmentation performance. Secondly, images are passed through a median filter that removes the noise while preserving the sharpness of the image . After the pre-processing steps, histopathological images are clustered with three different methods.The histopathological images are firstly clustered with K-means and Fuzzy C-means Algorithms. These methods give similar clustering results that are very close to each other. In both two methods, when the number of clusters is selected as 2 for segmentation, the cell walls are clustered as nuclei. When the number of clusters is selected as 4 for segmentation, a lot of nuclei cannot be clustered as nuclei and they clustered as other cellular structures. When clustering is carried out with 3 clusters, more successful clustering results are obtained. However, it is observed that this methods cannot segment some non-homogenous cell nuclei. Non-homogenous cell nuclei contain pixels having the same color with other cell structures such as fat and blood tissues. Consequently, K-means and Fuzzy C-means which make global assessment during segmentation cannot sense these pixels. Also, some artifacts may be segmented as cell nuclei. For overcoming of this problem, a method considering not only global assessment but also information of local area is needed. Therefore, Fuzzy Local Information C-means Algorithm which combine general Fuzzy Cmeans Algorithm and information of local area is used for increasing the success of clustering. This method uses a local window during the examination of the image and evaluates the neighboring pixels in local window together. Changes in the size of the window affects the success of the clustering. For this reason, segmentation success of Fuzzy Local Information C-means Algorithm is analyzed in terms of cluster number and window size. In the analysis, the optimum window size is determined as 3x3 and the proper cluster number is 4. The optimum local window size and Fuzzy Local Information C-means Algorithm have significantly increased clustering performance. Moreover, non-homogeneous cell nuclei is clustered correctly. After clustering, the image is processed with some post-processing steps to enhance segmentation success.At the post-processing step the clustered images are firstly converted into a binary structure as cell nuclei and background so that morphological processing can be applied. After that, morphological opening process which is an erosion followed by a dilation is utilized to binarized images. Small objects inside the images are cleared by opening process. In addition to this, cell nuclei which are close to each other or overlapping are separated in a small amount. After the opening process, binary large object analysis (BLOB) is applied to the opened images. All objects in the images are identified by BLOB analysis and objects which are small than a nuclei size are extracted from the image. Due to the some touching or overlapping cells, object that are larger than a normal nuclei size are not eliminated by taking these issues into consideration. Segmentation process is finished by extracting of non-nuclei objects from the image.In this thesis study, the data set of kidney cell carcinoma obtained by Harvard University Beck Laboratory, which has the ground truth marked by specialist pathologists, is used to evaluate segmentation success. 64 histopathological images which are also used in previous studies are segmented from the dataset. The performance metrics which are same with previous works using same dataset are chosen in order to measure the segmentation performance. The True Positive Rate (TPR) is 65.91% for the images segmented by K-means Algorithm and 66.04% for the images segmented by Fuzzy C-means Algorithm. Thanks to the pre-processing and post-processing steps applied to the image, the segmentation performance of these two methods is higher than the previous studies in the literature. Furthermore, the other performance metrics which are Precision, F-Measure, True Negative Rate (TNR) and Overlap are enhanced. The True Positive Rate is 73.10% for the images segmented by Fuzzy Local Information C-means Algorithm that segments nuclei higher success. This result is very close to the most successful segmentation results obtained in other studies in the literature. In addition, the Fuzzy Local Information C-means Algorithm has the highest Precision, F-Measure, True Negative Rate and Overlap values as compared to methods with a higher True Positive Rate. Consequently, this method has been observed to be very successful in segmentation of nuclei.In this thesis study, cell nuclei in histopathological images are segmented successfully by developed algorithms. The performed image processing steps and clustering algorithms constitute the first stage of computer aided diagnosis systems. After this stage, it is possible to create automatic systems that evaluate the size, number and shapes of the segmented cell nuclei.
Collections