Diagnosis of pulmonary diseases from lung sounds by machine learning algorithms
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada, literature bulunan birçok özellik çıkarım metodunun göğüs hastalarına ait ses-verileri üzerindeki uygulanabilirliği; yapay sinir ağları ve diğer makine öğrenme algoritmaları kullanılarak astım hastalığının teşhisi amacıyla incelenmiştir. Çalışmada kullanılan ses verileri Gaziantep Üniversitesi Tıp Fakültesi uzmanlarınca kaydedilmiştir.Çalışma temel olarak; seslerin filtrelenmesi, özellik çıkarımı, özellik eleme ve sınıflandırma şeklinde dört alt işlem grubundan oluşmaktadır. Filtreleme kısmında, giriş sesleri hiçbir filtreleme işlemine tabi tutulmadan veya ses örneklerindeki muhtemel gürültü etkilerini azaltmak, lüzumsuz frekans bölgelerini çıkarmak ve böylece öğrenme algoritmalarının sınıflandırma performansını arttırmak amacıyla, çeşitli filtrelere (dijital BandPass veya lineer olmayan Teager ve Median filtreleri) tabi tutularak kullanılmıştır. Özellik çıkarımı kısmında, giriş seslerini özellik vektörlerine dönüştürmek için; MFCC, LPC, zaman domeni ve fonetik özellik çıkarım metotları kullanılmıştır. Çalışmada kullanılan özellik çıkarım metotları genel olarak giriş seslerini birçok küçük zaman parçacıklarına bölüp, daha sonra çıkışlarını tüm bu parçacıklara ait özellik vektörlerinin toplamından oluşan bir set olarak üretmektedirler. Bu sebeple, sözü edilen çoklu özellik vektörlerinin teke indirgenmesi ve ayrıca özellik vektörünün uzunluğunun tespiti için; Ortalama, Standart Sapma, Skewness ve Kurtosis gibi istatistiksel metotlardan faydalanılmıştır. Özellik eleme kısmında, elde edilen özellik vektörlerine Chi-Square istatistiksel eleme algoritmasının uygulanmasının etkileri incelenmiştir. Son olarak yapılan incelemeler bir benzetim ortamında gösterilip sonuçlar tablolanmıştır. In this study, applicability of various most used feature extraction methods of the literature has been examined over lung sounds by Neural Networks and other Machine Learning Algorithms for the diagnosis of pulmonary diseases with the focus on Asthma. The sound dataset used in the study was collected by the medical experts of Gaziantep University Medical Faculty.Mainly the study is consisted of four sub-processes such as; filtering, feature extraction, feature selection and classification. In the filtering step, the input sound dataset either used without any filtering process or various filters (digital BandPass or non-linear Teager and Median filters) were applied to the input dataset for attenuating the possible noise effects in the sound samples and eliminating the useless frequency regions, thus enhancing the classification performance of the target classification algorithms. Then in the feature extraction step, Mel frequency Cepstral coefficients (MFCC), linear predictive coefficients (LPC), time domain features and phonetic features were used to transform the input dataset into feature vectors. Feature extraction algorithms that were used for the thesis study mostly divided the sound samples into multiple ?window chunks? and then produced their outputs as a series of feature sets belonging to these windows. So the unification of these multiple feature sets into a single feature vector and the determination of the feature vector length was done with the use of statistical methods such as; Mean, Standard Deviation, Skewness and Kurtosis. Then the Chi-Square feature selection algorithm was applied to feature vectors for dimensionality reduction. Lastly, the classification process was performed through a computer simulation environment and the results were plotted.
Collections