Show simple item record

dc.contributor.advisorSungur, Fethiye Aylin
dc.contributor.authorHamzaoğlu, Onurhan
dc.date.accessioned2020-12-07T09:56:22Z
dc.date.available2020-12-07T09:56:22Z
dc.date.submitted2019
dc.date.issued2020-02-26
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/127336
dc.description.abstractUyku insan yaşamında çok önemli bir faaliyettir. Ortalama bir insanın hayatının üçte birini uyuyarak geçirdiğini göz önünde bulundurursak, yaşamımızda ne kadar önemli bir yeri olduğunu görebiliriz. Sağlıklı bir yaşam için önerilen uyku süresi ergenlik çağındaki insanlar için 9-10 saat arasında değişirken yetişkinler için 6-8 saat önerilir. Fiziksel ve zihinsel sağlığı dengede tutmak için, sadece gerekli miktarda uyumak değil, aynı zamanda en verimli şekilde uyumak da dinlenmiş hissetmek için çok etkilidir. Bu bağlamda uyku hastalıkları konusunda bilinçlenme ön plana çıkmaktadır. Bu çalışma, OSA'nın şiddetinin belirlenmesinde şu faydaları sağlayacaktır. Her şeyden önce, zahmetli ve zaman alıcı testler gerek duyulmadığı taktirde elimine edilecek ve tanı maliyetleri düşürülecektir. İkincisi, tercih edilebilir olması sağlık uzmanlarına karar verme aşamasında kolaylık sağlayacaktır.Obstrüktif(tıkayıcı) uyku apnesi OSA, üst solunum yolunun tekrar tekrar tıkanması sonucu uyku sırasında kısmen veya tamamen nefes yolunun kapanması sonucu nefes alamam durumuna bağlı yaygın bir uyku bozukluğudur. OSA'nın yaygınlığı artış göstermekte ve beraberinde bazı tehlikeler getirmektedir. Erkeklerde daha yaygın görülen OSA, ilerleyen yaşlarda görülme olasıkığı da artmaktadır. Trafik kazalarına neden olmakta, yaşam kalitesini olumsuz etkileyen OSA, aynı zamanda bazı tehlikeli hastalıkları da tetiklemektedir. Hipertansiyon, kardiyovasküler hastalıklar ve kalp yetmezliği gibi sonuçlar yaratma tehlikesi olduğundan ölümcül olabilir. OSA'nın tedavi yöntemleri hastalığın şiddetine göre değişmektedir. Hafif OSA hastaları için kilo verme, sigarayı bırakma, daha az alkol alımı gibi yaşam tarzı değişiklikleri önerilmektedir. Uyku sırasında kullanılabilecek olan ağız aletleri ile hava yolunun açık kalmasının sağlanması veya pozisyonel uykuyu korumak için araçların kullanılması tavsiye edilebilir. Orta-şiddetli vakalarda sürekli pozitif hava basıncı-CPAP makinesi cerrahi gerekmedikçe tedavi için altın standart yöntemdir. Bunun da çözüm olmadığı durumlarda boyun bölgesini genişletmek için fazlalık dokuyu alma amacıyla ameliyat yöntemleri uyguanabilir.OSA'nın şiddeti apne-hipopne endeksi AHI kullanılarak şu şekilde sınıflandırılır:•5≤AHI≤15 değeri için hafif, •15≤AHI≤30 için orta, •AHI≥30 ise şiddetli Kişi en az 10 saniye nefes alamıyorsa bu duruma apne denir. Öte yandan, hipopne, üst solunum yolunun kısmen kapanmasına karşılık gelir ve her ikisi durum da kanda çözünen oksijen doygunluğunda düşüşe neden olur.OSA teşhisi aşamasında uygulanantanı yöntemleri uygulanması zahmeti, çok zaman alan ve pahalı yöntemlerdir. Bu nedenle, bu zahmetli süreci azaltacak veya ortadan kaldıracak daha hızlı, kolay ve etkili çözümler bulma arayışı doğmuştur. Makine öğrenmesi, bir programa açıkça programlamadan bir görevi yönetme yeteneği vermektir. Dijital verilerin artması ve bilgisayar teknolojilerinin gelişmesiyle birlikte ML'nin popülaritesi son yıllarda artmıştır. ML yaygın olarak sağlık, e-ticaret, robotik , görüntü işleme vb. alanlarda kullanılmaktadır. Bu çalışmada, yaklaşık 700 OSA hastasının 19 farklı özelliğini içeren veri kümesi ile ML modelleri oluşturularak şiddet tahminlemesi yapılmıştır. Süreçte iki farklı yaklaşım izlenmiştir. (a) Çok sınıflı tahmin (b) Orta ve şiddetli sınıfları bir sınıf ve hafif sınıf diğer olmak kaydı ile yapılan ikili sınıf tahmin. Veri analizi ve özellik seçimi aşamalarında hedef değişken ile bağımsız değişkenler arasındaki ilişkiyi ölçmek amacıyla ANOVA F-testi ve Chi-kare testi gibi istatistiksel yöntemlerin uygulanması sonucu ve önceki araştırmalardan yapılan çıkarımlar ve uzmanların da fikirleri doğrultusunda 9 değişken seçilmiştir. Bunlar:•Nümerik özellikler olarak: o minimum oksijen satürasyonu (p≤0.05), o vücut kitle indeksi (p≤0.05), o ESS (p≤0.05) o yaş.• Kategorik özellikler olarak: o cinsiyet (p≤0.05), o gündüz uykululuk hali(p≤0.05), o diyabet (p≤0.05) o dislipidemi (p≤0.05) o sigara kullanma durumu Dengesiz veri setleri ile çalışmak çoğu ML yöntemi için engel yaratabilir ve sonuçları yanıltıcı olabilir. DT ve RF gibi bazı algoritmalar dengesiz veriye daha dayanıklıdır. Öğrenme verilerine temel ML algoritmaları uygulandıktan sonra, LR, RF, MLP ve Oylama sınıflandırıcıları eğitim verilerinde neredeyse mükemmel şekilde sınıfları öğrenip tahmin edebildiği gözlenmiştir. Ancak hiçbir model test verisinde aynı performansı gösteremeyip azınlık sınıfını doğru olarak tahmin edememektedir. Bu tür durumların üstesinden gelmek için aşırı örnekleme yöntemleri kullanışlıdır. Çoğunluk sınıfının sayısının azaltılarak azınlık sınıfı boyutuna getirilmesi ile dengeyi sağlayan rastgele aşağı örnekleme (RUS), Tomek Bağlantıları, ve sentetik örneklemler üreterek veri boyutunu arttıran ve azınlık sınıfını çoğunluk sınıfı seviyesene çeken yukarı örnekleme yöntemi olarak da Sentetik Azınlık Aşırı Örnekleme Tekniği (SMOTE) ve SVM-SMOTE, Sınırdoğrusu-SMOTE gibi SMOTE varyantları,ile veri dengesizliğini giderme ve verinin ayırıcı özelliğini arttırma amacıyla uygulandıktan sonra yeni eğitim kümeleri oluşturuldu.Bu işlemlerin sonunda seçilen değişkenler kullanılarak, bahsedilen çoklama yöntemleri uygulandıktan sonra oluşturulan modellerin performansları ölçülmüş ve sonuçlar benzer çalışmaların sonuçları ile karşılaştırılmıştır. Sonuçlar yüzde cinsinden verilmiştir. Sonuç olarak, örnek veriler kullanılarak oluşturulan hemen hemen tüm modeller, temel modellere rağmen azınlık sınıfının öngörülmesinde iyileşme göstermiştir. Örnekleme ile çok sınıflı tahmini için elde edilen en iyi ölçümler, Sonuç olarak, çoklu sınıf yaklaşımda, %71 genel doğruluk, %58 dengeli doğruluk, %73 ve %74 ağırlıklı hatırlama ve hassasiyet elde edildi. İkili sınıf yaklaşımda %88 genel doğruluk, %70 dengeli doğruluk %92 ve %98 ağırlıklı hatırlama ve hassasiyet elde edildi.Bu çalışma, makine öğrenme yöntemleri kullanılarak öğrenmesi zor dengesiz veriler üzerindeki OSA tahmininde bir gelişme olduğunu göstermiştir. Gerektiğinde örnekleme yöntemleri sınıflar arasındaki dengesiz dağılımın önüne geçilmesi ile sınırlı sayıda değişken kullanılarak ayrımcılık gücünün arttırılabileceğini göstermiştir. Gelecekteki çalışmalarda daha dengeli, çeşitli ve aydınlatıcı veriler kullanmak ve örneklem büyüklüğünü arttırmak büyük olasılıkla performansın artmasının önünü açacaktır.
dc.description.abstractSleeping is a very important activity in human life. Considering that an average person spends one third of his or her life sleeping, we can see that it has a significant importance in our lives. The recommended sleep time for a healthy life 9-10 hours for people in puberty age, and 6-8 hours for adults. Not only the getting necessary time of sleep is important, but also the quailty of the sleep is very effective in order to feel rested as well as keeping physical and mental health balanced. In this context, awareness of sleep diseases come to the fore. Obstructive sleep apnea (OSA)is a common sleep disorder that is inability to breathe partially or completely during sleep as a result of blockage of the upper airway repeatedly. Its consequences such as hypertension, cardiovascular disesase, and heart failure may be fatal. Treatment methods of OSA may vary in severity. For mild patients lifestyle changes like losing weight, quit smoking, less alcohol intake are suggested. For moderate-severe cases, CPAP machine is the gold standart method for treatment unless surgery is necessary. The severity of OSA is decided using AHI. It is called mildif 5≤AHI≤15, moderatefor 15≤AHI≤30, and severe if AHI≥30. Tests for diagnosing OSA take a lot of time, and expensive. It is necessary to find easy, effective solutions in detection process. Machine learning is to give a program the ability to manage a task without explicity programming it. With the increase of digital data, and computing power ML's popularity increased in recent years.The common applied ML solution fields are healthcare, e-commerce etc. In this study, ML solutions are applied to approximately 700 OSA patients with 19 features. Two approaches are done (a)Multi-class prediction (b)Binary-class prediction by counting moderate and severe classes as one class and mild class another. After applying data analysis and feature selection methods, and counting field experts' suggestions, 9 variables are fed into ML models which are minimun oxygen saturation(p≤0.05), body mass index(p≤0.05), ESS (p≤0.05), age as numerical features, and gender(p≤0.05), daytime sleepiness(p≤0.05), diabetes(p≤0.05), and dyslipidemia(p≤0.05), smoking as categorical features.Working with imbalanced is a roadblock to get good results as well as a hard task. Some algorithms more robust to imbalanced data such as DT and RFs. After applying base models to training data, LR, RF, MLP and Voting classifiers are seem to overfit to training data since they look like able to predict different classes in nearly perfect in training data but none of them is able to predict minority class correctly on test data. Oversampling methods are come in handy to overcome this kind of situation. Random under sampling(RUS), Tomek Links, Synthetic Minority Oversampling Technique(SMOTE) and its variants i.e. SVM-SMOTE, Borderline-SMOTE are applied to data combined with boosting method. As a result, almost all models created by using sampled data showed improvement in prediction of minority class inspite of base models. RUS achieved best discrimination with respect to minorty predcition in binary-class prediction. As in mutli-class prediction, SVM-SMOTE and Borderline-SMOTE showed best improvement. Best metrics achieved for multi-class prediction with sampling are precision 74%, recall 73%, and 58% overall accuracy. As in binary-class prediction weighted precision calculated as 97.8%, recall as 98.5% and overall accuracy as 88% and weighted accuracy as 70% with the most number of correct predictions in minority class. This study showed an improvement in OSA prediction on hard-to-learn imbalanced data using machine learning methods, and demonstrated that the discrimination power can be increased by using a limited number of variables with oversampling approaches when necessary. Using more balanced and diversed data, and increasing sample size is most likely result in improved performance.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectBilim ve Teknolojitr_TR
dc.subjectScience and Technologyen_US
dc.subjectHalk Sağlığıtr_TR
dc.subjectPublic Healthen_US
dc.titleMachine learning approach for predicting severity of obstructive sleep apnea syndrome
dc.title.alternativeObstrüktif uyku apnesinin şiddetinin tahminlenmesinde makine öğrenmesi yaklaşımı
dc.typemasterThesis
dc.date.updated2020-02-26
dc.contributor.departmentHesaplamalı Bilimler ve Mühendislik Anabilim Dalı
dc.identifier.yokid10314440
dc.publisher.instituteBilişim Enstitüsü
dc.publisher.universityİSTANBUL TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid612214
dc.description.pages73
dc.publisher.disciplineHesaplamalı Bilim ve Mühendislik Bilim Dalı


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess