Hastalık salgınlarının internet erişim ve arama verisi kullanılarak tahmini
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Hastalıkların hangi nedenden dolayı ortaya çıktığı ve önceden tahmin edilmesi insan sağlığı için çok önemli bir konudur. Son yıllarda teknolojinın hızla gelişmesi ve internetin yoğun biçimde kullanılmasıyla ortaya büyük miktarda veri çıkmıştır. Bu verilerden mantıklı sonuçlar çıkarmaya çalışan veri bilimciler, insanların hastalıklarla alakalı internet ortamına bıraktıkları izlerle, hastane verileri arasında ilişki aramaya başlamışlardır. Yapılan çalışma sonuçları göstermiştir ki insanların internet aramaları ile hastaneye gitmeleri arasında önemli bir ilişki mevcuttur. Tespit edilen bu ilişki kullanılarak, çeşitli hastalık salgınları tahmin edilmeye başlanmıştır.Bu tezde temel olarak iki amaç ortaya konmuştur. Birincisi, internet arama ve erişim sıklığı verisi ile hastalık salgınlarını tahmin etmektir. İkinci amaç ise semptom olarak benzerlik gösteren hastalıkların birbiri arasındaki ilişkini saptamak ve bu ilişkinin hastalık salgınları tahmin etmekte önemi olup olmadığını incelemektir. Yapılan ilk çalışmada Vikipedi, Google Flu Trends ve bu veri kümelerinin birleşimiyle oluşturulan modeller ile Amerika Birleşik Devletleri'ndeki grip hastalığı salgını tahmin etmeye çalışılmıştır. Elde edilen sonuçlara göre grip hastalığı salgınını tahmin etmede gayet başarılı modeller oluşturulmuştur. İlk çalışmadan alınan umut verici skorlar sayesinde ikinci çalışmada ilk çalışma genişletilmiştir. Gerçekleştirilen ikinci çalışmada ise Vikipedi ve Google Flu Trends servislerinin yanı sıra Google Trends servisinden de yararlanılmıştır. Ayrıca bu çalışmada, sadece grip hastalığı için değil, grip hastalığı ile semptom olarak benzer olabileceği düşünülen başka hastalık salgınları da tahmin edilmeye çalışılmıştır. Bu çalışmadaki bir diğer amaç ise, çoklu-iş öğrenme yönteminden faydalanarak benzer hastalıklara ait veri kümelerinin beraber kullanılmasının hastalık salgınlarını tahmin etmedeki etkisini gözlemlemek olmuştur. Elde edilen sonuçlar ise önerilen yöntemlerin başarılı ve tutarlı olduğunu ortaya koymaktadır. Tracking source of the disease and the forecasting the disease outbreaks are vital topic for human life. In recent years, with the rapid development of technology and wide usage of the internet, the amount of data that can be collected to extract meaningful information from the data with data scientists. Data scientists began to seek a relationship between the internet search data and hospital reports. Results of the studies have shown that, there is a relationship between people with internet searches, and their visits to hospitals. Using this relationship, significant amount of research is introduced to predict disease outbreaks. The two objectives outlined in this thesis as the basis. The first objective is, forecasting the disease outbreaks by using frequency data. Second one is to determine the relationship of diseases that share similar symptoms and decide whether this relationship is of importance on forecasting disease outbreaks.Firstly, in this study, Wikipedia, Google Flu Trends and models that are created by the combination of these data sets to predict influenza in the United States of America was tried. According to the results, the models are quite successful in predicting the flu epidemic were created. In the second study, in addition to Wikipedia and Google Flu Trends, Google Trends was also used. In addition, this study does not only cover the influenza disease, but also tries to forecast other disease which have similar symptoms with influenza. Moreover, in this study, the relationship between disease and improvements of the usage of similar disease data sets together were examined. The proposed method reveals the success of the resulting outputs.
Collections