Poverty level characterizations via feature selection and machine learning
dc.contributor.advisor | Gerek, Ömer Nezih | |
dc.contributor.author | Mohamud, Jama Hussein | |
dc.date.accessioned | 2020-12-10T08:43:32Z | |
dc.date.available | 2020-12-10T08:43:32Z | |
dc.date.submitted | 2019 | |
dc.date.issued | 2020-01-08 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/221691 | |
dc.description.abstract | Yoksulluk seviye tespiti hassas, güncel ve güvenilir sosyo-ekonomik hane halkı verisine ihtiyaç duymaktadır. Öte yandan çoğu gelişmekte olan ülkede gelir, tüketim, yaşam türü verilerin güvenilir olarak elde edilmesi zor ve pahalıdır. Bu tür veriler uzun ve detaylı anketler gerektirir. Gelişmekte olan ülkelerin bu tür veri elde etmelerindeki güçlük nedeniyle veri azdır; bu da hane halklarına yönelik iyileştirme politikalarını geliştirme aşamasında zorluklara neden olmaktadır. Zira, ekonomik karakteristiklerin hassas ölçümü toplum politikaları üretmek açısından elzemdir. Bu tür durumlarda makine öğrenmesi yaklaşımlarını ele almak son derece faydalı olabilir. Maalesef makine öğrenmesi algoritmaları genel olarak `kara kutu` formatında olup, gerçekleştirdiği öğrenmenin ve sınıflandırmanın hangi parametrelere ve özniteliklere dayandığı çoğunlukla belirsizdir. Detay vermek gerekirse; bir hanenin yoksul olarak categorize olmasına neden olan niteliklerin neler olduğu konusunda makine öğrenme yöntemleri doğrudan sonuç üretmemektedir. Bu nedenle, bu çalışmada yoksulluk konusuna sadece `gelirin belli seviyenin altında kalması` şeklindeki tek boyutlu yaklaşımı kullanmayarak, bunun yerine çok boyutlu bir perspektif ele alınmaktadır. Yöntemimizin uygulaması ve faydalı olup olmadığı Inter-Amerikan Gelişim Bankası tarafından Kaggle'a yüklenen Kosta Rika veri seti üzerinden değerlendirilmiştir. Anahtar Kelimeler: Yoksulluk karakterizasyonu, Yoksulluk ölçümü, Çok boyutlu yoksulluk, Öznitelik çıkarımı, Makine öğrenmesi | |
dc.description.abstract | Targeting poverty requires access to accurate, timely and reliable quantitative data on socio-economic characteristics of households. However, in many developing countries, collecting accurate, timely, and reliable data on household characteristics is expensive, time-consuming, and unreliable, often requiring long and detailed surveys. Reliable data on economic status remain scarce in developing countries, hampering efforts to study these outcomes and to design appropriate policy responses to improve household welfare. In such situations machine learning algorithms can be of a great help. However, these models are normally designed in the form of black boxes; if the model is trained on a certain known data and predicted on unseen data, it doesn't give any information about the features that discriminate between classes. In other words, it is very tough to extract the features indicating that someone falls under specific category of poverty. Moreover, in poverty identification, measurement or classification, it is crucial to know how such features contribute to each class of poverty. Therefore, we designed an approach that extracts a subset of features that best characterize each poverty class, examines how this subset affect the chosen class and finally employ ensemble models to best classify between these classes. Through this approach we look at poverty from a multidimensional perspective contrary to a single dimension perspective defined as living on consumption expenditure of less than a predefined income threshold. The application and usefulness of our proposed framework is tested on a Costa Rican dataset collected from Kaggle website and provided by Inter-American Development Bank.Keywords: Poverty Characterization, Poverty Measurement, Poverty Identification, Multidimensional Poverty, Feature Extraction, Machine Learning. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Elektrik ve Elektronik Mühendisliği | tr_TR |
dc.subject | Electrical and Electronics Engineering | en_US |
dc.title | Poverty level characterizations via feature selection and machine learning | |
dc.title.alternative | Öznitelik seçimi ve makine öğrenmesi ile yoksulluk seviye karakterizasyonu | |
dc.type | masterThesis | |
dc.date.updated | 2020-01-08 | |
dc.contributor.department | Diğer | |
dc.identifier.yokid | 10299259 | |
dc.publisher.institute | Lisansüstü Eğitim Enstitüsü | |
dc.publisher.university | ESKİŞEHİR TEKNİK ÜNİVERSİTESİ | |
dc.identifier.thesisid | 600619 | |
dc.description.pages | 54 | |
dc.publisher.discipline | Telekomünikasyon Bilim Dalı |