Show simple item record

dc.contributor.advisorİnce, Türker
dc.contributor.advisorÇankaya, Hakkı Candan
dc.contributor.authorYabaş, Utku
dc.date.accessioned2021-05-08T07:52:41Z
dc.date.available2021-05-08T07:52:41Z
dc.date.submitted2014
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/635813
dc.description.abstractMüşteri kaybetmek, telekom firmaları açısından kaybettirdiği para bakımından önemli bir endişedir. Bu tez çalışmasında, en son veri madenciliği yöntemlerini analiz ederek, servislerden ayrılacak veya başka bir firmanın servisini kullanmayı düşünen müşterileri tahmin etmek için yeni metotlar geliştirdik. Önerdiğimiz yaklaşımın performansını yoğun bir şekilde değerlendirdik. Bu değerlendirmeyi yapmak için Orange Telecom tarafından `Knowledge Discovery and Data Mining 2009`(KDD) yarışması için sunduğu gerçek ve kullanıma açık bir veri kümesi kullandık. Bu veri kümesinde toplam 100.000 örnek ve 230 değişken bulunmaktadır. Bu yüzden veri kümesi `büyük veri` kapsamına girmektedir. IBM bu yarışmada birinci olmuştur, ancak önemli ölçüde bilişimsel kaynak kullanmaktadır. Biz alternatif metotlar ve daha uygun kaynaklar kullanarak, yarışmadaki en yüksek skorlara ulaşmayı hedefledik. Bu çalışmada, toplu sınıflandırıcı teknikleri üzerine yoğunlaştık. Tek ve güçlü sınıflandırıcılar ile en son toplu sınıflandırıcıları `müşteri ayrılma` problemi için karşılaştırdık. Ayrıca, bu metotların performanslarını arttırmak için iyi performans gösteren sınıflandırıcıları seçerek; bunları oylayıcı sınıflandırıcı ile birleştirdik. Genel olarak, elde ettiğimiz sonuçlar, yarışmanın en yüksek sonuç alan resmi yarışmacıları ile yakındı. Önerdiğimiz yaklaşımın, `müşteri ayrılması tahmini` dışındaki başka zorlayıcı otomatik öğrenme problem alanları için de değerli olabileceğine inanıyoruz. Yöntemimizin doğruluğunu onaylamak için, UCI Machine Learning kütüphanesinden topladığımız veri kümeleri ile deneyler yaptık. Bu deneyler sonucunda çoğu veri kümesinde yöntemimiz, içinde bulunan toplu sınıflandırıcıdaki bütün algoritmalardan daha iyi sonuçlar elde etmiştir.Anahtar Kelimeler: m¨u¸steri kayıp tahmini, ¸coklu sınıflandırıcı, oylayan sınıflandırıcı, otomatik ¨o˘grenme, veri madencili˘gi.
dc.description.abstractCustomer churn is a concern for telecommunication service providers due to its associated costs. In this thesis, we analysed state-of-the-art data mining algorithms and developed novel methods to accurately predict customers who will change and turn to another provider for the same or similar service. We extensively evaluated performance of our proposed approach using a public and real dataset compiled by Orange Telecom for the Knowledge Discovery and Data Mining (KDD) 2009 Competition. This dataset has $100,000$ instances with $230$ attributes, which makes it a ``big data''. IBM achieved the highest score on this dataset requiring significant amount of computational resources. We aimed to find alternative methods that can match or improve the recorded highest score with more efficient use of resources. In our study, we focus on ensemble of classifiers techniques. We compared performance of single, powerful classifiers to state-of-the-art ensemble methods for churn detection problem. Additionally, we showed that these results can be further improved by combining selected subset of well performing classifiers by a voting classifier. Overall, the results with our proposed approach were similar to the official top scorers of the competition. We believe that our proposed approach can be valuable for solving other challenging machine learning problem domains (such as ``big data'' problems) rather than churn prediction.Also, we performed experiments using the selected datasets from the UCI Machine Learning repository. Our proposed approach outperforms the single powerful algorithms contained in the ensemble for most of the datasets tested.Keywords: churn prediction, ensemble classifier, voting classifier, data mining,machine learning.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleCustomer churn prediction for telecommunications industry
dc.title.alternativeTelekomünikasyon servislerinden aboneliklerini i̇ptal edecek müşterileri önceden tahmin etmek
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentAkıllı Mühendislik Sistemleri Ana Bilim Dalı
dc.identifier.yokid10028359
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityİZMİR EKONOMİ ÜNİVERSİTESİ
dc.identifier.thesisid353633
dc.description.pages103
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess