Makine öğrenmesi yöntemleriyle müşteri kayıp analizi
dc.contributor.advisor | Akçay, Muammer | |
dc.contributor.author | Çakır, Zerrin | |
dc.date.accessioned | 2023-09-22T12:43:43Z | |
dc.date.available | 2023-09-22T12:43:43Z | |
dc.date.submitted | 2021-08-11 | |
dc.date.issued | 2021 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/742939 | |
dc.description.abstract | Günümüzde müşteri kaybı analizi birçok şirket için önemli bir problem haline gelmiştir. Telekom şirketleri için bu analizlerin yapılması rekabet ve pazarlama açısından önemli faydalar sağlamaktadır. Bu tez çalışmasında bir telekomünikasyon şirketine ait veri seti kullanılmıştır. Veriler çok boyutlu olduğu için boyutsallık azaltma yöntemi olan Temel Bileşen Analizi tekniği ile boyutsallık azaltılmıştır. Problem dengesiz sınıf problemi olduğu için SMOTE tekniği ile dengeli veri dağılımı olan sınıf türü oluşturulmuş ve çözüm üretilerek daha iyi bir yaklaşım elde edilmiştir. Telekomünikasyon verileri veri madenciliği yöntemleri kullanılarak veri seti sınıflandırılıp veriler arasındaki ilişki matematiksel sonuçlar üretilerek modeller oluşturulmuştur. Bu çalışmada analiz ve tahmin işlemlerinde kullanılan sınıflandırma yöntemlerinden Destek Vektör Makineleri, Karar Ağaçları, Rastgele Orman ve Yapay Sinir Ağları alg1oritmaları kullanılmıştır. Modellerin tahmin başarı ve performans sonuçları literatürde kullanılan Doğruluk, Duyarlılık, Kesinlik, F1 Score ve ROC Eğrisi metrikleriyle kıyaslanmıştır. Yapılan eğitimler ve oluşturulan modeller sonucunda SMOTE işlemi uygulanmadan önce Rastgele Orman Algoritması %85, Destek Vektör Makineleri %80, Karar Ağaçları %78 ve Yapay Sinir Ağları %86 performans sonuçları elde edilmiştir. SMOTE işlemi uygulandıktan sonra ise Rastgele Orman Algoritması %97, Destek Vektör Makineleri %96, Karar Ağaçları %93 ve Yapay Sinir Ağları %95 performans sonuçları elde edilmiştir. Bu durumda SMOTE işlemi sonrası Rastgele Orman Algoritması %12, Destek Vektör Makineleri %16, Karar Ağaçları %15 ve Yapay Sinir Ağları %9 performans artışı sağlamıştır. Çalışmalar sonucunda en yüksek performansı gösteren algoritma Rastgele Orman Algoritması olmuştur. | |
dc.description.abstract | Customer churn analysis has become a major problem for many companies nowadays. Conducting these analyzes for telecom companies provides significant benefits in terms of competition and marketing. In this thesis, a data set belonging to a telecommunication company was used. Since the data is multidimensional, dimensionality has been reduced with the Principal Component Analysis technique which is the dimensionality reduction method. Since the problem is an unbalanced class problem, a class type with balanced data distribution was created with the SMOTE technique and a better approach was obtained by generating a solution. The data set was classified using the telecommunication data mining methods and the models were created by producing mathematical results for the relationship between the data. In this study, Support Vector Machines, Decision Trees, Random Forest Algorithms and Artificial Neural Networks Algorithms, the classification algorithms used in analysis and prediction processes, were used. The predictive success and performance results of the models were compared with the Accuracy, Recall, Precision, F1 Score and ROC Curve metrics. As a result of the trainings and models created, the Random Forest Algorithm 85%, Support Vector Machines 80%, Decision Trees 78% and Artificial Neural Networks 86% performance results were obtained before the SMOTE process was applied. After the SMOTE process was applied, the Random Forest Algorithm 97%, Support Vector Machines 96%, Decision Trees 93% and Artificial Neural Networks 95% performance results. In this case, the results were obtained, after the SMOTE process, Random Forest Algorithm 12%, Support Vector Machines 16%, Decision Trees 15% and Artificial Neural Networks 9% performance increase. As a result of the studies achieved, the algorithm with the highest performance was the Random Forest Algorithm. | en_US |
dc.language | Turkish | |
dc.language.iso | tr | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Makine öğrenmesi yöntemleriyle müşteri kayıp analizi | |
dc.title.alternative | Customer loss analysis with machine learning methods | |
dc.type | masterThesis | |
dc.date.updated | 2021-08-11 | |
dc.contributor.department | Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı | |
dc.identifier.yokid | 10232282 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | KÜTAHYA DUMLUPINAR ÜNİVERSİTESİ | |
dc.identifier.thesisid | 673048 | |
dc.description.pages | 93 | |
dc.publisher.discipline | Diğer |
Files in this item
Files | Size | Format | View |
---|---|---|---|
There are no files associated with this item. |