Tüketici kredi risklerinin, meta-sezgisel yaklaşımlar ileiyileştirilmiş rastgele ormanlar yöntemi aracılığıyla değerlendirilmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
2007-2009 yıllarına dayanan küresel finans krizi, kredi risklerinin değerlendirilmesi analizlerine yönelik artan bir ilgiyi de beraberinde getirmiştir. Geri ödeme gücü zayıf çok sayıda hane halkına verilen konut kredilerini, bir diğer deyişle eşik altı kredileri ipoteğe dayalı türev ürünlere çevirerek başka yatırımcılara satan köklü ve büyük bankalar, birer sistemik risk kaynağı haline gelmiş ve maruz kaldıkları temerrüt risklerinin bütün finansal sisteme yayılmasına sebep olmuşlardır.Kredi talebinde bulunanlara ilişkin bilgi toplama ve değerlendirme yapmaya yönelik modern çalışmaların geçmişi 1940'lı yılları bulsa da istatistiksel yöntemlerin kullanımına ilişkin ilk örnekler 1960'ların sonuna doğru ortaya çıkmıştır. O zamanlardan günümüze kadar, hızla artan kredi miktarları ve kredi kullanan kişi sayısı ile paralel olarak borçlananlar ile ilgili daha fazla veri depolanmaya başlanmıştır. Bu verileri analiz edecek ve yoğun matematiksel hesaplamaya dayalı gelişmiş yöntemler de bilgisayar bilimi ile birlikte gelişme göstermiştir. İhtiyaçların ve çözümlerin bir sarmal şeklinde etkileşerek bugünlere gelmesiyle birlikte de kredi başvurularını değerlendirme yöntemlerine ilişkin geniş bir yazın ortaya çıkmıştır.Yazının çok büyük bir bölümünü istatistiksel ve makine öğrenme yöntemleri oluşturmaktadır. Bu yöntemlerin birçoğu, çok fazla değişken ve gözlem içeren karmaşık veri kümelerinden yorumlanabilir bilgi ve doğru tahmin ortaya çıkartmakta oldukça başarılı olmaktadır. Ancak yöntem başarılarında ortaya çıkan çok küçük farklılıklar şirket kar veya zararlarında ve hatta sistemin sürdürülebilirliği üzerinde çok büyük etkiler yaratabilecektir. Bu nedenle mevcut yöntem ve yaklaşımları iyileştirme ve geliştirme çabaları halen sürmektedir.Söz konusu çabaların bir parçası olarak bu çalışmada, performans kıyaslamasına imkân vermesi sebebiyle birçok çalışmada incelenmiş olan bir tüketici kredi veri kümesi hibrit bir yaklaşım ile analiz edilmiştir. Veri kümesinin öğrenimi ve tahminler, biyoloji ve tıp gibi alanlarda yapılan analiz çalışmalarında yoğun olarak kullanılmakla birlikte finans alanında kendine yeni yeni yer bulmaya başlayan bir makine öğrenme yöntemi olan Rastgele Ormanlar ile gerçekleştirilmiştir. Yöntemin iyileştirilmesi amacıyla da Genetik Algoritma ve Tavlama Benzetimi meta-sezgisel yaklaşımları ile değişken seçimi yapılmıştır. Böylelikle yöntemin eğitim sürecini olumsuz etkileyerek tahmin performansını düşüren değişkenlerin analizlerden elenmesi amaçlanmıştır.Tez ile önerilen bir dizayn ile birleştirilen meta-sezgisel yaklaşımların içerisinde Rastgele Ormanlar yöntemi gömülü olarak kullanılmıştır. Birleştirilmiş dizayn ile meta-sezgisel yaklaşımların güçlü yönleri kullanılarak zayıflıklarının bertaraf edilmesi sağlanmıştır. Kredi değerlendirme çalışmalarında, Genetik Algoritma sıklıkla kullanılmakla birlikte Tavlama Benzetimi uygulama örneği bulunmamaktadır.Sonuçlar Rastgele Ormanlar yönteminin hibritleştirilerek kullanımında, tek başına kullanımına göre tahmin performanslarında istatistiksel olarak anlamlı artışlar sağlandığını göstermektedir. Aynı veri kümesi ile analiz yapılan yazındaki diğer çalışmalar ile karşılaştırıldığında da önerilen hibrit yöntemin yüksek bir performans gösterdiği görülmektedir. Yöntem kredi başvuru değerlendirmelerinde karar vericilere büyük faydalar sağlayacaktır. Global financial crisis, which dates back to 2007-2009, raised a growing interest to credit risk assessment analyses. Long-established and big banks became a source of systemic risk and caused their exposure to debt risks to be transmitted throughout the whole financial system by landing mortgages to too many households with low repayment capabilities, which are also known as subprime mortgages.History of modern studies for collecting information and assessment about credit applicants have begun around 1940s but first examples of statistical methods usage showed up in late 1960s. From that day on, in parallel to rapidly increasing amount of credit and credit borrowers, much more data has been collected. Along with progress made in computer science, advanced methods which are based on intensive computation to analyze these data are also developed. Needs and solutions are mutually interacted in a spiral way up to the present and a wide literature has been emerged about credit applications' assessment.Most of the literature is consisted of statistical and machine learning methods. Most of these methods are very successful for deriving interpretable information and correct predictions from complex datasets with many variables and observations. However, little differences will have great impacts on company profits or losses and even on the sustainability of the system. That's the reason for continuing efforts to improve and develop existing methods and approaches.As a part of these efforts, in this study, a well-known consumer credit dataset which is used as a benchmark set for comparison purposes, is analyzed with a hybrid approach. Dataset learning and predictions are conducted with a machine learning method called Random Forests, which has been used intensely in subjects like biology and medicine but became used in finance recently. In order to improve the method, feature selection is applied with Genetic Algorithm and Simulated Annealing meta-heuristic approaches. Aim is to eliminate irrelevant variables that disturb learning process and cause worse predictions.Random Forests method is embedded to the design of combined meta-heuristics proposed by this thesis. Combined design allowed to use strengths of meta-heuristics while overcoming weaknesses. In credit assessment studies, Genetic Algorithm is widely used but there is no example of a study with Simulated Annealing.Results show that hybridized implementation of Random Forests produces statistically significant increases in prediction performances vis a vis sole usage. When compared with other studies adopted the same dataset, it is seen that proposed hybrid method shows high performance. Method will be highly beneficial for decision makers in assessment of credit applications.
Collections