Profit-driven non-linear classification with applications to credit card fraud detection, churn prediction, direct marketing, and credit scoring
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Son yıllarda veri miktarlarında ve bilgisayarlı hesaplama guüçlerinde yaşanan artışlar veri analizlerinin önemini artırmıştır. Şimdiye kadar daha cok betimsel analizler yaplmış, tahmine dönük analizler biraz daha az gündem bulmuştur. Bu çalışma daha eksik olan kısımda yani tahmin modellemesi cephesinde yer almaktadır. Tahmin etme problemlerinin en tipik olan sınıflandırma problemleri şimdiye kadar çoğunlukla veri madenciligi (VM) teknikleriyle çözülmeye çalışmıştır. Bu algoritmalarda ele alınan amaç fonksiyonu genellikle istatistiki bir ölçünün eniyilenmesidir(doğru etiketlenen kayıtların sayısının veya ağırlıklı toplam sayısının yüksek olmasıgibi).Bu algoritmalarda ele alnan amaç fonksiyonu istatistiksel olduğuna göre yanlış sınıflandırılmış örneklerin sayısını azaltmaktır. Eski maliyete duyarlı sınıfladırma algoritmalarında yanlış negatif (YN) hata bedeli yanlış pozitif (YP) hatasından fazla olabilir. Bu yaklaşım özellikle çok dengesiz veri kümlerinde faydaldır. Halbuki, bu yaklaşım örneklerin yanlış sınıflandırması maliyeti ya doğru sınıflandırması kâr değişken olduğu durumlarda kullanılamaz hale gelmektedir.Bu çalışmada, esas amaç fonksiyonu sınıflandırma yapay sinir ağlar kullanarak ve örneklerin değişken kâr ve maliyetlerini göz önüne alarak toplam net kâri maksimize etmektir. Bu yaklaşım dört farklı uygulama alanında kullanılmıştır: Kredi kart sahtekarlık tespiti, terk analizi, doğrudan pazarlama, ve kredi skorlama. The rapid growth in data capture and computational power has led to an increasing focus on data-driven research. So far, most of the research is focused on predictive modeling using statistical optimization where it is aimed to minimize the number (or, the weighted number) of incorrectly classified records, while profit maximization has been given less priority. It is exactly the central issue that is addressed in this study by taking a profit-driven approach to develop a well-known non-linear classification technique (Artificial Neural Network) which maximizes the total profit earned by model implementation. Therefore, the focus is shifted from a statistical optimization to profit maximization.//Classification which is one of the most common prediction problems, have traditionally been tackled by the data mining (DM) algorithms. The objective taken in these algorithms is a statistical one where it is aimed to minimize the number (or, the weighted number) of incorrectly classified records. In traditional cost-sensitive classification, the error of mislabeling a minor class record (False Negative) could be larger than the error of mislabeling a major class record (False Positive). This approach is useful especially where there is a high imbalance between the classes. However, this does not cope for the situations where the costs of mislabeling the instances or the profits gained from correctly labeled instances are variable (i.e., changing from instance to instance).The central objective here is to maximize the total net profit gained from applying the classification models using individual (case-based) profits and costs of each of the instances. This approach has been used in four application areas: Credit Card Fraud detection, Churn Prediction, Direct Marketing and Credit Scoring.
Collections