Detection of debit card fraud through random forest
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günlük hayatımızda en sık kullandığımız finansal araçlardan olan ATM'ler, kullanıma geçtikleri tarihten itibaren aynı sıklıkla dolandırıcıların hedefi olagelmiştir. Özellikle manyetik bant kullanılarak üretilen ATM kartlarının (debit kart) güvenlik açıkları dolandırıcılar tarafından bir fırsat olarak görülmüştür. Bu güvenlik açıkları istismar edilerek gerçekleştirilen kart kopyalama vakaları sonucu müşteri hesaplarından önemli miktarda dolandırıcılık yapılmıştır. Bu tez çalışmasında, bir bankaya ait ATM nakit çekim işlem verisi kullanılarak ATM kartı dolandırıcılıklarının tespit edilmesi için bir model ortaya konulmuştur. Öncelikle ATM nakit çekim işlem veri setinde dolandırıcılık tespiti ile ilgili olabileceği düşünülen işlem değişkenleri tespit edilmiştir. Akabinde, bu değişkenler üzerinden literatürde dolandırıcılık tespitinde kullanılabileceği belirtilen RFM (Recency-Yakınlık, Frequency-Sıklık, Monetary-Parasal büyüklük) değişkenleri hesaplanmıştır. İkinci adımda RFM değişkenleri ve nakit çekim işlem değişkenleri kullanılarak rastgele orman algoritması ile bir sınıflandırma modeli oluşturulmuştur. Üçüncü olarak oluşturulan sınıflandırma modeli algoritmanın farklı parametreleriyle test edilmiştir. Çalışmanın sonuç kısmında hazırlanan modelin sonuçları tartışılmış ve pratik uygulamalar ışığında gerçek zamanlı bir ATM kartı dolandırıcılık tespit sistemi kurulması konusunda bazı değerlendirmeler sunulmuştur. As one of the most frequently used financial tools in our life, ATMs have become a target for fraudsters in the same frequency. Particularly, security vulnerabilities of debit cards, which are generally produced by using magnetic stripes, was seen as an opportunity for fraud. As a result of exploiting those security vulnerabilities, important amounts have been fraudulently withdrawn from customer accounts. In this thesis, a data mining model was established for detection of debit card fraud through debit card transaction data of a bank. Firstly, transaction variables were defined in the ATM cash withdrawal dataset with consideration of their relevance in the debit card fraud detection. Consequently, behavioral RFM (Recency, Frequency, Monetary) variables, which are suggested as relevant in debit card fraud detection literature, were calculated based on those transaction variables. Secondly, several experiments were made through the classification model created by random forest algorithm by changing algorithm parameters. In the concluding remarks, the results of the established model were summarized and, considering practical implementations, some assessments regarding a real-time debit card fraud detection system were made.
Collections