Sosyal kredilendirme ve demirleme planlamasnda veri madenciliği uygulamaları
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzün veri odaklı dünyasnda çeşitli endüstriler rekabet üstünlüğü sağlamak ve devamlı gelişim için düzenli bir şekilde veri madenciligine başvurmaktadır. Bu tezde, iki uygulama alannda veri madenciliği tekniklerinin kullanlması ele alınmaktadır: sosyal kredilendirme ve demirleme planlama.Elektronik ticaret ve sosyal platformların gelişmesi ile sosyal kredilendirme, kredi verenlerinve kredi kullancılarının bankalar gibi kurumsal aracıların yardım olmadan iş yapabildiği gerçekçi bir platform olarak ortaya çıkmıştır. Sosyal kredilendirme kısa sürede milyarlarca dolarlk kredi sirkülasyonu sağlayan baz platformlarla birlikte son zamanlardaciddi bir ivme kazanmştır. Öte yandan, bu tür platformların sürdürülebilirliği ve yaygın bir şekilde kullanlmas bireysel kredi kullanclarnın riskinin doğru tahmin edilmesine bağldır. Bu amaçla, kredi kullanclarnın risk durumunu tahmin etmek için rasgele ormanlar (RO) tabanl bir snandırma yöntemi öneriyoruz. Popüler sosyal kredilendirme platformu Lending Club (LC) verileri üzerindeki çalşmalarmız, RO tabanl yöntemin iyi kredi kullanclarnın tanımlanmasında LC sonuçlarnın yanı sıra FICO kredi puanlarından da daha sağlıklı tahmin verdiğini göstermektedir.İkinci veri madenciliği uygulama alan olarak deniz taşımacılğı ele alnmaktadr. Özellikle, İstanbul'da son dokuz yılda toplanan demirleme bilgilerini içeren yeni bir veri seti üzerine kapsamlı bir analiz sunulmaktadır. Belirli bir gemi için demirleme süresinin tahmin edilebilmesi amacyla bir veri madenciliği yapısı sağlanmaktadır. Amacımız gemi demirlemesi ile ilgili önemli faktörlerden bir anlam çıkarmak ve verimli demirleme planlamas için önemli olan demirleme süresi tahmini için etkili bir yöntem geliştirmektir. Buna ek olarak, gemi tipi traği zamansal analizi ile birlikte istatistiksel ARIMA modeli kullanlarak önümüzdeki üç yıl için gemi tipi traği tahmin edilmiştir. Sonuçlarmız, gemi demirleme saysında genel bir düşüş, fakat LPG taşyclarında belirgin bir artşolduğunu göstermektedir. Bu sonuçlar oldukça önemlidir çünkü bu tür gemiler kazalara daha yatkındır ve herhangi bir kaza anında Boğaz için büyük tehlike teşkil etmektedir. In today's data-driven world, various industries resort to data mining on a regular basis for competitive advantage and sustained growth. In this thesis, we consider employment of data mining techniques in two application domains: social lending and anchorage planning.With the advance of electronic commerce and social platforms, social lending (also known as peer-to-peer lending) has emerged as a viable platform where lenders and borrowers can do business without the help of institutional intermediaries such as banks. Social lending has gained significant momentum recently, with some platforms reaching multibillion dollar loan circulation in a short amount of time. On the other hand, sustainability and possible widespread adoption of such platforms depend heavily on reliable risk attribution to individual borrowers. For this purpose, we propose a random forest (RF) based classification method for predicting borrower status. Our results on data from the popular social lending platform Lending Club (LC) indicate the RF-based method outperforms the FICO credit scores as well as LC grades in identification of good borrowers.The second data mining application domain we consider pertains to maritime transportation. In particular, we first provide a comprehensive statistical analysis on a new anchorage data set gathered for nine recent consecutive years in Istanbul anchorages. We introduce a data mining framework with the aim of identifying a good estimate for anchorage duration for a given vessel. Our goal is to develop an understanding of key factors relevant to vessel anchorage and devise an effective methodology for predicting anchorage duration, which is critical for efficient anchorage planning. In addition, along with a temporal analysis of vessel type taffic, we forecast vessel type trafficc for the next three years using the statistical ARIMA model. Our results suggest an overall decrease in berthing vessels, yet a pronounced increase in LPG barges. This finding is rather significant as this type of vessel is more prone to accidents and any such accident wouldpose a great danger to the Strait.
Collections