Data preprocessing techniques in machine learning to detect fraud credit card transactions
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Dünyanın bu zamanında veriler günden güne büyük miktarda artmaktadır. Makine öğreniminde veri ön işleme, veri problemini çözmek için büyük bir role sahiptir, Büyük veri setlerinden bilgi bilgisini almak artık farklı tür işletmelerde büyük ve önemli bir rol oynamaktadır. Bir veri kümesinin veri analizi, yararlı bilgileri üretmek için gizli kalıbı çıkarmak için kullanılabilir. Makine öğrenmesi, veri setindeki karmaşık ilişkilere odaklanmadan doğrudan değişkeni öngören tahmine dayalı analiz için güçlü bir araçtır. Veri ön işleme, veri setinin karmaşıklığını ortadan kaldıran makine öğreniminin önemli bir faktörüdür. Bu tekniklerle yeni işlemin sahtekar veya sahtekar olmadığını bulmamıza izin veren gerçek hayattaki kredi kartı işlemlerine dayanan tahmine dayalı modeller oluşturuyoruz. Bu tezin amacı ve görevi Veri ön işleme, Gerçek yaşam örneği gibi makine öğreniminde zor adımların tanıtılması, makine ön öğreniminde veri önişlemesinin önemi ve etkisini gösterecektir. Kredi kartı sahtekarlığı her yıl büyüyor İşyerlerine çok para kazandıran tüm kredi kartı işlemlerinde her yıl dolandırıcılığın yüzde 1'i hesaplanıyor. Kredi kartı işlemlerinde sahtekarlık problemini çözmek için farklı türlerde Makine Öğrenmesi algoritmaları kullanılmaktadır. Başlıca zorluk, verilerin neredeyse yüzde 99,4'ünü içeren büyük veri kümesi dolandırıcılık değildi. Bu, veri ön işleme için büyük bir zorluktu. Veri temizleme, normalizasyon, özellik çıkarma ve seçme gibi veri ön işleme teknikleri, sinir ağları, karar ağaçları, rastgele orman, örnekleme altında makine öğrenme algoritmaları için verileri hazırlamak için kullanılır. Bazı algoritmalar sonucunda modelimizin doğruluğu artar. yüzde 90'dan fazla. Önerilen modelde ayarlanan verilerin yüksek performansını elde etmek için her bir veri ön işleme adımı için en iyi algoritmayı sunduğumuzda The data is increasing day by day in a large amount in this time of the world. Data preprocessing in Machine learning has big role to solve the data problem, Getting the information knowledge from large data sets now plays a big and significant role in different kind of businesses. Data analysis of a dataset can be used to extract the hidden pattern to produce useful information. Machine learning is powerful tool for predictive analysis which predict the direct variable without focusing on complex relationships in the dataset. Data preprocessing is the important factor of machine learning which removes the complexity of data set. With these techniques we build predictive models based on real life credit card transactions data which allow us to find the new transaction is fraudulent or non-fraudulent. The aim and mission of this thesis is to introduce the difficult steps in machine learning like Data preprocessing, Real life example will show the importance and impact of data preprocessing in the machine learning. Credit card fraud is growing each year almost 1 percent of fraud has calculated each year for all the credit card transactions which caused a lot of money to the business owners. Different kind of Machine Learning algorithms are used to solve the credit card transaction fraud problem. Main challenge is the large data set which contains almost 99.4 percent of data was non-fraudulent. This was a big challenge for data preprocessing. Data preprocessing techniques like data cleaning, normalization, feature extraction and selection are used to prepare the data for machine learning algorithms such as neural networks, decision trees, random forest, under sampling etc. In the result of some algorithms the accuracy of our model increases to more than 90 percent. As we introduce the best algorithm for each step of data preprocessing to get the high performance of the data set in proposed model
Collections