Apache spark ve makine öğrenmesi algoritmaları ile ağ saldırısı tespiti
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İnternet tabanlı hizmetlerin sürekli olarak artış göstermesi, ağ trafik verilerini günden güne daha büyük ve karmaşık hale getirmektedir. Bu durum, ağ saldırılarının tespitini giderek zorlaştırmakta dolayısıyla ağ güvenliğinin sağlanması için daha etkili ve hızlı veri işleme yöntemlerini gerekli kılmaktadır. Bu amaçla pek çok saldırı tespit sistemi geliştirilmiştir ve geliştirme çalışmaları devam etmektedir.Bu çalışmada amaçlanan, makine öğrenmesi algoritmalarının aynı ağ verileri üzerindeki performanslarını karşılaştırarak geliştirilmekte olan saldırı tespit sistemlerine referans kaynak oluşturmaktır. Çalışmada; büyük veri teknolojisi Apache Spark kullanılarak KDD Cup'99 verilerinin tamamı makine öğrenmesi algoritmalarından Lojistik Regresyon, Destek Vektör Makineleri, Naive Bayes ve Rastgele Orman üzerinde koşturulmuş; sonuçlar karşılaştırmalı olarak analiz edilmiştir. Elde edilen sonuçlar, Apache Spark teknolojisinin büyük ağ verileri üzerindeki saldırıları tespit etmede giderek daha etkili olduğunu göstermiştir. The continuous increase in internet-based services makes network traffic data larger and more complex day by day. This makes it increasingly difficult to detect network attacks, and therefore requires more efficient and faster data processing methods to ensure network security. For this purpose, many intrusion detection systems have been developed and development works are continuing.This study; by comparing the performance of machine learning algorithms on the same network data, aims to establish a reference source for the developed intrusion detection systems. In this study; all data of KDD Cup'99 were run on Logistic Regression, Support Vector Machine, Naive Bayes and Random Forest from machine learning algorithms using Apache Spark a big data technology; and the results were analyzed comparatively. The obtained results show that the Apache Spark technology has become increasingly effective in detecting attacks on big network data.
Collections