Detecting turkish phishing attacks with machine learning classifiers
dc.contributor.advisor | Acartürk, Cengiz | |
dc.contributor.author | Turhanlar, Melih | |
dc.date.accessioned | 2020-12-10T09:11:13Z | |
dc.date.available | 2020-12-10T09:11:13Z | |
dc.date.submitted | 2019 | |
dc.date.issued | 2020-01-31 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/224808 | |
dc.description.abstract | Oltalama Saldırıları, kurbanın merak ve korku gibi duygularını kullanarak, kredi kartı numaralarını, kimlik bilgilerini ve kişisel bilgilerini çalmayı amaçlayan sosyal mühendislik saldırılarıdır. Saldırgan genellikle metin içerisinde bir web sayfası bağlantısı gönderir. Kurban bağlantıyı tıklarsa, genellikle gerçek ve kurumsal bir web sayfasını taklit eden sahte bir web sayfasına bağlanır. Sahte web sayfasındaki HTML formlarını dolduran kurban, kimlik bilgilerini istemeden saldırgana gönderir. Günümüzde, phishing küresel bir konudur. Bu çalışma, dengesiz bir oltalama veri setinde makine öğrenme sınıflandırıcıları vasıtasıyla Türkçe oltalama metnini tespit etmek için bir çerçeve sunmaktadır. Eğitim veri setinde e-postalar, SMS metinleri ve tweet'ler bulunmaktadır. Çalışmamızda 32 makine öğrenme modelinin F-puan sonuçları karşılaştırıldığında, Lojistik Regresyon Sentetik Azınlık Aşırı Örnekleme Tekniğinin yüksek performans elde ettiği görülmektedir. | |
dc.description.abstract | Phishing Attacks are social engineering attacks that aim at stealing victim's credit card numbers, credentials, and personal information by exploiting victim's emotions, such as curiosity and fear. The attacker usually sends a webpage link in embodied in textual content. If the victim clicks the link, they usually connect to a mock webpage that imitates a real, institutional webpage. Filling the HTML forms in the mock webpage, the victim sends their credentials unwittingly to the attacker. In our day, phishing is a global issue. This study presents a framework for detecting phishing text in Turkish by running machine learning classifiers on an imbalanced phishing data set. The training dataset covers e-mails, SMS text and tweets. The results show that Logistic Regression Synthetic Minority Over-Sampling Technique achieves high performance, as indicated by F-measures, compared to a set of 32 machine learning models in our study. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Detecting turkish phishing attacks with machine learning classifiers | |
dc.title.alternative | Türkçe oltalama saldırılarının makine öğrenmesi algoritmaları ile tespiti | |
dc.type | masterThesis | |
dc.date.updated | 2020-01-31 | |
dc.contributor.department | Siber Güvenlik Anabilim Dalı | |
dc.identifier.yokid | 10310039 | |
dc.publisher.institute | Enformatik Enstitüsü | |
dc.publisher.university | ORTA DOĞU TEKNİK ÜNİVERSİTESİ | |
dc.identifier.thesisid | 605999 | |
dc.description.pages | 96 | |
dc.publisher.discipline | Diğer |