Bayes yöntemi kullanarak istenmeyen elektronik postaların filtrelenmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışma, istenmeyen elektronik postaların otomatik olarakfiltrelenmesi problemine Bayes yaklaşımının uygulanmasını incelemek veperformansı arttırabilecek ince ayarlar geliştirilebilmek amacıyla yapılmıştır.Öncelikle, Elektronik posta sistemleri, istenmeyen elektronik postalarınkarakteristikleri açıklanmış ve mevcut istenmeyen elektronik posta engellemeyöntemleri incelenmiştir. Daha sonra istenmeyen elektronik postalarınengellenmesi bir otomatik öğrenme (belge sınıflandırma) işlemi olarak elealınmış ve bu alanda yaygın olarak kullanılan Yalın Bayes Sınıflandırmatanıtılmıştır. Son olarak üretilen çözümler doğrultusunda Borland Delphi 7.0yazılım geliştirme ortamında, Bayes yaklaşımı ile çalışan bir yazılımgeliştirilmiştir. Çeşitli kullanıcılardan elde edilen istenmeyen ve normalelektronik posta mesajlarından oluşan derlemler üzerinde yazılım iki farklıolasılık modeli kullanılarak çalıştırılmış ve elde edilen sonuçlar etkinlik açısındankarşılaştırılmıştır.Kullanılan iki modelde de normal elektronik posta için Duyarlık %100olmuştur. stenmeyen elektronik postalar için de modellerde sırasıyla %81 ve%84 Duyarlık elde edilmiştir. Kelime oluş sayılarının da dikkate alındığı ikincimodelin filtreleme başarısını daha da arttırdığı gözlemlenmiştir.Anahtar Kelimeler: BAYES, SPAM, stenmeyen Elektronik PostalarınFiltrelenmesi, Belge Sınıflandırma This study aims to analyze Bayesian approach to the problem of filteringspam (junk) e-mails and to develop fine adjustments for increasing itsperformance. Firstly, electronic mail systems, characteristics of spam e-mails,and existing spam e-mail filtering techniques have been analyzed. Then, filteringspam e-mails problem was considered as a machine learning (documentclassification) task and a commonly used method for this domain that NaiveBayes Classification was introduced shortcomings and main problems in theexisting systems and possible solutions to these are explained. Lastly, inaccordance with the proposed solutions, a prototype filter working with Bayesianlearning algorithm has been developed in Borland Delphi 7.0 softwaredevelopment environment. The prototype filter with two different probobalisticmodel is tested with a collection of spam (junk)e-mails and normal (regular) e-mails gathered from various users. The results have been compared forperformance and accuracy.In both models normal e-mails precision is %100. Spam e-mails precisionfor model 1 is %81 and model 2 is %84. Our secondary model which considersthe word occurring performed far better than the first model.Key Words : BAYES, SPAM, Filtering Spam E-mail, Document Classification
Collections