Online minimax optimal density estimation and anomaly detection in nonstationary environments
dc.contributor.advisor | Kozat, Süleyman Serdar | |
dc.contributor.author | Gökcesu, Kaan | |
dc.date.accessioned | 2020-12-02T12:29:26Z | |
dc.date.available | 2020-12-02T12:29:26Z | |
dc.date.submitted | 2017 | |
dc.date.issued | 2020-08-25 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/33820 | |
dc.description.abstract | Çevrimiçi anomali tespiti, ağ izleme, siber güvenlik, gözetleme ve sensör arızalarındaki uygulamaları nedeniyle son yıllarda büyük ilgi gördü. Bu amaçla, zaman serilerindeki anomalileri saptamak için verileri sıralı olarak işleyen bir algoritma sunmaktayız. Algoritmamız iki aşamadan oluşmaktadır: yoğunluk tahmini ve anomali tespiti. İlk olarak, normal veriyi modellemek için bir olasılık yoğunluk fonksiyonu oluşturuyoruz. Daha sonra, anomalileri tespit etmek için yeni gözlemlerin yoğunluğunu bir eşik değeriyle karşılaştırıyoruz. Bu problemi çözerken bilişim teorisi yaklaşımı kullanıyoruz ve literatürde ilk defa, güçlü ve deterministik olarak optimal bir anomali tespit algoritması yaratmak için her iki aşamada da minimaks optimal yöntemler önermekteyiz. İlk aşamada, gözlemlenen verilerin üzerinde herhangi bir varsayımda bulunmaksızın durağan olmayan ve üstel aileye ait olan olasılıksal dağılımlar için minimaks optimal olan çevrimiçi yoğunluk tahmin algoritmasını sunuyoruz. Algoritmamızın, zaman ufkunu, temel dağılımın değişimini veya kaynak parametrelerinin değiştiği zamanları önceden bilmesine gerek yoktur. Sonuçlarımızın herhangi bir gözlem sekansı için tutulması garanti edilmektedir. Algoritmamızın ikinci aşaması için, seçilebilecek en iyi eşik değerine karşı logaritmik performans sınırlarına sahip bir çevrimiçi eşik belirleme yöntemi önermekteyiz. Algoritmamız her iki aşamada da log-lineer pişmanlıklar elde etmek için parametrelerini çevrimiçi bir şekilde günceller. Yoğunluk tahmini aşamasında evrensel tahmin perspektifi kullandığımız için, anomali tespit algoritmamız gözetimsiz, yarı gözetimli veya gözetimli şekilde kullanılabilir. Sentetik ve gerçek verilerdeki deneylerle önemli performans kazanımları gösteriyoruz. | |
dc.description.abstract | Online anomaly detection has attracted significant attention in recent years due to its applications in network monitoring, cybersecurity, surveillance and sensor failure. To this end, we introduce an algorithm that sequentially processes data to detect anomalies in time series. Our algorithm consists of two stages: density estimation and anomaly detection. First, we construct a probability density function to model the normal data. Then, we threshold the density of the newly observed data to detect anomalies. We approach this problem from an information theoretic perspective and, for the first time in the literature, propose minimax optimal schemes for both stages to create an optimal anomaly detection algorithm in a strong deterministic sense. For the first stage, we introduce an online density estimator that is minimax optimal for general nonstationary exponential-family of distributions without any assumptions on the observation sequence. Our algorithm does not require a priori knowledge of the time horizon, the drift of the underlying distribution or the time instances the parameters of the source changes. Our results are guaranteed to hold in an individual sequence manner. For the second stage, we propose an online threshold selection scheme that has logarithmic performance bounds against the best threshold chosen in hindsight. Our complete algorithm adaptively updates its parameters in a truly sequential manner to achieve log-linear regrets in both stages. Because of its universal prediction perspective on its density estimation, our anomaly detection algorithm can be used in unsupervised, semi-supervised and supervised manner. Through synthetic and real life experiments, we demonstrate substantial performance gains with respect to the state-of-the-art. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Elektrik ve Elektronik Mühendisliği | tr_TR |
dc.subject | Electrical and Electronics Engineering | en_US |
dc.subject | Mühendislik Bilimleri | tr_TR |
dc.subject | Engineering Sciences | en_US |
dc.subject | İstatistik | tr_TR |
dc.subject | Statistics | en_US |
dc.title | Online minimax optimal density estimation and anomaly detection in nonstationary environments | |
dc.title.alternative | Durağan olmayan ortamlarda çevrimiçi minimaks optimal yoğunluk tahmini ve anomali tespiti | |
dc.type | masterThesis | |
dc.date.updated | 2020-08-25 | |
dc.contributor.department | Elektrik-Elektronik Mühendisliği Anabilim Dalı | |
dc.identifier.yokid | 10162735 | |
dc.publisher.institute | Mühendislik ve Fen Bilimleri Enstitüsü | |
dc.publisher.university | İHSAN DOĞRAMACI BİLKENT ÜNİVERSİTESİ | |
dc.identifier.thesisid | 470054 | |
dc.description.pages | 80 | |
dc.publisher.discipline | Diğer |