Learning filter scale and orientation in convolutional neural networks
dc.contributor.advisor | Tek, Faik Boray | |
dc.contributor.author | Çam, İlker | |
dc.date.accessioned | 2020-12-04T17:16:51Z | |
dc.date.available | 2020-12-04T17:16:51Z | |
dc.date.submitted | 2019 | |
dc.date.issued | 2019-04-09 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/93786 | |
dc.description.abstract | Evrişimsel sinir ağlarında filtre boyutu, sayısı ve ortaklama boyutu elle seçilmek- tedir. Derin katmanlı sinir ağları hiyerarşik çok ölçekli temsiller öğrenebilme- sine rağmen, sabit filtre boyutları farklı ölçekteki öğrenilebilecek filtre sayısını sınırlamaktadır. Aynı katmanda farklı ölçeklerde filtreleri eğitim aşamasında öğrenebilen bir mimari olabilir mi?Önerilen filtre modelimizde filtre ölçek ve oryantasyonları geriye yayılım ile öğre- nilebilir. Bu şekilde, aynı evrişimsel katmanda farklı ölçek ve oryantasonlarla büyük ve küçük objeleri tanımlayabiliriz. Önerilen model, nispeten büyük filtre (ızgara) boyutlarına sahiptir. Türevi olan bir çevreleyici fonksiyon ile filtrelerin efektif ölçeklerini ve oryantasyonlarını, evrişim işlemine girmeden, katsayı ma- trislerini maskeleyebiliriz. Bu sayede, sadece çevreleyici fonksiyon içerisindeki katsayılar eğitilecektir.Bu çalışmamızda, çok değişkenli (2 Boyutlu) Gaussian fonksiyonunu çevreleyici fonksiyon olarak kullandık. Kovaryans matrisinin geriye yayılım yöntemiyle eği- tilmesiyle, çevreyeliyici fonksiyonun büyüyüp, küçüldüğünü ve dönebildiğini gös- terdik. Çevreliyici fonksiyonun eğitilebildiğini ve katsayılarla işbirliğini, modelin en basit haliyle deneyimledik. Derin katmanlardaki performansını, derin ve geniş mimariler üzerinde çalıştırdık ve performansını izledik. Önerilen modeli, MNIST, MNIST-cluttered ve CIFAR-10 veri kümelerinde çaıştırdık ve geleneksel evrişim- sel sinir ağ mimarilerindeki çalışma performanslarıyla karşılaştırdık. Sonuçlar, önerdiğimiz modelin, farklı ölçek ve oryanyasyonlarda, aynı katmanda, filtreler öğrenebildiğini gösterdi. Ayrıca, deneylerimiz, adaptif evrişimsel katmanının aynı, özellikle veri kümesinde farklı ölçeklerde obje ve gürültülü arkaplan içeren veri kümelerinde daha iyi çalıştığını gösterdik | |
dc.description.abstract | Convolutional neural networks have many hyper-parameters such as filter size, number of filters, and pooling size, which require manual tuning. Though deep stacked structures are able to create multi-scale and hierarchical representations, manually fixed filter sizes limit the scale of representations that can be learned in a single convolutional layer. Can we adaptively learn to scale the filters on training time?Proposed adaptive filter model can learn the scale and orientation parameters of filters can be learned using back propagation. Therefore, in a single convolution layer, we can create filters of different scale and orientation that can adapt to small or large features and objects. The proposed model uses a relatively large base size (grid) for filters. In the grid, a differentiable function acts as an envelope for the filters. The envelope function guides effective filter scale and shape/orientation by masking the filter weights before the convolution. Therefore, only the weights in the envelope are updated during training.In this work, we employed a multivariate (2D) Gaussian as the envelope function and showed that it can grow, shrink, or rotate by updating its covariance matrix during back propagation training . We tested the model with its basic settings to show the collaboration of weight matrix and envelope function is possible. We used a deeper architecture to show the performance on deeper and wider networks. We tested the new filter model on MNIST, MNIST-cluttered, and CIFAR-10 and compared the results with the networks that used conventional convolution layers. The results demonstrate that the new model can effectively learn and produce filters of different scales and orientations in a single layer. Moreover, the experiments show that the adaptive convolution layers perform equally; or better, especially when data includes objects of varying scale and noisy backgrounds | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Learning filter scale and orientation in convolutional neural networks | |
dc.title.alternative | Evrı̇şı̇msel sı̇nı̇r ağlarında fı̇ltre ölçeğı̇ ve oryantasyonunun öğrenı̇lmesı̇ | |
dc.type | masterThesis | |
dc.date.updated | 2019-04-09 | |
dc.contributor.department | Bilgisayar Mühendisliği Anabilim Dalı | |
dc.subject.ytm | Learning algorithms | |
dc.subject.ytm | CNN | |
dc.subject.ytm | Neural networks | |
dc.identifier.yokid | 10234809 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | IŞIK ÜNİVERSİTESİ | |
dc.identifier.thesisid | 537803 | |
dc.description.pages | 53 | |
dc.publisher.discipline | Diğer |