Stereo vision utilizing deep learning
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tez, bilgisayarlı görme araştırmalarındaki en zorlu konulardan birini temsil ettiği için stereo görüş tabanlı derinlik tahmini sorununa odaklanmaktadır.Son zamanlarda, derin öğrenme yöntemleri bilgisayar vizyonu araştırmacıları ve uzmanları arasında yaygın bir şekilde benimsenmiştir, bu nedenle ana hedef olarak kompaktlık ve eğitim kolaylığı olan derin bir öğrenme mimarisinin tasarımı ve uygulanması ile bu çabayı sürdürüyoruz.Göreve seçilen Derin Sinir Ağı mimarisi Tamamen Konvolüsyonel Enkoder-Kod Çözücüdür ve eğitim verileri çıktı etiketleri olarak eşitlik haritalarına sahip stereo çift görüntülerdir, bu tasarımda alandaki en son tekliflerde ve yeni kompaktta birkaç değişiklik önerilmiştir ağlar eğitilir ve test edilir.Anahtar Kelimeler: Bilgisayar Görüşü, Makine Öğrenme, Derin Sinir Ağı, Encoder- Decoder, Eşitsizlik Tahmini This thesis fixates on the problem of stereo vision based depth estimation as it represents one of the most challenging topics in computer vision research.Recently, deep learning methods gained wide spread adoption among computer vision researchers and specialists, thus the thesis continues on this effort with the design and implementation of a deep learning architecture that have compactness and ease of training as the main target.The Deep Neural Network architecture chosen to the task is a Fully Convolutional Encoder-Decoder and training data are stereo pair images with disparity maps as the output labels, several modifications are proposed in this design on the most recent proposals in the field and the new compact networks are trained and tested.Keywords: Computer Vision, Machine Learning, Deep Neural Networks, Encoder- Decoder, Disparity estimation
Collections