Video concept classification and retrieval

Ergün Akyüz, Hilal

dc.contributor.advisor	Sert, Mustafa
dc.contributor.author	Ergün Akyüz, Hilal
dc.date.accessioned	2020-12-04T08:39:24Z
dc.date.available	2020-12-04T08:39:24Z
dc.date.submitted	2016
dc.date.issued	2018-08-06
dc.identifier.uri	https://acikbilim.yok.gov.tr/handle/20.500.12812/66822
dc.description.abstract	Video içerikleri içerisinde arama ve geri getirme bilgisayarlı görme alanındayükselen bir konudur. Bu alandaki zorluklar iki başlık altında toplanabilir; videoimgeleri içerisindeki anlamsal bilginin çıkarımı kolay bir iş değildir ve videoiçeriklerini analiz edebilmek için yüksek verimlilikteki algoritmalara ihtiyaçduyulmaktadır. Bu alanda çalışan araştırmacılar anlamsal bilginin çıkarılmasıkonusuna 20 yılı aşkın bir süredir eğilmektedir ve bu alandaki iyileştirmelere halaihtiyaç duyulmaktadır. Son yıllarda bilgisayar mimarilerinin verimliliğinde yaşananartışlar hem algoritmaların başarımlarını hem de karmaşıklıklarını artırmıştır ki buda efektif algoritma seçimine yeni bir boyut kazandırmaktadır. Bu tezçalışmasında, amacımız video verileri içindeki görsel kavramların arama ve gerigetirme uygulamalarına yönelik sınıflandırılmasıdır. Bu amaç doğrultusunda görselkavram sınıflandırma ve geri getirme bazlı bir sistem öneriyoruz. Günümüzdeçokça tercih edilen iki görsel sınıflandırma yaklaşımını sistemimize entegreediyoruz; `Kelime Kümesi` yaklaşımı ve `Evrişimsel Sinir Ağları` yaklaşımı. Bunaek olarak, kelime kümesi temsili ve evrişimsel sinir ağları aşamalarındaoptimizasyonlar yaparak, öğrenme algoritmalarının başarımlarını artırıyoruz. Gerigetirme için kavram ve örnek tabanlı sorgulama yöntemlerinin gösteriminiyapıyoruz ve literatürde en çok tercih edilen Oxford Buildings ve Paris verikümeleri üzerinde sonuçlarımızı görselliyoruz. Sonuçlar gösteriyor ki, kelimekümesi temsili ve evrişimsel sinir ağları aşamalarında yapılan optimizasyonlaryüksek performans artışlarını olası kılmaktadır ve derin öğrenme tabanlı metodlarkelime kümesi yaklaşımından daha iyi sonuçlar vermektedir.
dc.description.abstract	Search and retrieval in video content is a trending topic in computer vision.Difficulties of this research topic is two folds; extracting semantic information fromstructure of video images is not a simple task and demanding nature of videocontent requires efficient algorithms. Semantic information extraction is challengedby researchers for more than two decades, yet new improvements are stillwelcome by the community. Recent burst of efficient computer hardwarearchitectures has exploited both accuracy and complexity of many algorithmsadding a new dimension to the efficient algorithm selection. In this thesis, our goalis to classify visual concepts in video data for content-based search and retrievalapplications. To this end, we introduce a complete visual concept classificationand retrieval system. We use two state-of-the-art methods, namely `Bag-of-Words`(BoW) and `Convolutional Neural Network` (CNN) architecture for visual conceptclassification. The performance of the classifiers is further improved by optimizingthe processing pipeline steps. For retrieval, we provide concept- and content-based querying of video data and perform evaluations on Oxford Buildings andParis datasets. Results show that, a substantial performance gain is possible byoptimizing processing pipelines of the classifiers and deep learning basedmethods outperform the BoW.	en_US
dc.language	English
dc.language.iso	en
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	Attribution 4.0 United States	tr_TR
dc.rights.uri	https://creativecommons.org/licenses/by/4.0/
dc.subject	Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol	tr_TR
dc.subject	Computer Engineering and Computer Science and Control	en_US
dc.title	Video concept classification and retrieval
dc.title.alternative	Video kavram sınıflandırma ve geri erişimi
dc.type	masterThesis
dc.date.updated	2018-08-06
dc.contributor.department	Bilgisayar Mühendisliği Anabilim Dalı
dc.identifier.yokid	10101081
dc.publisher.institute	Fen Bilimleri Enstitüsü
dc.publisher.university	BAŞKENT ÜNİVERSİTESİ
dc.identifier.thesisid	418583
dc.description.pages	66
dc.publisher.discipline	Diğer

Files in this item

Name:: yokAcikBilim_10101081.pdf
Size:: 3.209Mb
Format:: PDF
Description:: File_10101081

View/Open

This item appears in the following Collection(s)

TEZLER

Show simple item record

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess