Show simple item record

dc.contributor.advisorAkgün, Bekir Tevfik
dc.contributor.authorKizilirmak, Fahrettin Orkun
dc.date.accessioned2021-05-08T07:29:26Z
dc.date.available2021-05-08T07:29:26Z
dc.date.submitted2019
dc.date.issued2019-11-28
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/630435
dc.description.abstractBu çalışmanın amacı sürücüsüz araçlara yönelik örnek toplama açısından verimli bir uçtan uca derin öğrenme algoritması geliştirmektir. Bunu da elde edilen örnekleri seçici olarak sınıflandırma ile, sürüş politikasını geliştirmek adına, uzman sürücüyü en az sayıda çağırarak yapmaya çalışmaktır. Uçtan uca taklit öğrenmesi sürücüsüz sürüş politikalarında kullanılan popüler bir yöntemdir. Standart yaklaşım giriş (kamera görüntüleri) ve çıkış (direksiyon açısı vb.) ikililerini uzman sürücüden toplayıp bir derin sinir ağı içerisine yerleştirmek üzerinedir. Bu yaklaşım geçmişte bazı başarılı örnekler sergilemiş olsa da bir sürüş politikası öğrenmek uzman sürücüden alınan çok fazla örneğe ihtiyaç duymaktadır ki bu da kaynak açısından çok maliyetlidir. Bu çalışmada güvenli veri seti kümelemesi (SafeDAgger) yaklaşımı üzerine temellendirilmiş, öğrenilmiş politikanın farklı güzergâh sınıflarına ayrıldığı ve her bir sınıfın her bir tekrarda zayıflıklarına göre değerlendirildiği, özgün bir algoritma çerçevesi geliştirilmiştir. Her bir zayıf güzergâh parçası belirlendikten sonra, örnek toplayan algoritma yalnızca bu zayıf bölgelerde uzman politikayı çağırmak üzere tanımlanmıştır, bu da uzmana yapılan çağrıların sayısını ve politikanın yakınsama oranını önemli bir ölçüde azaltmaktadır. Yapılan simülasyon sonuçları göstermektedir ki yaklaşım uzmandan aynı sayıda örnek toplanırken standart SafeDAgger algoritmasına göre önemli ölçüde daha başarılı sonuçlar sunmuştur.
dc.description.abstractThe objective of this work is to develop a sample efficient end-to-end deep learning method for self-driving cars, where it is attempted to minimize number of times the expert driver is called to improve the driving policy, through selective analysis of the obtained samples. End-to-end imitation learning is a popular method for computing self-driving car policies. The standard approach relies on collecting pairs of inputs (camera images) and outputs (steering angle etc.) from an expert policy and fitting a deep neural network to this data to learn the driving policy. Although this approach had some successful demonstrations in the past, learning a good policy might require a lot of samples from the expert driver, which might be resource-consuming. In this work, a novel framework developed based on the Safe Dataset Aggregation (safe DAgger) approach, where the current learned policy is automatically segmented into different trajectory classes, and the algorithm identifies trajectory segments/classes with weak performance at each step. Once the weak trajectory segments are identified, sampling algorithm focuses on calling the expert policy only on these segments, which significantly lowers both the number of times the expert is called and the convergence rate. The presented simulation results show that the proposed approach can yield significantly better performance compared to the standard Safe DAgger algorithm, while using the same number of samples from the expert.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleVerimli seçmeli güvenli bir veri seti kümelemesi önerisi ve otonom sürüşe yönelik bir uygulaması
dc.title.alternativeA sample efficient selective safe data aggregeration proposal and an application for autonomous drive
dc.typemasterThesis
dc.date.updated2019-11-28
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.identifier.yokid10249411
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityİSTANBUL OKAN ÜNİVERSİTESİ
dc.identifier.thesisid584448
dc.description.pages86
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess