Show simple item record

dc.contributor.advisorSaraçoğlu, Rıdvan
dc.contributor.authorKoç, Ferdi
dc.date.accessioned2020-12-10T11:13:46Z
dc.date.available2020-12-10T11:13:46Z
dc.date.submitted2019
dc.date.issued2019-10-14
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/257301
dc.description.abstractSes tanıma insan sesinin bir mikrofon vasıtasıyla bilgisayar tarafından algılanarak tanınması işlemidir. Gelişen teknoloji sürecinde kendine önemli bir yer oluşturmaya başlamıştır. Bu çalışmada, daha önceden kaydedilmiş konuşma komutlarının tanınması için derin öğrenme yöntemleri kullanılmıştır. İki boyutlu derin öğrenme yapılarında işlenmek üzere ses verileri spektogram yöntemi kullanılarak görüntüye çevrilmiştir. Spektogram yöntemi hızlı fourier dönüşümü temelli alt örnekleme tekniğidir. Beş farklı evrişimsel sinir ağı modeli oluşturularak spektogram tekniği ile elde edilen görüntülerin sınıflandırılması gerçekleştirilmiştir. Karşılaştırmalı analiz kapsamında veri seti ayrı kategoriler halinde farklı sınıf sayısına bölünmüştür. Sınıf sayısının derin öğrenme yapıları üzerindeki etkisi araştırılmıştır. Ayrıca, farklı sayıda eğitim verileri kullanılarak ağın duyarlılığı değerlendirilmiştir. Ağların performansını değerlendirmek için Softmax ve Destek Vektör Makinesi olmak üzere iki sınıflandırıcı kullanılmıştır. Elde edilen sonuçlar dikkate alındığında % 95'in üzerinde sınıflama doğruluğuna ulaşıldığı görülmüştür.
dc.description.abstractVoice recognition is the process by which the human voice is detected and recognized by the computer through a microphone. It has started to create an important place for itself in the developing technology process. In this study, deep learning methods were used to recognize previously recorded speech commands. In order to be processed in two-dimensional deep learning structures, audio data were converted to image by using spectogram method. Spectogram method is a sub-sampling technique based on fast fourier transform. Five different convolutional neural network models were created by using the spectogram technique and the trainings were performed with different data numbers. The data set is divided into different number of classes as separate categories. The effect of the number of classes on deep learning structures was investigated. Furthermore, the sensitivity of the network with different training data numbers was evaluated. In order to evaluate the performance of the networks, two classifiers were used as Softmax and Support Vector Machine. Over 95% accuracy was achieved.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectElektrik ve Elektronik Mühendisliğitr_TR
dc.subjectElectrical and Electronics Engineeringen_US
dc.titleSpektrogram tekniği kullanılarak derin öğrenme yöntemleri ile ses tanıma
dc.title.alternativeSound recognition with deep learning methods using spectrogram technique
dc.typemasterThesis
dc.date.updated2019-10-14
dc.contributor.departmentElektrik-Elektronik Mühendisliği Anabilim Dalı
dc.identifier.yokid10281220
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityVAN YÜZÜNCÜ YIL ÜNİVERSİTESİ
dc.identifier.thesisid568103
dc.description.pages84
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess