Show simple item record

dc.contributor.advisorErdoğan, Hakan
dc.contributor.authorIşik, Yusuf Ziya
dc.date.accessioned2020-12-10T07:36:37Z
dc.date.available2020-12-10T07:36:37Z
dc.date.submitted2010
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/217307
dc.description.abstractSon on yılda, metin bağımsız konuşmacı tanıma alanında yapılan calışmalar konuşmacıiçi değişintileri modelleme esnasında giderme üzerine odaklanmıştır. Konuşmacı içideğişintiler kanal etkilerinden, fonetik içerikten, veya konuşma stili, duygusal durum,sağlık ve benzeri sebeplerle konuşmacının kendisinden kaynaklanabilir. Ortak FaktörAnalizi, Toplam Değişkenlik Uzayı, Sıkıntı Öznitelik İzdüşümü literatürde oturumlararası değişkenlikleri gidermede kullanılan yöntemlerin en başarılılarındandır.Bu çalışmada, önerilen metodlardaki kanal uzayının düşük boyutlu olma varsayımınıirdeledik ve akustik uzayı yerel bölgelere ayırmayı önerdik. Konuşmacı içi değişintilerher yerel bölgede bağımsız olarak bastırıldı. İleriki modelleme ve skorlama safhalarınınyerel mi yoksa global mi yapılacağına bağlı olarak iki farklı yapı önerildi.Konuşmacı içi değişintinin elemanlarından biri olan oturum içi değişkenlikler üzerindede çalışıldı. Oturum içi değişkenliklerin ana kaynağı bir ses dosyasının farklı kısımlarıarasındaki fonetik içerik farklılıklarıdır. Fonetik içerik farklılıkları, akustik birimlerarası değişintilerden kaynaklanabileceği gibi aynı akustik birimin farklı çıkarımlarındanda kaynaklanabilir. Bu değişintileri giderme amaçlı olarak, eğitim verisinin rasgeleörneklenmesine dayalı bir metod önerdik. Önerilen metodun hem kısa hem de uzuntest verilerinde etkin olduğu gösterildi.
dc.description.abstractIn text-independent speaker verification, studies focused on compensating intra-speakervariabilities at the modeling stage through the last decade. Intra-speaker variabilitiesmay be due to channel effects, phonetic content or the speaker himself in the form ofspeaking style, emotional state, health or other similar factors. Joint Factor Analysis,Total Variability Space compensation, Nuisance Attribute Projection are some of themost successful approaches for inter-session variability compensation in the literature.In this thesis, we criticize the assumptions of low dimensionality of channel space in thesemethods and propose to partition the acoustic space into local regions. Intra-speakervariability compensation may be done in each local space separately. Two architecturesare proposed depending on whether the subsequent modeling and scoring steps will alsobe done locally or globally.We have also focused on a particular component of intra-speaker variability, namelywithin-session variability. The main source of within-session variability is the differencesin the phonetic content of speech segments in a single utterance. The variabilities inphonetic content may be either due to across acoustic event variabilities or due to differencesin the actual realizations of the acoustic events. We propose a method to combatthese variabilities through random sampling of training utterance. The method is shownto be effective both in short and long test utterances.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectElektrik ve Elektronik Mühendisliğitr_TR
dc.subjectElectrical and Electronics Engineeringen_US
dc.titleLocal representations and random sampling for speaker verification
dc.title.alternativeKonuşmacı doğrulama için yerel betimlemeler ve rasgele örnekleme
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentElektronik Mühendisliği Anabilim Dalı
dc.subject.ytmGaussian mixture model
dc.subject.ytmSpeaker verification system
dc.identifier.yokid381487
dc.publisher.instituteMühendislik ve Fen Bilimleri Enstitüsü
dc.publisher.universitySABANCI ÜNİVERSİTESİ
dc.identifier.thesisid309376
dc.description.pages77
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess