Show simple item record

dc.contributor.advisorDemiroğlu, Cenk
dc.contributor.authorGüner, Ekrem
dc.date.accessioned2020-12-06T14:17:55Z
dc.date.available2020-12-06T14:17:55Z
dc.date.submitted2013
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/103653
dc.description.abstractMetinden Konuşma Sentezleme (MKS) alanında en yaygın kullanılan iki teknik, BirimSeçmeli MKS (BMKS) ve Saklı Markov Modeli tabanlı MKS (SMKS) teknikleridir.MKS sistemleri son dönemlerde kullanılan en dominant teknik olarak ortaya çıkarken,SMKS sistemleri de gün geçtikçe artan popülaritesi ile öne çıkmaktadır. Her iki sisteminde kendine özgü avantaj ve dezavantajları bulunmaktadır. BMKS sistemleriçok başarılı olmalarına rağmen, dinleyicileri rahatsız eden ani süreksizlikler içermektedirler.SMKS sistemleri ise birim seçme algoritmasının ortaya çıkardığı bu hatalardanyoksundurlar. BMKS sistemleri, kullanılan ses veritabanının büyüklüğüyleorantılı olarak yüksek kalitede ses üretebilmektedir. SMKS sistemleri ise çok küçükbir saklama alanı kullandıklarından, daha yaygın olarak gömülü uygulamalarda tercihedilmektedir. Bu tez çalışmasında, morfolojik olarak zengin diller için, SMKS sisteminitemel alan ve veri kullanımını yine makul seviyede tutarak kalitesini arttırmayıhedefleyen bir melez istatistiksel/birim seçmeli MKS sistemi önerilmiştir. Öncelikle,iki sistemin karşılaştırması yapıldıktan sonra, önerilen melez sistemin ana fikri verilmiştir. Daha sonra melez sistem, geliştirilen temel SMKS sistemi ile birlikte ayrıntılı olarakanlatılmıştır. Temel ve melez sistemin performanslarının ölçülmesi için de, subjektifve objektif testler gerçekleştirilmiştir. Temel sistemin anlaşılabilirlik ve kalite puanlarının, literatürde İngilizce dili için yapılan çalışmalarda rapor edilen değerlerle benzer olduğu görülmüştür. AB tercih testlerinde ise, dinleyicilerin önerilen melez sistemitemel sisteme tercih ettikleri görülmüştür.
dc.description.abstractTwo most prominent examples of Text-to-Speech (TTS) systems are Unit Selection based TTS (UTTS) and the Hidden Markov Model (HMM) based TTS (HTTS). UTTS has been the dominant approach of the last decade while HTTS has been increasingly getting more attention from the TTS research community. Both systems have distinct pros and cons. Despite its success, UTTS has some disadvantages such as the sudden discontinuities in speech which cause distraction whereas HTTS lacks of those artifacts. However, UTTS systems offer high quality speech given a huge unit database where the storage is not a problem. On the other hand, the small memory footprint requirement of HTTS systems makes them attractive for embedded devices. Here, a novel hybrid statistical/unit selection TTS system for morphologically rich languages is proposed. The proposed hybrid system aims at improving the quality of the baseline HTTS system while keeping the memory footprint small. First, the motivation of the proposed hybrid system is given after the comparison of both systems. Then the proposed hybrid system is presented along with the details of the baseline HTTS system. In order to assess the performances of proposed and baseline systems, the subjective and objective tests are conducted. Intelligibility and quality scores of the baseline system are comparable to the MOS scores of English reported in the Blizzard Challenge tests. Results of the AB preference tests revealed the listeners' preference for the hybrid system over the baseline system.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectDilbilimtr_TR
dc.subjectLinguisticsen_US
dc.subjectElektrik ve Elektronik Mühendisliğitr_TR
dc.subjectElectrical and Electronics Engineeringen_US
dc.titleA hybrid statistical/unit-selection text-to-speech synthesis system for morphologically rich languages
dc.title.alternativeMorfolojik olarak zengin diller için melez istatistiksel/birim seçmeli metinden konuşma sentezleme sistemi
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentElektrik-Elektronik Eğitimi Anabilim Dalı
dc.identifier.yokid10003298
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityÖZYEĞİN ÜNİVERSİTESİ
dc.identifier.thesisid335571
dc.description.pages73
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess