Implementation of a text-to-speech system with machine learning algorithms in Turkish
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışma Türkçe için eklemeli metin seslendirme sistemi oluşturmak amacındadır.Türkçe metin seslendirme sistemi eklemeli birim seçme yaklaşımına dayanmaktadır. Sistemdirek kaydedilen ve sürekli bir konuşmadan kesilen birimlerden oluşan iki farklı sesveritabanına sahiptir. Birimler konuşmadan elle ve otomatik olarak kesilmiştir. Sessinyalinin sıfırdan geçiş sayısı ve sesin enerjisi gibi sinyal özellikleri otomatik kesme işlemiiçin kullanılmıştır. Birleştirme işleminde sesler arasında yumuşak geçişler için PerdeSenkronize Üstüste Ekleme (PSOLA-Pitch Synchronous Overlap-Add) algoritmasıkullanılmıştır.Sistem başarısının ölçülmesi için bir takım öznel testler kullanılmaktadır. Sistemdeüretilen seslerin kalitesi iki noktaya bağlı olarak ölçülmüştür: Anlaşılabilirlik ve doğallık.İnsan sesine yakınlık olarak tanımlanan doğallık için MOS testi, anlaşılabilirlik için iseahenk testi (DRT) ve kavrama testi (CT) uygulanmıştır.Sistem basit teknikler kullanıyor olmasına rağmen, seçilen eklemeli methodTürkçe'nin yapısına çok uygun olduğu için ümit verici sonuçlar üretmektedir. This study is intended to build the framework of a concatenative TTS (Text toSpeech) system for Turkish. Turkish TTS system is based on concatenative, unit selectionapproach. System contains two different speech databases comprised of units which aredirectly recorded and cut from a continuous speech. The units have been cut from speechmanually and automatically. Some digital signal features such as zero crossing rate andenergy of speech have been used for automatic cutting. While concatenating the units,PSOLA (Pitch Synchronous Overlap and Add) algorithm has been used for smoothing.Some subjective tests are used to measure the system success. The quality of thesynthesized speech is measured depending on two criteria: Intelligibility and naturallness.For naturalness defined as closeness to human speech, Mean Opinion Score (MOS), forintelligibility defined as the ability to be understood, Diagnostic Rhyme Test (DRT) andComprehension Test (CT) have been applied.Although the system uses simple techniques, it provides promising results for TurkishTTS, since the selected concatenative method is very well suited for Turkish languagestructure.
Collections