Gözetimli makine öğrenmesi yoluyla türe göre metinden ses sentezleme
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tez çalışmasında ses sentezleme konusu ile ilgili genel bir literatür taraması yapılarak, ses sentezlemenin bir çeşidi olan metinden konuşma sentezleme konusu ağırlıklı olarak ele alınmıştır.Giriş bölümünde temel bilgilere yer verilerek literatürde ses sentezleme ile ilgili yapılan çalışmalara değinilmiştir. İkinci bölümde ses sentezleme ve çeşitleri ayrıntılı biçimde incelenmiştir. Üçüncü bölümde makine öğrenmesi konusu hakkında bilgiler verilerek bazı önemli makine öğrenme algoritmaları detaylıca açıklanmıştır. Dördüncü bölümde deneysel bir çalışma ile bazı makine öğrenmesi algoritmaları karşılaştırılmıştır. Sonraki bölümlerde metinden konuşma sentezleme için önerilen bir uygulama ile sonuçların değerlendirilmesine yer verilmiştir.Yapılan uygulamada düz metin türlerinin monoton, robotik bir ses biçimi olarak seslendirilmesi yerine, metinleri gruplara ayırarak farklı metin türlerinin kendi alanlarına uygun olduğu düşünülen farklı ses biçimleri şeklinde seslendirilmesinin daha doğal olacağı düşünülmüştür. Bu işlem için öncelikle metinler önişleme aşamasından geçirilerek sınıflandırma işlemi yapılmıştır. Hangi metin türünün hangi ses tonlamaları ile seslendirileceğine karar verdikten sonra, kendi kategorisine uygun olmayan metinler, sınıflandırıldığı türün ses özelliklerine göre seslendirilmiştir. Böylece varsayılan olarak belirlenen seslendirmelerin dışında bir ses tonu ile karşılaşıldığında yanlış sınıflandırma yapıldığı açık bir şekilde görülmüştür. In this thesis study, a general literature review is done about speech synthesis and text to speech synthesis subject, a type of speech synthesis, is mainly researched.In introduction part, base information is given and studies on speech synthesis are mentioned. In second part, speech synthesis and its types are studied in detail. In third part, it's given information about machine learning subject and important machine learning algorithms are explained. In fourth part, some machine learning algorithms are compared with an experimental study. In the following chapters it is suggested to evaluate the results with an application suggested for speech synthesis.Rather than synthesing plain text types as a monotone, robotic sound format, it is thought to be more natural to sound different types of texts into different sound formats that are thought to be appropriate for their respective fields, by separating them into groups. For this process, the texts are first passed through the pre-processing stage and classified. After deciding which text type to synthesize with which voices, texts that are not appropriate for their category, are synthesized according to the sound characteristics of the type that is classified. Thus, when a tone other than the default voices is encountered, it is clearly seen that an incorrect classification is made.
Collections