Sinüs modeli ile düşük bit hızlarında konuşma kodlama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
SİNÜS MODELİ İLE DÜŞÜK BİT HIZLARINDA KONUŞMA KODLAMA Gürhan Bulu Hacettepe Üniversitesi, Elektrik ve Elektronik Mühendisliği Bölümü ÖZ Gerçekleştirilen çalışmada, sinüs analiz/sentez yöntemi kullanılarak konuşma sinyali düşük bit hızlarında kodlanmıştır. Sinüs yöntemi konuşmanın analiz ve sentezlenmesine yeni bir bakış açısı getirmiştir. Bu yöntemde, konuşma değişik genlik, frekans ve evrede olan sinüslerin toplamı biçiminde ifade edilmektedir. Kısa zaman Fourier dönüşümünden elde edilen parametrelerle konuşmanın çok düşük bit hızlarında kodlanması mümkün değildir. Bu yüzden parametre sayılarının azaltılması yoluna gidilmiş ve sinüslerin genlik, frekans ve evreleri daha az parametre kullanılarak modellenmiştir. Daha sonra bu parametreler nicemlenerek konuşma 2400 b/s, 1600 b/s, 1200 b/s gibi düşük bit hızlarında kodlanmıştır. Sonuçta sinüs modeli ile 1200 b/s hızında anlaşılır kalitede konuşma kodlamanın mümkün olduğu gözlenmiştir. Anahtar Kelimeler: Ses kodlama, Düşük bit hızlarında ses kodlama, Sinüs modeli ile konuşma analiz/sentezi, Sinüs dönüşümü, Sinüs dönüşümü ile ses kodlama, Vektör nicemleme, DÖK parametrelerinin vektör nicemlenmesi Danışman: Yrd. Doç. Dr. A. Semih Bingöl, Hacettepe Üniversitesi, Elektrik ve Elektronik Mühendisliği Bölümü IV SPEECH CODING AT LOW BIT RATES USING THE SINUSOIDAL MODEL Gürhan Bulu Hacettepe University, Department of Electrical and Electronics Engineering ABSTRACT In this study, speech is coded at low bit rates using the sinusoidal analysis/synthesis method. The sinusoidal method is a relatively new method in speech analysis/synthesis. In this method, speech is characterized by the sum of sine waves with different amplitudes, frequencies and phases. Parameters which are estimated from the Short-Time Fourier Transform, are not suitable to code speech at low bit rates. Therefore, sine-wave amplitudes, frequencies and phases are modeled using fewer parameters. Then, these reduced parameter sets are quantized to code speech at 2400 bps, 1600 bps and 1200 bps. It has been observed that intelligible quality speech can be coded at 1200 bps using the sinusoidal method. Keywords: Speech coding, Low bit rate speech coding, Sinusoidal analysis/synthesis, Sinusoidal transform, Sinusoidal transform coding, Vector quantization, Vector quantization of LPC coefficients Advisor: Assist. Prof. A. Semih Bingöl, Hacettepe University, Department of Electrical and Electronics Engineering
Collections