Ses yolunun matematik modeli
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
IV ÖZET Bu çalışmada, sekiz ünlü için çeşitli modellerden elde edilen ses bölgesi alan -fonksiyonunun bilgisayar ekranında çizilerek sağır ve dilsizlerin eğitiminde kullanılabilecek algoritmaların geliştirilmesi amaçlanmıştır. îlk aşamada, 10 bölümden oluşan ses bölgesi için durum_uzay modeli geliştirilmiştir. Elde edilen model lineer olmadığından, çözüm için enine kesit alanlarına verilen başlangıç değerleri önemli rol oynamaktadır. Ayrıca lineer tahmin parametrelerinden bulunan formant.Frekanslarının değişkenliği de göz önüne alınırsa bu modelin geçerli bir model olmadığına karar verilmiştir. Yine de dört bölümden oluşan ses bölgesi için geliştirilen durum_uzay modelinden sekiz ünlü için enine kesit alanları elde edilmiş ve sonuçlar diğer modeller ile karsı lastırı lmıstır. fes bölgesinin, girdi ve çıktısı belli olan bilinmeyen bir sistem gibi düşünülerek, sistem belirleme yöntemi ile transfer -fonksiyonu yani tüm kutup modeli geliştirildi. Modele girdi alarak, çeşitli genlikte ve çeşitli noktalarda impals zinciri ile gırtlaktan ölçülen değerler uygulanmıştı r. Ses bölgesinin transfer -fonksiyonunun kutup ve sıfırlarını kullanarak enine kesit alanlarının bulunması için kutup-sıfır modeli geliştirildi. Çeşitli kriterler uygulanarak trans-fer fonksiyonunun optimum dereceleri belirlendi. Bu dereceler için elde edilen kutup ve sıfırlara, formant frekanslarından elde edilen kutup ve sıfırlar yaklasıncaya kadar ses bölgesinin alan fonksiyonunun katsayıları değiştirilerek sekiz ünlü için enine kesit alanları elde edildi. Dilin. daralma yerini en iyi, kutup-sıfır modelinden elde edilen sonuçlar göstermektedir. Fakat bu değerler, uzun süren iterasyonlar sonucu elde edildiğinden, kullanıcıya hemen aktarı lamamaktadır. Ancak değerler dosyalanıp, istenildiği zaman ekranda görülebilir. Enine kesit alanları hemen kullanıcıya iletilmek istenirse tüm-kutup modeli kullanılabilir. Ses bölgesinin enine kesitinin dairesel olduğu kabul edilerek, elde edilen alan değerlerinden bulunan yarıçapların fonksiyonları çizdirildi. Böylece ses bölgesinin sekiz ünlü için aldığı sekil kafa içinde bilgisayar ekranında görülebilmektedir. Ayrıca, dosyalanmış değerler ile o anda söylenmiş olan ünlüye ait değerler karşılaştırmalı alarak ekranda izlenebilmektedir. SUMMARY The purpose of this study is to draw the vocal tract -For eight vowels on the computer screen, thus to help in training of the deaf. In the first stage, the state_space model of the vocal tract which consists of ten sections is obtained. Since the obtained model is not linear, initial values of the cross-sectional areas are very important to obtain a solution which satisfies the constraints. In addition, considering the variability of the formant frequencies obtained from tine linear predictive coefficients this model is decided not to be valid. However, the crossjsectional areas for eight vowels are obtained from the state_space model which is developed for a vocal tract composed of four sections and the results are compared with that of the other models. Assuming the input and output of the vocal tract are known, parameters of the vocal tract transfer function are determined. Vocal tract transfer function is assumed to be an all-pole model. Measured values from the glottis and the impulse train which has various amplitudes and initial points are applied to the model as inputs. Pole_zero model is developed to obtain the cross-sectional areas by using the poles and zeros of the vocal tract transfer function. Optimal degrees of the pole-zero model is determined by applying various criteria. Obtained poles and zeros for these optimal degrees are compared with the results obtained from the formant frequencies. The cross-sectional areas for eight vowels are obtained by varying the coefficients of area function of the vocal tract until both poles and zeros obtained from different methods are close to each other. The constriction point of the tongue is best obtained using the pole_zero model. Since iterations take a long time, the cross- sectional areas can not be transferred to the user in a short time. But, these values are stored and shown on the screen whenever it is required. If the transfer of these values to the user is required in a short time, the all-pole model must be used. Since the shapes of the cross-sections of the vocal tract are assumed as circular, radius of the crossjsectional areas are determined and drawn on the computer screen. Thus, the shape of the vocal tract for eight vowels is shown in human head on the screen. In addition, the values of a vowel which is said at that instant and stored values are shown on the screen together.
Collections