Radial basis function neural network algorithms for phoneme recognition
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
KISA ÖZET Bu tez Radyal Tabanlı Yapay Sinir Ağı 'nda (RTYSA) merkez vektörlerinin belirlenmesinde, giriş-çıkış uzayı örneklemesi metodunun kullanılmasının üç erkek konuşmacıdan alman Türkçe sesli harf,(/a/, /e/, N, İM, /o/, /öl, l/xl, IvJ), örneklerinin ve bir erkek konuşmacının çok sayıda kelimesinden el ile işaretlenip ayrılmış olan altı adet Japonca sessiz harf, /b/, /d/, /g/, İmi, İn/, INI, tanıma deneylerindeki etkisini araştırmayı hedeflemiştir. Deneylerde RTYSA' da kullanılan merkez vektörleri /') giriş uzayındaki vektörlere uygulanan bir öbekleme metoduyla (k-means) ti ) giriş ve çıkış uzaylarının kombinasyonundan elde edilen vektörlere uygulanan bir örnekleme metoduyla (k-means) belirlenmişlerdir. RTYSA' nın tanıma testlerinde Türkçe sesli harfler, Gauss gürültüsü eklenmiş Türkçe sesli harfler ve altı adet Japonca sessiz harfi kullanılmıştır. Bu setlerden herbirindeki örnekler 112 boyutlu vektörlerle temsil edilmişlerdir. Yapılan deneyler sonucu giriş-çıkış uzayı öbeklemesi metodunun Türkçe ve Japonca harflerin tanınmasında giriş uzayı öbeklemesi metoduna göre daha iyi sonuçlar verdiği gözlemlenmiştir. IV ABSTRACT This thesis studies the effects of using input-output space clustering for determining centers on phoneme recognition performance of Radial Basis Function Network (RBFN). The center vectors of RBFN are determined i) by a clustering technique (k-means algorithm) applied to sample vectors chosen from input space (so called input clustering) or ii) by a clustering technique (k-means algorithm) applied to sample vectors formed from a combination of input and output spaces (so called input-output clustering). 1 12-dimensional vectors representing Turkish vowels, (/a/, Id, 111, lil, lol, löl, lul, lül), uttered by three male speakers are used as feature vectors to be classified by a multi-output RBFN. Then noise with Gaussian distribution is added to the vowels and recognition performance of RBFN is tested on these noisy vowels. Also six Japanese phonemes, (Jbl, lûl, Igl, Iml, /n/, INI), extracted from speaker-dependent 5240 words Japanese vocabulary are tested using RBFN. It has been observed from the simulations that the input-output clustering technique gives better recognition rates both for the training and test patterns of the Turkish (clean and noisy) and Japanese phoneme sets as compared to the input clustering technique.
Collections