Metinden bağımsız kapalı set konuşmacı saptama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
METİNDEN BAĞIMSIZ KAPALI-SET KONUŞMACI TANIMA Yavuz Selim FATİHOĞLU Anahtar Kelimeler: Genetik Algoritmalar, Benzetilmiş Tavlama, Doğrusal Öngörülü Kodlama, Konuşmacı Tanıma, Yapay Sinir Ağları, Kendi Kendini Organize Eden Ağlar (SOM) Özet: Bu tez çalışmasında, geleneksel özellik çıkartım yöntemleri ve genetik algoritmalar benzetilmiş tavlama (GABT) yöntemi ile yapay sinir ağlarına dayalı konuşmacı tanıma uygulaması gerçekleştirilmiştir. Özellik çıkartım vektörlerinin elde edilmesi aşamasında Mel-frekans ölçekli kepstral katsayılar yöntemi ve GABT gibi farklı iki yöntem uygulanmıştır. Elde edilen özellik vektörleri Kendi Kendini Organize Eden Ağlar (SOM) 'in eğitiminde kullanılmıştır. SOM konuşma tanıma uygulamasının bir sonraki aşaması olan sınıflandırmada kullanılmıştır. Yapılan çalışmada, 5 erkek, 5 bayan, toplam 10 konuşmacının yer aldığı ve çeşitli rakamları farklı oturumlarda iki kez telaffuz ettikleri CSLU (Center for Spoken Language Understanding) veritabanına dayalı konuşmacı seti kullanılmıştır. Bu telaffuzlardan 10 tanesinin eğitim, 10 tanesinin de test aşamasında kullanılması amaçlanmıştır. Çalışma Metinden Bağımsız Kapalı Set Konuşma Saptama uygulamasıdır. Sonuç olarak özellik çıkartım aşamasında GABT, Mel frekans ölçekli kepstral katsayılara göre daha iyi sonuç verdiği görülmüştür. ıı TEXT INDEPENDENT CLOSED-SET SPEAKER IDENTIFICATION Yavuz Selim FATİHO?LU Keywords: Genetic Algorithms, Simulated Annealing, Linear Predictive Coding, Speaker Recognition, Artificial Neural Networks, Self Organizing Maps Abstract: In this thesis work Speaker Recognition application based on Artificial Neural Network is studied by using conventional feature extraction method and Genetic Algorithms and Simulated Annealing method. In the stage of obtaining feature extraction vectors, two different methods as Me- frequency cepstral coefficients method and the Genetic Algorithms Simulated Annealing were applied. The feature vectors which are obtained from the feature extraction have been utilized in the training of Self-Organizing Map (SOM). SOM is used for classification which is the next stage of speech recognition application. Text independent closed set speech recognition is implemented. (? A speaker data set consisting of 5 male and 5 female speakers is used. The data set is based on CLSU (Center for Spoken Language Understanding) where the speakers uttered various numbers twice in different sessions. 10 of these utterances were aimed to be used in training while the others were aimed to be used in test stages. It can be concluded that Genetic Algorithms and Simulated Annealing method gives better results than cepstral coefficients method based on Linear Predictive Coding in the feature extraction stage. in
Collections