New methods for robust speech recognition
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Özet KONUŞMA TANIMA İÇİN GÜRÜLTÜYE DAYANIKLI YENİ YÖNTEMLER Engin Erzin Elektrik ve Elektronik Mühendisliği Bölümü Doktora Tez Yöneticisi: Doç. Dr. A. Enis Çetin Eylül 1995 Dayanıklı konuşma tanıma sistemleri için öznitelik parametrelerinin elde edilmesi, sözcük sınırlarının belirlenmesi ve konuşma iyileştirilmesi alanlarında yeni yöntemler geliştirilmiştir. Öznitelik parametrelerinin elde edilmesi ve sözcük sınırlarının belirlenmesi yöntemleri altbant analizine dayalı biçimde geliştirilmiştir. Altbant analizine dayalı iki yeni konuşma öznitelik parametre vektörü (SUBLSF ve SUBCEP) oluşturulmuştur. SUBLSF öznitelik parametrelerini elde etmek için konuşma işareti alt ve üst bantlara ayrılır. Her iki bant için doğrusal öngörü analizi yapılır ve bu analizlerden elde edilen Çizgisel Spektrum Frekansları birleştirilerek SUBLSF öznitelik vektörü oluşturulur. Diğer öznitelik parametre vektörü, SUBCEP, dalgacık analizi veya eşdeğer anlamda altbant analizi kullanılarak oluşturulur. SUBCEP parametreleri gürültülü bantları bastırarak dayanıklı bir başarım sağlamışlardır. Yapılan deneyler sonunda araç gürültüsü altında altbant analizi ile elde edilen öznitelik parametrelerinin yaygın olarak kullanılan tam-bantVI parametrelerinden daha dayanıklı olduğu görülmüştür. Telefon kanallarındaki gürültünün modellenmesinde a-kararlı rasgele süreçler kullanılabilir, a-kararlı rasgele süreçler için geliştirilen uyarlamalı süzgeçler gürültülü konuşmanın iyileştirilmesinde kullanılmış ve konuşma tanıma başarımı artırılmıştır. Dayanıklı konuşma tanıma sistemlerinde bir diğer önemli problem de sözcük sınırlarının belirlenmesidir. Sözcük sınırlarının hatasız belirlenmesi konuşma tanıma başarımmı artırmaktadır. Sözcük sınırlarını belirlemeye yönelik, konuşma işaretinin altbant enerji değerlerine bağlı, yeni bir uzaklık ölçüsü sunulmuştur. Anahtar sözcükler: Konuşma tanıma, doğrusal öngörü, sımr belirleme, konuşma iyileştirme, altbant ayrışımı, dalgacık dönüşümü, çizgisel spektrum frekansları, cc-kararlı dağılımlar. Abstract NEW METHODS FOR ROBUST SPEECH RECOGNITION Engin Erzin Ph. D. in Electrical and Electronics Engineering Supervisor: Assoc. Prof. Dr. A. Enis Çetin September 1995 New methods of feature extraction, end-point detection and speech enhance ment are developed for a robust speech recognition system. The methods of feature extraction and end-point detection are based on wavelet analysis or subband analysis of the speech signal. Two new sets of speech feature parameters, SUBLSF's and SUBCEP's, are introduced. Both parameter sets are based on subband analysis. The SUBLSF feature parameters are obtained via linear predictive analysis on subbands. These speech feature parameters can produce better results than the full-band parameters when the noise is colored. The SUBCEP parameters are based on wavelet analysis or equivalently the multirate subband analysis of the speech signal. The SUBCEP parameters also provide robust recognition performance by appropriately deemphasizing the frequency bands corrupted by noise. It is experimentally observed that the subband analysis based feature parameters are more robust than the commonly used full-band analysis based parameters in the presence of car noise. The a-stable random processes can be used to model the impulsive nature mIV of the public network telecommunication noise. Adaptive filtering are developed for a-stable random processes. Adaptive noise cancelation techniques are used to reduce the mismacth between training and testing conditions of the recognition system over telephone lines. Another important problem in isolated speech recognition is to determine the boundaries of the speech utterances or words. Precise boundary detection of utterances improves the performance of speech recognition systems. A new distance measure based on the subband energy levels is introduced for endpoint detection. Keywords : Speech recognition, linear prediction, endpoint detection, speech enhancement, subband decomposition, wavelet trans form, line spectrum frequencies, a-stable distributions.
Collections