Çok kanallı ortamlarda gürültü azaltma
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tezde, geliştirilen bir VAD algoritması kullanılarak; Wiener filtre, konuşma bozukluğu ağırlıklı Wiener filtre, uzamsal tahmin filtresi, minimum varyans gürültüsüz yanıt filtresi gibi çok kanallı gürültü azaltma algoritmalarının verimliliği karşılaştırılmıştır. Algoritmalarda dört farklı ses sinyali kullanılmakla birlikte, bu ses sinyallerine farklı açılarda eklenen üç farklı gürültü tipi kullanılmıştır.Filtre katsayılarını hesaplamadan önce gürültülü konuşma ve yalnızca gürültülü bölgelerin tespiti bir ses etkinliği algılama algoritması kullanılarak yapılmıştır. Bu algoritmada gürültülü konuşma ve yalnızca gürültülü bölgeleri ayırt edebilmek için; kısa süreli enerji, periyodiklik ve spektral düzlük gibi özellikler kullanılmıştır. Gürültülü konuşma ve gürültülü bölgelerin tespiti yapıldıktan sonra yukarıda bahsedilen algoritmalarla filtre katsayıları hesaplanmıştır. Son olarak da hesaplanan filtre katsayıları ile girişteki referans mikrofonunun frekans bileşenleri çarpılarak her algoritma için iyileştirilmiş sinyaller elde edilmiştir. Algoritmaların performansını hesaplamak için objektif bir metot olan bölümsel sinyal gürültü oranı ve subjektif bir metot olarak da ortalama yargı değeri kullanılmıştır. Gürültü azaltma açısından konuşma bozukluğu ağırlıklı Wiener filtrenin performansı daha iyi olsa da konuşmanın anlaşılırlığı ve algısal kalite açısından SP ve MVDR filtreleri ile daha iyi sonuçlar alınmıştır. In this thesis, using a developed VAD algorithm; the efficiency of multichannel noise reduction algorithms such as Wiener filter, Speech Distortion Weighted Wiener Filter, Spatial Prediction Filter, and Minimum Variance Distortionless Response (MVDR) was compared. While four different audio signals are used in the algorithms, three different types of noise are added to these audio signals at different angles. Before calculating the filter coefficients, noisy speech and only the detection of noisy areas were performed using a voice activity detection algorithm. To be able to distinguish between noisy speech and only noisy areas in this algorithm; Short Time Energy, periodicity and spectral flatness are used. After noisy speech and noisy areas were determined, the coefficients of the filter were calculated with the algorithms mentioned above. Finally, the calculated filter coefficients and the frequency components of the reference microphone at the input are multiplied to obtain improved signals for each algorithm. Segmental SNR is an objective method for calculating the performance of algorithms and MOS is used as a subjective method. Although the performance of the SDW wiener filter is better in terms of noise reduction, better results are obtained with SP and MVDR filters in terms of speech intelligibility and perceptual quality.
Collections