Robust speech hashing
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada, yeni bir gürbüz ses kıyım algoritması sunulmuş ve farklı gürbüz ses kıyım fonksiyonları ile performans karşılaştırması yapılmıştır. Konuşma verileri için parmakizi (kıyım değeri) ses bazlı frekans-zaman uzayı analizi yapılarak bulunmaktadır. ?Gürbüz Konuşma Kıyımı? içerik takibi yapmak ve bulmak için tasarlanmış bir boyut düşüren mekanizma olarak görülebilir. Güvenilir konuşma verisi takibi için, konuşma sesinin özelliği düşünülerek fonem (en küçük ses değeri) kullanılmış ve kıyım fonksiyonu omurgası olarak rasgele yoğunluk hesaplanmıştır. Sunulan algoritma 3 temel aşamadan meydana gelmektedir: sırasıyla çevrimdışı, çevrimiçi ve karşılaştırma aşamaları uygulanmaktadır. İlk olarak, en yoğun kullanılan sesli harfin zaman-frekans uzayında orüntüsü çıkarılmıştır. Daha sonra değerlendirilecek ses sinyali zaman-enerjiekseninden zaman-frekans eksenine çevrilmiş ve, ?cepstrum? katsayılarının, sesli harfin örüntüsünün kapsadığı altuzaya izdüşümleri hesaplanmıştır. Bununla beraber, güvenlik konusu sözde-rasgele doğrusal dönüşüm uygulanarak halledilmiştir. Son konuşma verilerinden hesaplanmış gürbüz ses değerlerinin L2 uzaklıkları karşılaştırılmış. Karşılaştırma hem aynı hem farklı konuşma değerlerinin orijinal ve saldırılmış sürümleri arasında yapılmıştır. Kıyım değeri esas alınarak tanıma yapmak için bir çok test yapılmış alıcı işletim eğrileri incelenmiştir. Çıkan sonuçları değerlendirdiimizde önerilen algoritmanın değerlendirilen diğer ses kıyım fonksiyonlarından -konuşma sesleri için- daha iyi olduğunu görürüz. In this thesis, a robust speech hashing algorithm is proposed and performanceof this speech hashing algorithm is compared with several robust audio hashing algorithms.We use phone based frequency-time domain analysis for developing a ngerprint(hash value) for any speech data. Robust Speech Hashing can qualitatively bestated as a /dimensionality reduction` mechanism (which would be called the /robustspeech hashing` function) via which the desired content of interest can be trackedand found reliably. Phonemes as speech characteristics and randomized frequency ashashing backbone is used so as to conclude on a secure speech tracking. The proposedalgorithm is formed by 3 basic stages: Oine, Online and Comparison stagesare applied in order. First, we extract most eective letter patterns in the cepstraldomain. After transforming the speech signal into the spectral domain, the cepstrumcoecients are projected on the subspace spanned by the pattern that represents theletter (vowel) at hand. Moreover a pseudo-random linear transformation is applied inorder to add a secure aspect. Lastly, the robust hash values of audio les are comparedin the L2 sense. The comparison takes place between between dierent audios as wellas same but attacked ones. Several comparison tests are made for robust speech hashvalue based identication. ROC curves for dierent kind of attacks are investigatedand we determined that, for speech signals, the proposed algorithm is superior to otherconsidered robust audio hashing functions.
Collections