Vektör nicemleme tekniklerine dayalı konuşmacı tanıma algoritmalarının incelenmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZET Yüksek Lisans Tezi VEKTÖR NİCEMLEME TEKNİKLERİNE DAYALI KONUŞMACI TANIMA ALGORİTMALARININ İNCELENMESİ Metin UZUNÇARŞILI Ankara Üniversitesi Fen Bilimleri Enstitüsü Elektronik Mühendisliği Anabilim Dalı Danışman: Yrd. Doç. Dr. H. Gökhan İLK Konuşmacı tanıma işlemi, seslerin, konuşmacılardan dolayı sahip oldukları karakteristikler ve özellikler yardımıyla çeşitli analiz teknikleri ve yöntemleri uygulanarak bir konuşmacının diğerlerinden ayırt edilmesi işlemidir. Sesin bu karakteristik özellikleri tıpkı parmak izi ya da DNA gibi insandan insana farklılık gösterdiği için ayırt edici bir özelliğe sahiptir. Bu çalışmada; kapalı set, metinden bağımsız, vektör nicemleme tekniklerine dayanan bir konuşmacı tanımlama sistemi tasarlanmıştır. Her bir konuşmacının kayıtlı konuşmaları kullanılarak öznitelik vektörleri çıkarılmış ve bu vektörler LBG algoritmasıyla eğitilip her bir konuşmacı için kod kitapları tasarlanmıştır. özellikle güvenliğin ön planda olduğu sistemler için hızlı ve başarılı bir çözüm sağlamak amacıyla kullanılan sistemin performansını artırma yollarına gidilmiştir. Bu yüzden test telaffuzları ve kayıtlı konuşmacı sayısı değiştirilmiştir. Kod kitabının içerdiği vektör sayısı artırıldığında ve test işlemi kelime yerine cümle üzerinden yapıldığında sistem tanıma performansının arttığı gözlemlenmiştir. Sistem performansını ortaya koymak için çizilen alıcı işletim karakteristik eğrisi altında kalan alan hesaplandığında sistemin tatmin edici bir performans ortaya koyduğu tespit edilmiştir. 2005, 68 sayfa ANAHTAR KELİMELER: Vektör nicemleme, öznitelik parametreleri, kod kitabı, metinden bağımsız konuşmacı tanıma, kümelendirme analizi ABSTRACT Master Thesis INVESTIGATION OF VECTOR QUANTIZATION BASED SPEAKER IDENTIFICATION ALGORITHMS Metin UZUNCARSILI Ankara University Graduate School of Natural and Applied Sciences Department of Electronic Engineering Supervisor: Ass. Prof. Dr. H. Gökhan ILK Speaker identification uses various analysis techniques and methods with the assistance of characteristics and specifications of speech in order to identify speakers. These characteristic properties of speech are distinctive as DNA and finger print due to uniqueness of these characteristics for every people. In this study, vector quantization based text independent speaker identification algorithm has been designed for a closed set of speakers. Feature vectors have been extracted and a codebook has been designed by training these vectors using the LBG algorithm for each speaker. Three different methods have been examined in order to increase the system performance. First one is changing test utterence by performing tests using words instead of sentences. Second one is increasing the number of the speakers in the closed set. Third one is increasing the number of the code vectors in each speaker's codebook. The results revealed that the system performance would be increased when the system was tested using sentences instead of words and increased when the number of the code words was increased. The system performance was determined by computing the area under the ROC (Receiver Operating Characteristic) curve, which indicated satisfactory performance to be used in a speaker identification system. 200S, 68 pages Key Words: Vector quantization, feature parameters, codebook, text-independent speaker identification, clustering analysis
Collections