Ses kodlayıcılarının kodlama niteliklerine göre tek ve iki kere kodlanmış seslerden tespiti
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada sunulan araştırma, kodlanmış bir ses verisinin kodeğini tespitetmeye yönelik özgün bir yöntem önermektedir. Önerilen yöntem herhangi birkod çözümü içermediği, kodlama üstverisinden faydalanmadığı ve bir kodeğin bitdizisi formatına ait bilgileri göz önüne almadığı için basit ve hızlıdır. Yöntemintemel aldığı düşünce, kodek tasarımına etki eden sıkıştırma oranı, ses kalitesi vekarmaşıklık gibi faktörlerin kodlanmış ses üzerinde etkilerini gösterecek olmasıdır.Bu etkileri açığa çıkarmak amacıyla, önerilen yöntem, kodlanmış verinin rasgeleyerlerinden aldığı 2 ile 4 KB uzunluğundaki bayt dizilerinin kaotik ve rasgelelikniteliklerini analiz ederek farklı kodeklere ait kodlama süreçlerini ifade edenistatistiksel modeller kurmaktadır.Yöntemin kodek tespit etme başarımınıölçmek adına, testlerde, PSTN, GSM ve VoIP iletişim ortamlarında kullanılankonuşma kodekleri ile yüksek kaliteli ses sıkıştırma amacıyla kullanılan toplam16 farklı ses kodlayıcı, en sık kullanılan kodlama parametreleri ile kullanıldı.Ses içeriğinin oluşturabileceği etkilerden kurtulmak için testler hem konuşmahem de müzik veri kümeleri üzerinde yapıldı. Sonuçlar incelendiğinde, bir kerekodlanmış bir ses verisinin kodeği %95'ten yüksek bir başarım ile tespit edilmiştir.kili kodlama senaryolarını da içeren birçok deney yapılmıştır.kili kodlamatest sonuçlarına göre, önerilen yöntem, iki kere kodlanmış seslerin ilk kodeğini%80'den daha yüksek bir başarım ile tespit edebilmektedir. Bu testlere ait tekkısıt; ikinci kodlayıcının ilk kodlayıcıdan daha yüksek bir bit hızına sahip olmasıgerekmektedir. The research presented in this paper provides a novel technique to identify thecodec of an encoded audio.Since the technique does not perform decoding,utilize any coding metadata, or assume information about the structure describingthe bit stream format of a codec, it is simple and fast. The main idea of thetechnique is that design principles of a codec such as compression level, audioquality and complexity will reveal themselves on the coded audio. To exploitthis, the technique samples 2-4 kilobytes of data from a coded audio and analyzesthe randomness and chaotic nature of the sampled data to build statistical modelsthat represent encoding process associated with different codecs. To evaluate theeffectiveness of the technique in identification of the codec, in experiments we use16 of the most popular audio codecs used for high quality audio compression andin PSTNs, cellular networks, and VoIP networks by setting encoding parametersof each codec to its most commonly used values. Tests are performed on bothspeech and music data sets to eliminate any effect which may stem from contentsof audios. Results show that the codec of a singly encoded audio can be identifiedwith an accuracy of more than %95. Several transcoding scenarios were alsoperformed. Those results show that the scheme can even identify the first encoderof a doubly-encoded audio with an accuracy range of around %80 to %90 or moreas long as the second codec operates on higher bit rates than the first one.
Collections