Seçici derin otokodlayıcılar ile sıralı ses kaynaklarının segmentasyonu
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Ses kaynaklarının ardışık biçimde kaydedildiği senaryolarda, bir ses kaynağının seçilip, diğer kaynakların silinmesi işini yapabilecek bir teknik geliştirdik. Bir derin otokodlayıcı mimarisini, bir ses kaynağını geçirirken, diğer bir kaynağı silecek şekilde eğittik, ve bu tekniğe seçici otokodlayıcı ismini verdik. Geliştirdiğimiz metodu, Türk klasik müziği enstrümanlarının (sanatçıların birinin çalıp diğerinin dinlediği ve sıralı şekilde seslerin kaydedildiği durumlar için), ardışık insan seslerinin ve ardışık hayvan seslerinin segmentasyonunda kullandık. Metot genel manada yarı çift yönlü haberleşmenin tek bir alıcıyla kaydedildiği durumlarda haberleşme kanallarından birini diğerlerinden izole etmekte kullanılabilir. In this thesis, we devised a technique for segmentation and isolation of a particular sound source from an interleaved audio source. We trained a deep auto-encoder architecture in a way to output desired signal source intact but suppress others by outputting zero. We tested our method in order to segment Turkish classical music instruments, male/female voices and animal voices. In general sense, the method can be utilized in several half-duplex communication scenarios where isolating a communication channel is desirable.
Collections