Seçici derin otokodlayıcılar ile sıralı ses kaynaklarının segmentasyonu / An interleaved audio source segmentation technique via deep autoencoders
Abstract
Ses kaynaklarının ardışık biçimde kaydedildiği senaryolarda, bir ses kaynağının seçilip, diğer kaynakların silinmesi işini yapabilecek bir teknik geliştirdik. Bir derin otokodlayıcı mimarisini, bir ses kaynağını geçirirken, diğer bir kaynağı silecek şekilde eğittik ve bu tekniğe seçici otokodlayıcı ismini verdik. Geliştirdiğimiz metodu, Türk klasik müziği enstrümanlarının (sanatçıların birinin çalıp diğerinin dinlediği ve sıralı şekilde seslerin kaydedildiği durumlar için), ardışık insan seslerinin ve ardışık hayvan seslerinin segmentasyonunda kullandık. Metot genel manada yarı çift yönlü haberleşmenin tek bir alıcıyla kaydedildiği durumlarda haberleşme kanallarından birini diğerlerinden izole etmekte kullanılabilir.
In this Tez, we devised a technique for segmentation and isolation of a particular sound source from an interleaved audio source. We trained a deep auto-encoder architecture in a way to output desired signal source intact but suppress others by outputting zero. We tested our method in order to segment Turkish classical music instruments, male/female voices and animal voices. In general sense, the method can be utilized in several half-duplex communication scenarios where isolating a communication channel is desirable.
Collections
- Tezler [19]

DSpace@Karatay by Karatay University Institutional Repository is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 Unported License..