Seçici derin otokodlayıcılar ile sıralı ses kaynaklarının segmentasyonu / An interleaved audio source segmentation technique via deep autoencoders

Ses kaynaklarının ardışık biçimde kaydedildiği senaryolarda, bir ses kaynağının seçilip, diğer kaynakların silinmesi işini yapabilecek bir teknik geliştirdik. Bir derin otokodlayıcı mimarisini, bir ses kaynağını geçirirken, diğer bir kaynağı silecek şekilde eğittik ve bu tekniğe seçici otokodlayıcı ismini verdik. Geliştirdiğimiz metodu, Türk klasik müziği enstrümanlarının (sanatçıların birinin çalıp diğerinin dinlediği ve sıralı şekilde seslerin kaydedildiği durumlar için), ardışık insan seslerinin ve ardışık hayvan seslerinin segmentasyonunda kullandık. Metot genel manada yarı çift yönlü haberleşmenin tek bir alıcıyla kaydedildiği durumlarda haberleşme kanallarından birini diğerlerinden izole etmekte kullanılabilir. In this Tez, we devised a technique for segmentation and isolation of a particular sound source from an interleaved audio source. We trained a deep auto-encoder architecture in a way to output desired signal source intact but suppress others by outputting zero. We tested our method in order to segment Turkish classical music instruments, male/female voices and animal voices. In general sense, the method can be utilized in several half-duplex communication scenarios where isolating a communication channel is desirable.

Erişime Açık
Görüntülenme
4
22.03.2024 tarihinden bu yana
İndirme
1
22.03.2024 tarihinden bu yana
Son Erişim Tarihi
19 Nisan 2024 14:25
Google Kontrol
Tıklayınız
Tam Metin
Tam Metin İndirmek için tıklayın Ön izleme
Detaylı Görünüm
Eser Adı
(dc.title)
Seçici derin otokodlayıcılar ile sıralı ses kaynaklarının segmentasyonu / An interleaved audio source segmentation technique via deep autoencoders
Yayın Türü
(dc.type)
Tez
Yazar/lar
(dc.contributor.author)
ÖZKARDAŞ, Meryem Betül
Atıf Dizini
(dc.source.database)
Diğer
Konu Başlıkları
(dc.subject)
Se¸cici Derin Otokodlayıcı
Konu Başlıkları
(dc.subject)
Ses Kayna˘gı Segmentasyonu
Konu Başlıkları
(dc.subject)
Sıralı Ses Kayna˘gı Ayrı¸stırma
Konu Başlıkları
(dc.subject)
Sound Source Segmentation
Konu Başlıkları
(dc.subject)
Selective Deep Autoencoder
Konu Başlıkları
(dc.subject)
Interleaved Sound Source Separation
Yayın Tarihi
(dc.date.issued)
2018
Kayıt Giriş Tarihi
(dc.date.accessioned)
2019-07-09T11:41:50Z
Açık Erişim tarihi
(dc.date.available)
2019-07-09T11:41:50Z
Özet
(dc.description.abstract)
Ses kaynaklarının ardışık biçimde kaydedildiği senaryolarda, bir ses kaynağının seçilip, diğer kaynakların silinmesi işini yapabilecek bir teknik geliştirdik. Bir derin otokodlayıcı mimarisini, bir ses kaynağını geçirirken, diğer bir kaynağı silecek şekilde eğittik ve bu tekniğe seçici otokodlayıcı ismini verdik. Geliştirdiğimiz metodu, Türk klasik müziği enstrümanlarının (sanatçıların birinin çalıp diğerinin dinlediği ve sıralı şekilde seslerin kaydedildiği durumlar için), ardışık insan seslerinin ve ardışık hayvan seslerinin segmentasyonunda kullandık. Metot genel manada yarı çift yönlü haberleşmenin tek bir alıcıyla kaydedildiği durumlarda haberleşme kanallarından birini diğerlerinden izole etmekte kullanılabilir. In this Tez, we devised a technique for segmentation and isolation of a particular sound source from an interleaved audio source. We trained a deep auto-encoder architecture in a way to output desired signal source intact but suppress others by outputting zero. We tested our method in order to segment Turkish classical music instruments, male/female voices and animal voices. In general sense, the method can be utilized in several half-duplex communication scenarios where isolating a communication channel is desirable.
Tek Biçim Adres
(dc.identifier.uri)
https://hdl.handle.net/20.500.12498/826
Analizler
Yayın Görüntülenme
Yayın Görüntülenme
Erişilen ülkeler
Erişilen şehirler
6698 sayılı Kişisel Verilerin Korunması Kanunu kapsamında yükümlülüklerimiz ve cerez politikamız hakkında bilgi sahibi olmak için alttaki bağlantıyı kullanabilirsiniz.

creativecommons
Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.
Platforms