GCRIS

Bu makalede, kaynak ayrıştırma algoritmalarından faydalanarak birden fazla kaynaktan oluşan ses kayıtlarında konuşma işaretlerini güçlendirmek amacıyla bir yöntem sunulmaktadır. Konuşma sesleri ve diğer sesler arasındaki doğru dengeyi sağlamak, dinleyici şikayetleri arasında sıkça dile getirilen önemli bir sorun olarak öne çıkmaktadır. Bu çalışmada, diyalog içeren ses kayıtlarından diyalogların ayrıştırılmasında negatif olmayan gürültü giderici oto kodlayıcı modelleri kullanılmakta ve bu diyaloglar, diğer seslerle farklı oranlarda yeniden birleştirerek, kullanıcı tercihlerine uygun bir dinleme deneyimi sunulmaktadır. Önerilen yöntem, akan veri üzerinde çalışabilme özelliğine sahip olup, televizyon programları gibi gerçek zamanlı uygulamalara da uyarlanabilmektedir.

Ayrıştırma tabanlı ses modelleme yöntemleri, hesaplama gücünün artmasıyla ve istatistiksel modelleme yöntemlerinin gelişmesiyle birlikte yaygın olarak kullanılmaktadır. Bu yöntemler, ses kodlama, müziksel bilgi çıkarımı, müziğin notaya dökülmesi, içerik analizi, kaynak ayrıştırma, ses onarımı ve gürbüz konuşmacı tanımanın da aralarında bulunduğu birçok alanda kullanılmaktadır. Bizim bu projede temel amacımız, birden fazla kaynak içeren ses kayıtlarındaki konuşma işaretlerini güçlendirmek için kaynak ayrıştırma algoritmalarından faydalanarak bir yöntem geliştirmektir. Diyalog ve ortamdaki diğer sesler arasındaki doğru dengeyi bulmak ses mühendisleri için önemli bir problem olup, dinleyici şikayetlerinin de gittikçe artan bir sebebini oluşturmaktadır. Dinleyiciler, kendi kişisel tercihlerine, dinleme ortamlarına ve duymalarına uygun olarak diyalog ve çevresel sesler arasındaki ses dengesini kendileri ayarlamak istemektedirler. Bu projedeki temel amaçlar ve aşamalar aşağıdaki gibidir: i) Durağan olmayan çok boyutlu zaman serilerinde, matris ve tensör ayrıştırma modellerini kullanarak diyalog içeren ses kayıtlarından diyalogların ayrıştırılması ve bunun daha sonra kayıtta bulunan diğer seslerle farklı oranlarda yeniden birleştirilmesiyle, kullanıcının ihtiyaçlarına ya da zevkine dayalı bir kayıt dinlemesini sağlama ii) Televizyon programları gibi akan veri üzerinde de çalışabilmek üzere, önerilen yöntemin gerçek zamanda çalışması. Bu bağlamda, veri geldikçe gerçek zamanlı olarak işlenecektir. iii) Geliştirilen yöntemlerin etkinliğinin gerçek uygulamalarda kullanımı. Projenin çıktıları olan modelleme, çıkarım ve model seçimi yöntemleri; işaret işleme, yapay öğrenme ve istatistik alanlarında temel metodolojik katkılar yapmaktatır. Bunun dışında çıktılar, bilgi madenciliği, biyoinformatik, sistem biyolojisi, yer bilimleri, karmaşık sistemler, algılayıcı ağları, finans veya akustik konularındaki büyük veri öbeklerinin incelendiği çalışmaları destekleyecektir. Bu bağlamda, MEF Üniversitesi bünyesinde yerli ve uluslararası alanda süren işbirliklerinin sürdürülmesi ve geliştirilmesi de planlanmaktadır.

TR-Dizin İndeksli Yayınlar Koleksiyonu / TR Dizin Indexed Publications Collection

Browse

Filters

Settings

Sort By

Results per page

Search Results