Değişimli Oto-Kodlayıcılar kullanarak Diyalog Geliştirme

dc.contributor.author Kırbız, Serap
dc.date.accessioned 2025-06-16T09:58:57Z
dc.date.available 2025-06-16T09:58:57Z
dc.date.issued 2025
dc.description.abstract Bu makalede, kaynak ayrıştırma algoritmalarından faydalanarak birden fazla kaynaktan oluşan ses kayıtlarında konuşma işaretlerini güçlendirmek amacıyla bir yöntem sunulmaktadır. Konuşma sesleri ve diğer sesler arasındaki doğru dengeyi sağlamak, dinleyici şikayetleri arasında sıkça dile getirilen önemli bir sorun olarak öne çıkmaktadır. Bu çalışmada, diyalog içeren ses kayıtlarından diyalogların ayrıştırılmasında negatif olmayan gürültü giderici oto kodlayıcı modelleri kullanılmakta ve bu diyaloglar, diğer seslerle farklı oranlarda yeniden birleştirerek, kullanıcı tercihlerine uygun bir dinleme deneyimi sunulmaktadır. Önerilen yöntem, akan veri üzerinde çalışabilme özelliğine sahip olup, televizyon programları gibi gerçek zamanlı uygulamalara da uyarlanabilmektedir.
dc.description.abstract The paper proposes a method to enhance speech signals in audio recordings consisting of multiple sources by using source separation algorithms. Achieving the right balance between seç sounds and other sounds is a frequently mentioned issue among listener complaints. In this study, non-negative denoising variational autoencoder models are used to separate dialogues from audio recordings containing dialogues, and these dialogues are remixed with other sounds at different rates to provide a listening experience that suits the user's preferences. The proposed method has the ability to work on streaming data and can also be adapted to real-time applications such as television programs.
dc.identifier.citation Kırbız, S. (2025). Değişimli Oto-Kodlayıcılar kullanarak Diyalog Geliştirme. EMO Bilimsel Dergi, 15(1), 87-95.
dc.identifier.issn 1309-5501
dc.identifier.uri https://hdl.handle.net/20.500.11779/2599
dc.identifier.uri https://search.trdizin.gov.tr/en/yayin/detay/1387717
dc.language.iso tr
dc.publisher Dergi Park
dc.relation.ispartof EMO Bilimsel Dergi
dc.rights info:eu-repo/semantics/openAccess
dc.subject Kaynak ayrıştırma
dc.subject Diyalog geliştirme
dc.subject Derin Öğrenme
dc.subject Source separation
dc.subject Dialogue enhancement
dc.subject Deep learning
dc.subject Bilgisayar Bilimleri, Yapay Zeka
dc.subject Mühendislik, Elektrik Ve Elektronik
dc.title Değişimli Oto-Kodlayıcılar kullanarak Diyalog Geliştirme
dc.title.alternative Dialogue Enhancement using Variational Autoencoders
dc.type Article
dspace.entity.type Publication
gdc.author.id Serap Kırbız / 0000-0001-7718-3683
gdc.author.id 0000-0001-7718-3683
gdc.author.institutional Kırbız, Serap
gdc.coar.access open access
gdc.coar.type text::journal::journal article
gdc.description.department Mühendislik Fakültesi, Elektrik Elektronik Mühendisliği Bölümü
gdc.description.departmenttemp [Kırbız, Serap] Mef Üniversitesi, Mühendislik Fakültesi, Elektrik Elektronik Mühendisliği Bölümü, İstanbul, Türkiye
gdc.description.endpage 98
gdc.description.issue 1
gdc.description.publicationcategory Makale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı
gdc.description.startpage 87
gdc.description.volume 15
gdc.identifier.trdizinid 1387717
gdc.index.type TR-Dizin
gdc.publishedmonth Ocak
gdc.wos.publishedmonth Ocak
gdc.yokperiod YÖK - 2024-25
relation.isAuthorOfPublication.latestForDiscovery 552e4b0c-955f-4b93-925b-08cb2e6c5cc0
relation.isOrgUnitOfPublication.latestForDiscovery de19334f-6a5b-4f7b-9410-9433c48d1e5a

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Name:
Değişimli Oto Kodlayıcı.pdf
Size:
632.46 KB
Format:
Adobe Portable Document Format
Description:
Watermarked PDF

License bundle

Now showing 1 - 1 of 1
Loading...
Name:
license.txt
Size:
3.2 KB
Format:
Item-specific license agreed upon to submission
Description: