Turkish Broadcast News Transcription Revisited

dc.contributor.author Saraçlar, Murat
dc.contributor.author Arısoy, Ebru
dc.contributor.other 02.05. Department of Electrical and Electronics Engineering
dc.contributor.other 02. Faculty of Engineering
dc.contributor.other 01. MEF University
dc.date.accessioned 2019-03-07T15:45:10Z
dc.date.available 2019-03-07T15:45:10Z
dc.date.issued 2018
dc.description.WoSDocumentType Proceedings Paper
dc.description.WoSIndexDate 2018
dc.description.abstract Bu çalışmada yaklaşık on yıl önce gerçeklenen Türkçe haber programları için otomatik konuşma tanımayla yazılandırma sistemi güncel yöntemlerle yenilenerek aynı veri üzerindeki başarımı ölçülmüştür. Son yıllarda yapay sinir ağları temelli derin öğrenme yöntemleri konu¸sma tanıma hata oranlarında belirgin bir iyileşme sağlamıştır ve günümüzde yaygın olarak kullanılmaktadır. Bu bildiride geliştirilen konu¸sma tanıma sisteminin temel bileşenleri olan akustik ve dil modelleri için sinir ağları kullanılmıştır. Akustik modelleme için derin sinir a^gları hem çapraz entropi hem de ayırıcı dizi amaç işlevleriyle eniyilenmiştir. Ayrıca uzun süreli bağımlılıkları modellemek için yinelemeli sinir ağlarına benzer bir başarım gösteren ama daha çabuk eğitilebilen zaman gecikmeli sinir ağları kullanılmıştır. Daha sonra bunların ayırıcı eğitimle eniyilenmesi sonucunda en düşük hata oranlarına ulaşılmoştır. Dil modeli için ise yinelemeli sinir ağları kullanılmıştır. Bu yeni sinir ağları kullanan modeller ile kelime hata oranlarının yarılandığıve %10’un altına düştüğü gözlemlenmiştir.
dc.description.abstract Abstract—In this study a decade old automatic speech recognition system for Turkish broadcast news transcription is revisited and updated with the latest methods. Recently deep learning using artificial neural networks resulted in significant improvements in speech recognition error rates and became the state-of-the-art. Neural network based acoustic and language models are used as the main components of the speech recognition system built in this paper. For acoustic modeling, deep neural networks are optimized using both cross-entropy and sequence discriminative objective functions. In addition, time-delay neural networks are used for modeling long term dependencies with similar performance to recurrent neural networks. The lowest error rates are obtained using discriminatively trained versions of these models. For the language model a recurrent language model is used. It was observed that the word error rates are approximately halved and fell below 10%.
dc.identifier.citation Arısoy, E., ve Saraçlar, M. (2018). Türkçe haber programları için konuşma tanımanın tekrar gözden geçirilmesi. In Proceedings of the IEEE 28. Sinyal İşleme ve İletişim Uygulamaları Konferansı (SİU), Çeşme, İzmir, Turkey.
dc.identifier.scopus 2-s2.0-85050815840
dc.identifier.uri https://hdl.handle.net/20.500.11779/984
dc.language.iso tr
dc.relation.ispartof The IEEE 28. Sinyal İşleme ve İletişim Uygulamaları Konferansı
dc.rights info:eu-repo/semantics/closedAccess
dc.subject Zaman gecikmeli sinir ağları
dc.subject Yapay sinir ağları
dc.subject Konuşma tanıma
dc.subject Kelimeler
dc.subject Yinemeli sinir ağları
dc.title Turkish Broadcast News Transcription Revisited
dc.title.alternative Türkçe haber programları için konuşma tanımanın tekrar gözden geçirilmesi
dc.type Conference Object
dspace.entity.type Publication
gdc.author.id Ebru Arısoy / 0000-0002-8311-3611
gdc.author.institutional Arısoy, Ebru
gdc.author.institutional Arısoy Saraçlar, Ebru
gdc.coar.access metadata only access
gdc.coar.type text::conference output
gdc.description.department Mühendislik Fakültesi, Elektrik Elektronik Mühendisliği Bölümü
gdc.description.publicationcategory Konferans Öğesi - Ulusal - Kurum Öğretim Elemanı
gdc.description.scopusquality N/A
gdc.description.woscitationindex Conference Proceedings Citation Index - Science
gdc.description.wosquality N/A
gdc.identifier.wos WOS:000511448500450
gdc.publishedmonth Mayıs
gdc.scopus.citedcount 2
gdc.wos.citedcount 2
gdc.wos.publishedmonth Mayıs
gdc.wos.yokperiod YÖK - 2017-18
relation.isAuthorOfPublication 0b895153-5793-4e46-bc2f-06a28b30f531
relation.isAuthorOfPublication.latestForDiscovery 0b895153-5793-4e46-bc2f-06a28b30f531
relation.isOrgUnitOfPublication de19334f-6a5b-4f7b-9410-9433c48d1e5a
relation.isOrgUnitOfPublication 0d54cd31-4133-46d5-b5cc-280b2c077ac3
relation.isOrgUnitOfPublication a6e60d5c-b0c7-474a-b49b-284dc710c078
relation.isOrgUnitOfPublication.latestForDiscovery de19334f-6a5b-4f7b-9410-9433c48d1e5a

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Turkish Broadcast News Transcription Revisited.pdf
Size:
165.24 KB
Format:
Adobe Portable Document Format
Description:
Konferans Dosyası

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.5 KB
Format:
Item-specific license agreed upon to submission
Description: