Özyinelemeli Sinir Ağları ile Türkçe Doğal Dil Üretimi

dc.contributor.advisor Gökmen, Muhittin
dc.contributor.author Demir, Şeniz
dc.contributor.author Demir, Şeniz
dc.date.accessioned 2019-03-01T15:49:08Z
dc.date.available 2019-03-01T15:49:08Z
dc.date.issued 2018
dc.description Proje Grubu: TÜBİTAK EEEAG ProjeSayfa Sayısı: 83Proje No: 117E977Proje Bitiş Tarihi: 01.08.2020Metin Dili:Türkçe
dc.description.abstract İnsanlar arasındaki iletişimi sağlayan doğal diller, zaman içinde insanlarla etkin ve kullanıcı dostu etkileşim kurabilmek amacıyla sistemler ve yazılımlar tarafından kullanılmaya başlanmıştır. Tıpkı insanlar gibi sesli veya yazılı doğal dil ifadelerini anlayabilen ve sonrasında kullanıcıların beklentilerini karşılayabilen dil tabanlı teknolojiler (örn. arama motorları, bilgisayar destekli eğitici sistemler ve diyalog sistemleri) bu motivasyonla ortaya çıkmıştır. Bu çalışmalarda, problemin doğası ve hedef dilin yapısındaki zorluklara ek olarak insanların doğal dilleri nasıl öğrendiğini ve kullandığını modellemedeki kısıtlar başarım oranlarını etkilemiştir. Günümüzde, dil tabanlı teknolojiler insanlar tarafından yaygın şekilde kullanılıyor olsalar da (örn. Google Arama Motoru ve Apple Siri), ulaşılan teknolojik seviye hedef dile göre çeşitlilik göstermektedir. Sondan eklemeli ve zengin dil yapısı ile Türkçe geliştirilen teknolojik çözümler ve üretilen veri kaynakları açısından pek çok doğal dilin gerisinde kalmaktadır. Ayrıca, bugüne kadar Türkçe dil teknolojileri konusunda yapılan çalışmaların ağırlıklı olarak dili işleme, anlama ve analiz etmeye dönük (örn. kelimelerin morfolojik analizi, özel isim tespiti, bağlılık çözümlemesi, metin sınıflandırma ve metin özetleme) olduğu gözlemlenmektedir. Türkçe dil üretimi konusunda sınırlı yeteneklere sahip ve akademik seviyede kalarak devamı getirilmemiş birkaç çalışma mevcuttur. Fakat bu çalışmalar karmaşık sayılabilecek dilbilimi teorileri ile ifade edilen içerik ifadelerini cümlelere dönüştürmekten öteye geçmemiştir ve başka uygulamalarla entegre olarak test edilmemiştir. Bu çalışmada, Türkçe dilinin derin öğrenme tabanlı bir sistem (dil aracı) ile otomatik olarak üretimi hedeflenmektedir. Bu sistemin, girdi olarak verilen içerik ifadelerini Türkçe dili kurallarına uygun ve anlaşılır cümlelere dönüştüreceği öngörülmektedir. Literatürdeki en kapsamlı Türkçe dil üretimi sistemi olması planlanan bu çalışmada son yıllarda pek çok dil teknolojisinde başarımı ispat edilmiş diziden diziye öğrenebilen (örn. kelime dizisinden başka bir kelime dizisi) özyinelemeli sinir ağı yapıları kullanılacaktır. Bu ağların sağladığı dinamiklik ile farklı çeşitler (örn. uzun kısa süreli bellek ve girişli özyinelemeli birim) ve genişlemeler (örn. dikkat mekanizması) denenecektir ve başarımı en yüksek sinir ağı mimarisi belirlenecektir. Buna ek olarak, sinir ağlarının kullanımı bazı faktörlerin (örn. bağlam bilgisi ve kullanıcı tercihleri) sisteme entegrasyonuna ve üretim aşamasına olan etkilerinin incelenmesine imkân sağlayacaktır.
dc.description.abstract Natural languages that provide communication between people have begun to be used by systems and software over time in order to enable effective and user-friendly interaction with people. Language-based technologies that can understand spoken or written natural language expressions as people do and then meet the expectations of users (e.g., search engines, computeraided education systems, and dialogue systems) have emerged with this motivation. In addition to the nature of the problem and the structural difficulties of the target language, the constraints on modeling how people learn and use natural languages have affected the performance of these studies. Nowadays, although language-based technologies are widely used by people (e.g., Google search engine and Apple Siri), the achieved technological level varies depending on the target language. According tothe developed technological solutions and produced data sources, Turkish with exclusively suffixing and rich language structure lags behind many natural languages. Furthermore, it is observed that studies conducted on Turkish language technologies to date have mainly focused on processing, understanding and analysis of the language (e.g., morphological analysis of words,named entity recognition, dependency parsing, text classification, and summarization). When it comes to Turkish languagegeneration, there are a few studies of limited capabilities that have remained at the academic level with no continuation. However,these studies have never been more than transforming the content expressed via complex linguistic theories into sentences, andhave not been tested after being integrated into other applications.
dc.identifier.citation Demir, Ş. (June 01, 2018). Özyinelemeli sinir ağları ile Türkçe doğal dil üretimi. (TÜBİTAK)
dc.identifier.other Proje Grubu: TÜBİTAK EEEAG Proje
dc.identifier.uri https://hdl.handle.net/20.500.11779/939
dc.language.iso en
dc.publisher TÜBİTAK
dc.relation.tubitak 1.7976931348623157E+308
dc.rights info:eu-repo/semantics/closedAccess
dc.subject Doğal dil üretimi
dc.subject Derin öğrenme
dc.subject Özyinelemeli sinir ağları
dc.subject Veri kümeleri
dc.subject Türkçe
dc.title Özyinelemeli Sinir Ağları ile Türkçe Doğal Dil Üretimi
dc.title.alternative Turkish natural language generation via recurrent neural networks
dc.type Project
dspace.entity.type Project
gdc.author.id Muhittin Gökmen / 0000-0001-7290-199X
gdc.author.id Şeniz Demir / 0000-0003-4897-4616
gdc.author.institutional Demir, Şeniz
gdc.author.institutional Gökmen, Muhittin
gdc.coar.access metadata only access
gdc.coar.type other
gdc.description.department Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü
gdc.description.publicationcategory TÜBİTAK Project
gdc.identifier.trdizinid 621058
gdc.publishedmonth Haziran
gdc.relation.journal TÜBİTAK EEEAG Proje
gdc.wos.publishedmonth Haziran
gdc.wos.yokperiod YÖK - 2017-18
relation.isOrgUnitOfProject 05ffa8cd-2a88-4676-8d3b-fc30eba0b7f3
relation.isOrgUnitOfProject 0d54cd31-4133-46d5-b5cc-280b2c077ac3
relation.isOrgUnitOfProject a6e60d5c-b0c7-474a-b49b-284dc710c078
relation.isOrgUnitOfProject.latestForDiscovery 05ffa8cd-2a88-4676-8d3b-fc30eba0b7f3
relation.isPersonOfProject 93fa0200-13f7-446a-bdc2-118401cab062
relation.isPersonOfProject b2cb9802-db32-4c9c-88c4-8ee192b85b62
relation.isPersonOfProject.latestForDiscovery 93fa0200-13f7-446a-bdc2-118401cab062

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Project.pdf
Size:
50.1 KB
Format:
Adobe Portable Document Format
Description:
Sunum Dosyası

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.5 KB
Format:
Item-specific license agreed upon to submission
Description: