Bilgisayar Mühendisliği Bölümü Koleksiyonu
Permanent URI for this collectionhttps://hdl.handle.net/20.500.11779/1940
Browse
4 results
Search Results
Conference Object Citation - WoS: 3Citation - Scopus: 3Detecting Autism From Head Movements Using Kinesics(Assoc Computing Machinery, 2024-11-04) Gokmen, Muhittin; Sariyanidi, Evangelos; Yankowitz, Lisa; Zampella, Casey J.; Schultz, Robert T.; Tunc, BirkanHead movements play a crucial role in social interactions. The quantification of communicative movements such as nodding, shaking, orienting, and backchanneling is significant in behavioral and mental health research. However, automated localization of such head movements within videos remains challenging in computer vision due to their arbitrary start and end times, durations, and frequencies. In this work, we introduce a novel and efficient coding system for head movements, grounded in Birdwhistell's kinesics theory, to automatically identify basic head motion units such as nodding and shaking. Our approach first defines the smallest unit of head movement, termed kine, based on the anatomical constraints of the neck and head. We then quantify the location, magnitude, and duration of kines within each angular component of head movement. Through defining possible combinations of identified kines, we define a higher-level construct, kineme, which corresponds to basic head motion units such as nodding and shaking. We validate the proposed framework by predicting autism spectrum disorder (ASD) diagnosis from video recordings of interacting partners. We show that the multi-scale property of the proposed framework provides a significant advantage, as collapsing behavior across temporal scales reduces performance consistently. Finally, we incorporate another fundamental behavioral modality, namely speech, and show that distinguishing between speaking- and listening-time head movements significantly improves ASD classification performance.Research Project Özyinelemeli Sinir Ağları ile Türkçe Doğal Dil Üretimi(TÜBİTAK, 2018) Demir, Şeniz; Gökmen, Muhittin; Gökmen, Muhittinİnsanlar arasındaki iletişimi sağlayan doğal diller, zaman içinde insanlarla etkin ve kullanıcı dostu etkileşim kurabilmek amacıyla sistemler ve yazılımlar tarafından kullanılmaya başlanmıştır. Tıpkı insanlar gibi sesli veya yazılı doğal dil ifadelerini anlayabilen ve sonrasında kullanıcıların beklentilerini karşılayabilen dil tabanlı teknolojiler (örn. arama motorları, bilgisayar destekli eğitici sistemler ve diyalog sistemleri) bu motivasyonla ortaya çıkmıştır. Bu çalışmalarda, problemin doğası ve hedef dilin yapısındaki zorluklara ek olarak insanların doğal dilleri nasıl öğrendiğini ve kullandığını modellemedeki kısıtlar başarım oranlarını etkilemiştir. Günümüzde, dil tabanlı teknolojiler insanlar tarafından yaygın şekilde kullanılıyor olsalar da (örn. Google Arama Motoru ve Apple Siri), ulaşılan teknolojik seviye hedef dile göre çeşitlilik göstermektedir. Sondan eklemeli ve zengin dil yapısı ile Türkçe geliştirilen teknolojik çözümler ve üretilen veri kaynakları açısından pek çok doğal dilin gerisinde kalmaktadır. Ayrıca, bugüne kadar Türkçe dil teknolojileri konusunda yapılan çalışmaların ağırlıklı olarak dili işleme, anlama ve analiz etmeye dönük (örn. kelimelerin morfolojik analizi, özel isim tespiti, bağlılık çözümlemesi, metin sınıflandırma ve metin özetleme) olduğu gözlemlenmektedir. Türkçe dil üretimi konusunda sınırlı yeteneklere sahip ve akademik seviyede kalarak devamı getirilmemiş birkaç çalışma mevcuttur. Fakat bu çalışmalar karmaşık sayılabilecek dilbilimi teorileri ile ifade edilen içerik ifadelerini cümlelere dönüştürmekten öteye geçmemiştir ve başka uygulamalarla entegre olarak test edilmemiştir. Bu çalışmada, Türkçe dilinin derin öğrenme tabanlı bir sistem (dil aracı) ile otomatik olarak üretimi hedeflenmektedir. Bu sistemin, girdi olarak verilen içerik ifadelerini Türkçe dili kurallarına uygun ve anlaşılır cümlelere dönüştüreceği öngörülmektedir. Literatürdeki en kapsamlı Türkçe dil üretimi sistemi olması planlanan bu çalışmada son yıllarda pek çok dil teknolojisinde başarımı ispat edilmiş diziden diziye öğrenebilen (örn. kelime dizisinden başka bir kelime dizisi) özyinelemeli sinir ağı yapıları kullanılacaktır. Bu ağların sağladığı dinamiklik ile farklı çeşitler (örn. uzun kısa süreli bellek ve girişli özyinelemeli birim) ve genişlemeler (örn. dikkat mekanizması) denenecektir ve başarımı en yüksek sinir ağı mimarisi belirlenecektir. Buna ek olarak, sinir ağlarının kullanımı bazı faktörlerin (örn. bağlam bilgisi ve kullanıcı tercihleri) sisteme entegrasyonuna ve üretim aşamasına olan etkilerinin incelenmesine imkân sağlayacaktır.Conference Object Citation - WoS: 2Citation - Scopus: 2Facial Expression Recognition From Still Images(Springer International Publishing AG, 2017) Gökmen, Muhittin; Gazioglu, Bilge Suheyla AkkocaWith the development of technology, Facial Expression Recognition (FER) become one of the important research areas in Human Computer Interaction. Changes in the movement of some muscles in face create the facial expressions. By defining these changes, facial expressions can be recognized. In this study, a cascaded structure consists of Local Zernike Moments (LZM), Local XOR Patterns (LXP) and Global Zernike Moments (GZM) methods is proposed for the FER problem. The generally used database is the Extended Chon - Kanade (CK +) in FER problems. The database consists of image sequences of 327 expressions of 118 people. Most FER system includes recognition of 7 classes of emotions happiness, sadness, surprise, anger, disgust, fear and contempt, and we use Library of Support Vector Machines (LIBSVM) classifier for multi class classification with the leave one out cross-validation method. Our overall system performance is measured as 90.34% for FER.Article Citation - WoS: 13Citation - Scopus: 16Face Recognition With Patch-Based Local Walsh Transform(Elsevier, 2018-02-01) Uzun-Per, Meryem; Gökmen, MuhittinIn this paper, we present a novel dense local image representation method called Local Walsh Transform (LWT)by applying the well-known Walsh Transform (WT) to each pixel of an image. The LWT decomposes an image into multiple components, and produces LWT complex images by using the symmetrical relationship between them. Cascaded LWT (CLWT) is also a dense local image representation obtained by applying the LWT again to real and imaginary parts of LWT complex images. Applying the LWT once more to real and imaginary parts of LWT complex images increases the success rate especially on low resolution images. In order to combine the advantages of sparse and dense local image representations, we present Patch-based LWT (PLWT) and Patch-based CLWT (PCLWT) by applying the LWT and CLWT, respectively, to patches extracted around landmarks of multi-scaled face images. The extracted high dimensional features of the patches are reduced through the application of the Whitened Principal Component Analysis (WPCA). Experimental results show that both thePLWT and PCLWT are robust to illumination and expression changes, occlusion and low resolution. The state-of-the-art performance is achieved on the FERET and SCface databases, and the second best unsupervised category result is achieved on the LFW database.
