Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.11779/1785

Browse

Search Results

Now showing 1 - 9 of 9
  • Master Thesis
    Serverless vs. on-premises: A performance analysis of ml deployment with aws fargate, GCP Cloud run, and On-Prem
    (MEF Üniversitesi, 2024) Kırçiçek, Oğuz; Çakar, Tuna
    Bu çalışmada, makine öğrenimi modellerinin dağıtım sürecinde meydana gelen değişikliklerin On-Premises sistemler ve bulut hizmet sağlayıcılarındaki karşılaştırmalı analizini sunmaktayım. Makine öğrenimi modellerinin başarılı bir şekilde dağıtılması, üretkenliklerini artırmayı amaçlayan işletmeler ve kuruluşlar için kritik bir öneme sahiptir. Modellerin farklı ortamlarda nasıl davrandığını anlamak ve karşılaştırmak, bilinçli kararlar vermek için büyük öneme sahiptir. AWS ve GCP gibi önde gelen ticari organizasyonlar, özelleştirilmiş web uygulamaları sunmak üzere tasarlanmış güvenilir ve maliyet etkin bulut hizmetleri sunmaktadır. Bu makalenin temel amacı, en tanınmış bulut hizmeti sağlayıcılarının anahtar özelliklerini vurgulayarak bulut müşterilerini yönlendirmek ve On-Premises seçeneği ile karşılaştırmalar yaparak bilinçli karar almayı kolaylaştırmaktır. Ayrıca, AWS Fargate ve Google Cloud Run gibi yönetilen hizmetlerin avantajlarını keşfediyoruz, bu hizmetler uygulama dağıtımını kolaylaştırmaktadır. Bu araştırma aracılığıyla, işletmelerin stratejik kararlar alarak dinamik ve rekabetçi iş dünyasında başarı elde etmelerine olanak tanıyan değerli içgörüler sağlamak amaçlanmıştır.
  • Master Thesis
    Customer transaction predictive modeling via machine learning algorithms
    (MEF Üniversitesi, 2023) Ertuğrul, Seyit; Çakar, Tuna
    The main purpose of this study is to determine the behavior and characteristics of the customers of a company that is active in the factoring sector, and accordingly, to capture measurable parameters with exploratory data analysis based on the historical data of the customers, and then to perform predictive models for the target. A hit rate of around 80% was achieved in SVM and Extra Trees models, which are classification model algorithms. In this way, it is aimed to directly contribute to the transaction volume on a business basis by acting in a more effective, efficient and correct approach after approving the check that shows high potential, that is, the customers who are likely to accept it after the offer is made as a business.
  • Master Thesis
    Fraud detection and prediction with machine learning applications
    (MEF Üniversitesi, 2023) Sayar, Alperen; Çakar, Tuna
    Bu çalışmanın temel amacı, faktoring sektöründe faaliyet gösteren bir şirketin müşterilerinin işlemleri üzerindeki dolandırıcılık faaliyetlerini tespit etmek ve buna bağlı olarak müşterilerin geçmiş işlem ve bağlantı verilerine dayalı keşifsel veri analizi ile ölçülebilir parametreler yakalamaktır. ve ardından hedef için tahmine dayalı modeller gerçekleştirmek. Sınıflandırma modeli algoritmaları olan XGBoost ve CATBoost modellerinde %79 civarında isabet oranı elde edilmiştir. Bu sayede dolandırıcılık yapma potansiyeli yüksek müşteri tespit edildikten sonra daha etkin, verimli ve doğru bir yaklaşımla hareket edilerek işlem bazında dolandırıcılık faaliyetlerinin doğrudan tespit edilmesi amaçlanmaktadır.
  • Master Thesis
    Customer churn prediction for the Pay-TV sector
    (MEF Üniversitesi, 2023) Hataş, Tuğçe Aydın; Çakar, Tuna
    Müşteri kaybı, şirketler için gelir kaybı ve yeni müşteri kazanımı için pazarlama maliyetleri yarattığından müşterilerin aboneliklerini neden sonlandırdıklarını anlamak, mevcut müşterileri elde tutmak açısından katma değer sağlamaktadır. Bu çalışma kapsamında Türkiye'de hizmet veren Pay-TV firmasının müşterilerinin 6 aylık geçmiş verileri kullanılmış ve veri setinin etiket bazında dengesiz olması sebebiyle aşırı örnekleme yöntemi de uygulanmıştır. Model geliştirme aşamasında farklı yapay öğrenme (Rassal Orman, Lojistik Regresyon, K-En Yakın Komşu, Karar Ağacı, AdaBoost, XGBoost, Ekstra Ağaç Sınıflandırıcı) algoritmaları kullanılmış ve model performansları karşılaştırılmıştır. Her bir model için başarı kriterleri incelenerek bu veri seti için en yüksek performans gösteren modellerin ağaç-bazlı Rassal Orman, Ekstra Ağaç Sınıflandırıcı ve XGBoost olduğu görülmüştür.
  • Master Thesis
    Segmentation for factoring customers using unsupervised machine learning algorithms
    (MEF Üniversitesi, 2023) Ayyıldız, Nur Seher; Çakar, Tuna
    Günümüzde teknolojinin veri toplamayı kolaylaştırmasının önemli bir fırsat olmasının yanı sıra tüm bu verilerin yönetimini zorlaştırmakta ve veriler iyi işlenmedikçe bir anlam ifade etmemektedir. Depolanan bu veriler son derece önemlidir ve şirketler, müşterileri tarafından sağlanan verileri kullanır. Değişen dünyanın müşteri profillerinin ihtiyaçlarını yakalamak artık bir zorunluluk haline gelmekte ve firmalar için ilk sırayı almaktadır. Zamanla depolanan verinin artması ile artık veriler arasında ilişki kurmak ve bunları birbirinden ayırmak zor bir hal almıştır. Bu noktada hayatımıza makine öğrenmesi yöntemleri daha fazla dahil olmaya başlamıştır. Bu çalışmada, segmentasyonun ne olduğu ve yıllar içindeki değişiminden bahsedilmiştir. Hangi makine öğrenmesi tekniklerinin veri seçiminde faydalı olacağına değinilmiştir. Ardından olası makine öğrenmesi yöntemleri yerel bir faktoring şirketinin müşteri çek verileri kullanılarak gösterilmiştir. Bu çalışma etiketsiz verilerin gruplanmasını hedeflediğinden gözetimsiz öğrenme teknikleri üzerinde durulmuştur. Bu yöntemler arasında en popular olan K – means algoritmasının yanı sıra Hiyerarşik Kümeleme, DBSCAN, Gauss Karışık Modelleme ve Fuzzy c - Means yöntemleri kullanılmıştır. Her bir algoritma için başarı ölçütleri incelenerek uygun küme sayıları bulunmuş ve bulunan sonuçlar karşılaştırılmıştır. Kümeleme sonuçları incelendiğinde GMM ile optimal küme sayısı oldukça yüksek hesaplanmış, DBSCAN küme atayamamış, Hierarchical clustering ise zaman açısından maliyetli bulunmuştur. En iyi sonuçların K - means ve Fuzzy c - Means algoritmalarıyla elde edildiği gözlemlenmiştir.
  • Master Thesis
    Predicting the preference of liking using fNIRS and machine learning algorithms
    (MEF Üniversitesi, 2023) Köksal, Mehmet Yiğit; Çakar, Tuna
    Davranışsal örüntüleri tespit etmede genel olarak kullanılan fMRI yöntemi pahalı ve pratik olmayan özellikleriyle dikkat çekmektedir. Buna karşın yakın kızılötesi spektroskopi (fNIRS) yöntemi daha ucuz ve portatif özelliklere sahip olmak ile birlikte, iyi bir tahmin modeli oluşturmada fMRI kadar etkilidir. Bu yöntem ile çeşitli makine öğrenmesi algoritmaları kullanılarak insanların bir görsel uyaranı beğenip beğenmediğini tahmin edebilecek bir model geliştirilmiştir. Kullanılan klasik makine öğrenmesi metotları Destekleyici Vektör Makineleri (SVM), Rastgele Orman algoritması, XGBoost, LightGBM, k En Yakın Komşu (KNN) algoritmalarıdır. SVM ve KNN gibi fNIRS çalışmalarında sık kullanılan ve başarıları onaylanmış algoritmaların yanında, artırma ve ağaç bazlı algoritmalar da ek olarak kullanılarak tamamlayıcı bir karşılaştırma yapılması amaçlanmıştır. Bunun yanında, verideki eksik değerleri tamamlamak amacıyla çeşitli eksik veri doldurma yöntemleri kullanılmış ve bu tarz bir sınıflama problemi için aralarından en uygun olanı seçilmiştir. Model geliştirilirken ana odak olan öznitelik indirgeme yöntemleri arasında karşılaştırma yapılmıştır. Gözetimsiz bir eğitme yöntemi olan K-means kümeleme yaklaşımı kullanılarak benzer fNIRS ölçümlerine sahip olan katılımcılar kümelendikten sonra bu kümeler One-hot-encoding yöntemi ile kodlanarak sınıflama sonuçlarının daha başarılı çıkacağı düşünülmüştür. Bunun yanında, ikincil görev olarak, çeşitli öznitelik çıkarım ve sarıcı (öznitelik seçme) yöntemleri de uygulanarak beğeni tahmini modelleri performanslarının artırılması adına denemelerde bulunulmuştur. Kullanılan öznitelik çıkarım metotları arasında PCA, Isomap, t-SNE gibi yaklaşımlar yer almakla birlikte, sarıcı yöntem olarak ileri seçim sarıcı dizaynı ek bir adım olarak kullanılarak modellerin daha da geliştirilmesi amaçlanmıştır. Bu yöntemlerin sınıflama skorları kendi aralarında karşılaştırılarak sonuçlar gösterilmiştir. Modellerin çapraz doğrulama yönteminden gelen F1 skorları kullanılarak en iyi modeller aranmıştır. Tek bir grubu dışarıda bırakan çapraz doğrulama yöntemi kullanılarak modeller arasında karşılaştırma yapılmıştır. Böylece bu çapraz doğrulama yöntemi kullanılarak her katta farklı bir katılımcının verisi tek başına test edilecek şekilde bir kurgu yapılmıştır. Bu şekilde hem her katılımcı özelinde skorlar görülmüş, hem de model performanslarından çıkan sonuçların istatiksel olarak daha güvenilir olması amaçlanmıştır. Son performans değerlendirme ve karşılaştırma yöntemleri olarak permütasyon ve Wilcoxon İşaretli Sıralama teknikleri kullanılarak modellerin skorları istatiksel olarak karşılaştırılmış ve istatiksel anlamları tespit edilmiştir.
  • Master Thesis
    Customer churn prediction for a personal care product retail chain operating in Turkey
    (MEF Üniversitesi, 2024) Işık, Ercan; Çakar, Tuna
    Müşteri kaybının nedenlerini ve buna yol açan müşteri davranışlarını anlamak, ayrıca müşterinin bir sektöre veya şirkete olan sadakatini tahmin edebilmek, mevcut müşterileri elde tutmada ve yeni müşterilere ulaşmak için yapılan pazarlama ve reklam maliyetlerinden kaynaklanan gelir kaybını önlemede büyük avantaj sağlar. Bu çalışmada, Türkiye'de faaliyet gösteren bir kişisel bakım ürünleri perakende zincirine ait 29 aylık veri kullanılmış; veri setindeki dengesiz dağılım ve müşteri olmayan girişler nedeniyle aşırı örnekleme ve sentetik örnekleme yöntemleri uygulanmıştır. Model geliştirme aşamasında Lojistik Regresyon, Karar Ağacı, K-En Yakın Komşu, Rassal Orman, Ekstra Ağaç Sınıflandırıcı, MLP (Çok Katmanlı Algılayıcı) Sınıflandırıcı uygulanmış ve doğruluk, geri çağırma, F1 skoru, kesinlik ve karmaşıklık matrisi gibi metrikler kullanılarak performansları değerlendirilmiştir. Bu karşılaştırmalar sonucunda, Rassal Orman ve MLP Sınıflandırıcı modellerinin bu veri seti için en iyi performansı gösterdiği gözlemlenmiş; Ekstra Ağaç Sınıflandırıcı ve Karar Ağacı gibi diğer ağaç tabanlı algoritmaların ise biraz daha düşük fakat karşılaştırılabilir performans sağladığı tespit edilmiştir.
  • Master Thesis
    Comparing the effectiveness of graph neural networks and machine learning algorithms for fNIRS-based neuromarketing research
    (MEF Üniversitesi, 2024) Güngör, Atakan; Çakar, Tuna
    Fonksiyonel yakın kızılötesi spektroskopinin (fNIRS) maliyet ve taşınabilirlik açısından diğer beyin görüntüleme yöntemlerine göre bazı avantajları vardır. Bu nedenle nöropazarlama alanında kullanımı gittikçe artmaktadır. Ancak fNIRS, sağladığı avantajların yanında bazı zorlukları da beraberinde getirmektedir. Çok kanallı ölçüm ve yüksek zamansal çözünürlük gibi özellikler nedeniyle fNIRS verilerinin doğası karmaşık ve çok boyutludur [7]. Nöropazarlama araştırmacıları, bu zorlukların üstesinden gelebilmek için makine öğrenimi algoritmalarından yararlanmıştır. Bu çalışmalar incelendiğinde başarılı sonuçların ortaya çıktığı görülmüştür. Makine öğrenimi, nöropazarlama araştırmacılarının yanı sıra çizge üzerinde çalışan araştırmacıları da etkilemiştir. Böylece yapay sinir ağlarının çizge veri yapılarına uygulanmasına izin veren çizge sinir ağları ortaya çıkmıştır. Beynin fonksiyonel bağlantılar kullanılarak çizge yapısı şeklinde modellenebilmesi [14] ve fNIRS'in yüksek zamansal çözünürlüğü sayesinde [7], çizge sinir ağları ile fNIRS'in birlikte kullanıldığı nörogörüntüleme çalışmaları mevcuttur. Ancak başarılı sonuçlara rağmen bu kombinasyona yer veren nöropazarlama araştırmasına rastlanmamıştır. Bu nedenle bu çalışmada, çizge sinir ağlarının fNIRS temelli nöropazarlama alanındaki performansı incelenmiş ve bu bağlamda başarılı sonuçlar verdiği görülen makine öğrenimi algoritmaları ile karşılaştırılması yapılmıştır. Karşılaştırma için, markalara yönelik algıları belirlemek amacıyla yürütülen bir nöropazarlama deneyinin fNIRS ölçümleri kullanılmıştır. Deneyde, tüketicilerden marka logosuyla birlikte gösterilen sıfatın markaya uygun olup olmadığına dair karar vermeleri (evet/hayır) istenmiştir. Elde edilen ölçümler temizlenerek veri seti elde edilmiştir. İlk olarak bu veri setine gözetimli makine öğrenimi yaklaşımı uygulanmıştır. Veri seti birkaç veri ön işleme aşamasından geçirildikten sonra üzerinde çeşitli algoritmalar eğitilmiştir. Bunlar, K-Nearest Neighbors, Support Vector Machines, Random Forest, Naive Bayes ve XGBoost algoritmalarıdır. Sonrasında ise diğerlerine göre daha başarılı olan algoritmalardan, biri soft voting diğeri hard voting olmak üzere iki farklı voting classifier oluşturulmuştur. Makine öğrenimi yaklaşımı tamamlandıktan sonra çizge sinir ağları yaklaşımına geçilmiştir. fNIRS aracılığı ile elde edilen veriler, beyindeki fonksiyonel bağlantılar kullanılarak çizge yapısına dönüştürülmüştür. Fonksiyonel bağlantıların hesaplanmasında Pearson korelasyon katsayısı kullanılmıştır. Katılımcıların her denemesi için bir çizge oluşturulduğundan ve her çizgenin etiketi (evet/hayır) bulunduğundan, çizge seviyesinde sınıflandırma yapılmıştır. Çizgelerin sınıflandırılması için, oluşturulan çizgeler, çizge sinir ağları mimarilerine girdi olarak verilmiştir. Çalışmada kullanılan mimariler, Graph Convolutional Network, Graph Attention Network ve Graph Isomorphism Network'ten oluşmaktadır. Son olarak, bu mimarilerin bir araya getirilmesiyle bir soft voting classifier oluşturulmuştur. Tüm yöntemlerin test accuracy değerleri hesaplanmış ve bu değerlere güven aralıkları eklenmiştir. Karşılaştırma sonuçları, genel olarak makine öğrenimi algoritmalarının çizge sinir ağlarından daha iyi performans verdiğini göstermiştir. Ek olarak, topluluk öğrenimine dayalı makine öğrenimi modelleri en iyi skorlara sahiptir.
  • Master Thesis
    Comparing audio features for speech emotion recognition using machine learning algorithms
    (MEF Üniversitesi, 2022) Gümüş, Fatma; Çakar, Tuna
    Ses, hayatımızın tamamlayıcı bir parçasıdır. Son yıllarda ses teknolojisine olan talep sanat ve insan-makine etkileşimi sistemlerinde artmaktadır. Ses ile daha fazla bilgi daha hızlı bir şekilde aktarılabilmektedir. Konuşma iletişim kurmanın doğal bir yoludur ve bunun sonucu olarak teknolojik alanlarda kullanıcı ile temas kurmada öncelikli tercih edilir. Sesimiz konuşma sırasında hem dilsel hem de dilsel olmayan bilgileri taşır. Dilsel olmayan ritim, perde gibi bilgiler konuşmacının duygu durumu ile ilgili ipucu sağlar. Duygular bilişsel, fizyolojik ve davranışsal değişikliklerden oluşur ve tüm bu fenomenler birbirleriyle ilişkilidir. Genel anlamda duygu, düşünceleri etkileyen, davranışları belirleyebilen, fiziksel ve psikolojik değişiklikleri oluşturan durum olarak açıklanabilir. Konuşmadan Duygu Çıkarımı konusu 'Nasıl söyledi?' sorusunun cevabını inceler ve kayıt edilmiş bir sesten algoritma yardımı ile duyguyu belirlemeye çalışır. Bu çalışmada, Konuşmadan Duygu Çıkarımı problemine makine öğrenimi türlerinden sınıflandırma yöntemi ile çözüm aranmıştır. Ses çok fazla sayıda karakteristikten oluşmaktadır, bu karakteristiklerin duygu ile ilişkili olan optimize seti henüz tespit edilememiştir. Bu özellikleri karşılaştırmak ve en ayırt edici özelliği belirleyebilmek için sesin farklı boyutlardaki Root Mean Square Energy (RMSE), Zero Crossing Rate (ZCR), Chroma ve Mel Frequency Cepstral Coefficients (MFCC) özellikleri duygu tahmini için incelenmiştir. Daha yakın zamanlarda geliştirilmeye başlanan ön eğitimli model ile girdilerin oluşturulabilmesi için wav2vec Large modeli de kullanılmıştır. Geleneksel yöntemler ile elde edilen öznitelik ve ön eğitimli model girdilerinin duygu tahmini karşılaştırması için Destek Vektör Makineleri, Çok Katmanlı Algılayıcılar ve Evrişimsel Sinir Ağı algoritmaları ile modeller geliştirilmiştir. Çalışmada Mutlu, Sakin, Kızgın, Can Sıkıntısı, İğrenme, Korku, Nötr, Üzüntü ve Şaşkın duyguları sınıflandırılmaya çalışılmış, İngilizce ve Almanca konuşma setleri kullanılarak modeller eğitilmiş ve test edilmiştir. Sınıflandırma sonuçları incelendiğinde en başarılı tahminlerin ön eğitimli modeller ile elde edildiği görülmektedir. Evrişimsel Sinir Ağı ve Çok Katmanlı Algılayıcılar için %91 ağırlıklı doğruluk oranı ön eğitimli modeller için ortak iken bu oran Destek Vektör Makineleri'nde %87'dir. Duygular arasında ise en iyi tahmin ön eğitimli model kullanılan Evrişimsel Sinir Ağı yöntemiyle Korku duygusu için %95 f- skor ile elde edilmiştir.