Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.11779/1785

Browse

Search Results

Now showing 1 - 10 of 16
  • Master Thesis
    Forecasting for e-commerce sales using supervised machine learning algorithms
    (MEF Üniversitesi, 2024) Pamuk, Ayçelen; Çakar, Tuna
    E-ticaretin gelişimi için temel olan öngörüsel analitiklere büyük ölçüde bağımlı olan büyüyen e-ticaret manzarası, operasyonel verimliliği ve stratejik karar alma süreçlerini yönlendirmektedir. Bu tez, makine öğrenimi algoritmalarının teorik temellerine derinlemesine inerken, çevrimiçi ticaretin büyümesini kolaylaştırmadaki evrimini ve kilit rolünü sergilemektedir. Bu araştırma, geniş çaplı bir e-ticaret veri kümesinin analizi yoluyla satış desenlerini öngörme odaklıdır. Öngörme, e-ticaret işletmelerinde çeşitli kritik işlevler için bir anahtar görev üstlenmektedir. Envanter yönetimini, optimal stok seviyelerini ve düzenli teslimatları sağlayarak, stratejik varlık yönetimi aracılığıyla finansal planlamayı, dinamik fiyatlandırma stratejilerini ve etkili teslimat operasyonlarıyla müşteri memnuniyetini artırmayı içeren çok yönlü uygulamaları kapsar. Ayrıca, öngörme, özelleştirilmiş kampanyaları ve akıllı bütçe tahsisini mümkün kılarak pazarlama çabalarını geliştirmede de temel bir rol oynamaktadır. Makine öğrenimi algoritmalarının entegrasyonu, bu işlevleri güçlendirmektedir. Bu araştırmanın merkezinde e-ticaret alanındaki temel bir satış tahmini görevi bulunmaktadır ve özellikle kampanya değişkenlerini entegre etme odaklıdır. Altı farklı makine öğrenimi algoritmasını kullanarak, çalışma en doğru ve açıklayıcı modeli belirlemeyi amaçlamaktadır. Dikkat çekici bir şekilde, araştırma LGBM'yi en uygun algoritma olarak belirler. Önceki tahmin çalışmalarında nadiren keşfedilen kampanya değişkenlerinin dahil edilmesi, ilginç içgörüler sunar. Ancak, başlangıçtaki varsayımların aksine, SHAP analizi, kampanya değişkenlerinin modelin açıklanabilirliği üzerinde daha az etkiye sahip olduğunu ortaya koymaktadır. Bu sınırlama farkındalığını kabul eden çalışma, değişkenleri etkili bir şekilde temsil etmek için kümeleme algoritmalarını kullanarak modelin açıklanabilirliğini artırma potansiyeline dikkat çekmektedir.
  • Master Thesis
    Serverless vs. on-premises: A performance analysis of ml deployment with aws fargate, GCP Cloud run, and On-Prem
    (MEF Üniversitesi, 2024) Kırçiçek, Oğuz; Çakar, Tuna
    Bu çalışmada, makine öğrenimi modellerinin dağıtım sürecinde meydana gelen değişikliklerin On-Premises sistemler ve bulut hizmet sağlayıcılarındaki karşılaştırmalı analizini sunmaktayım. Makine öğrenimi modellerinin başarılı bir şekilde dağıtılması, üretkenliklerini artırmayı amaçlayan işletmeler ve kuruluşlar için kritik bir öneme sahiptir. Modellerin farklı ortamlarda nasıl davrandığını anlamak ve karşılaştırmak, bilinçli kararlar vermek için büyük öneme sahiptir. AWS ve GCP gibi önde gelen ticari organizasyonlar, özelleştirilmiş web uygulamaları sunmak üzere tasarlanmış güvenilir ve maliyet etkin bulut hizmetleri sunmaktadır. Bu makalenin temel amacı, en tanınmış bulut hizmeti sağlayıcılarının anahtar özelliklerini vurgulayarak bulut müşterilerini yönlendirmek ve On-Premises seçeneği ile karşılaştırmalar yaparak bilinçli karar almayı kolaylaştırmaktır. Ayrıca, AWS Fargate ve Google Cloud Run gibi yönetilen hizmetlerin avantajlarını keşfediyoruz, bu hizmetler uygulama dağıtımını kolaylaştırmaktadır. Bu araştırma aracılığıyla, işletmelerin stratejik kararlar alarak dinamik ve rekabetçi iş dünyasında başarı elde etmelerine olanak tanıyan değerli içgörüler sağlamak amaçlanmıştır.
  • Master Thesis
    Customer transaction predictive modeling via machine learning algorithms
    (MEF Üniversitesi, 2023) Ertuğrul, Seyit; Çakar, Tuna
    The main purpose of this study is to determine the behavior and characteristics of the customers of a company that is active in the factoring sector, and accordingly, to capture measurable parameters with exploratory data analysis based on the historical data of the customers, and then to perform predictive models for the target. A hit rate of around 80% was achieved in SVM and Extra Trees models, which are classification model algorithms. In this way, it is aimed to directly contribute to the transaction volume on a business basis by acting in a more effective, efficient and correct approach after approving the check that shows high potential, that is, the customers who are likely to accept it after the offer is made as a business.
  • Master Thesis
    Customer churn prediction for the Pay-TV sector
    (MEF Üniversitesi, 2023) Hataş, Tuğçe Aydın; Çakar, Tuna
    Müşteri kaybı, şirketler için gelir kaybı ve yeni müşteri kazanımı için pazarlama maliyetleri yarattığından müşterilerin aboneliklerini neden sonlandırdıklarını anlamak, mevcut müşterileri elde tutmak açısından katma değer sağlamaktadır. Bu çalışma kapsamında Türkiye'de hizmet veren Pay-TV firmasının müşterilerinin 6 aylık geçmiş verileri kullanılmış ve veri setinin etiket bazında dengesiz olması sebebiyle aşırı örnekleme yöntemi de uygulanmıştır. Model geliştirme aşamasında farklı yapay öğrenme (Rassal Orman, Lojistik Regresyon, K-En Yakın Komşu, Karar Ağacı, AdaBoost, XGBoost, Ekstra Ağaç Sınıflandırıcı) algoritmaları kullanılmış ve model performansları karşılaştırılmıştır. Her bir model için başarı kriterleri incelenerek bu veri seti için en yüksek performans gösteren modellerin ağaç-bazlı Rassal Orman, Ekstra Ağaç Sınıflandırıcı ve XGBoost olduğu görülmüştür.
  • Master Thesis
    Segmentation for factoring customers using unsupervised machine learning algorithms
    (MEF Üniversitesi, 2023) Ayyıldız, Nur Seher; Çakar, Tuna
    Günümüzde teknolojinin veri toplamayı kolaylaştırmasının önemli bir fırsat olmasının yanı sıra tüm bu verilerin yönetimini zorlaştırmakta ve veriler iyi işlenmedikçe bir anlam ifade etmemektedir. Depolanan bu veriler son derece önemlidir ve şirketler, müşterileri tarafından sağlanan verileri kullanır. Değişen dünyanın müşteri profillerinin ihtiyaçlarını yakalamak artık bir zorunluluk haline gelmekte ve firmalar için ilk sırayı almaktadır. Zamanla depolanan verinin artması ile artık veriler arasında ilişki kurmak ve bunları birbirinden ayırmak zor bir hal almıştır. Bu noktada hayatımıza makine öğrenmesi yöntemleri daha fazla dahil olmaya başlamıştır. Bu çalışmada, segmentasyonun ne olduğu ve yıllar içindeki değişiminden bahsedilmiştir. Hangi makine öğrenmesi tekniklerinin veri seçiminde faydalı olacağına değinilmiştir. Ardından olası makine öğrenmesi yöntemleri yerel bir faktoring şirketinin müşteri çek verileri kullanılarak gösterilmiştir. Bu çalışma etiketsiz verilerin gruplanmasını hedeflediğinden gözetimsiz öğrenme teknikleri üzerinde durulmuştur. Bu yöntemler arasında en popular olan K – means algoritmasının yanı sıra Hiyerarşik Kümeleme, DBSCAN, Gauss Karışık Modelleme ve Fuzzy c - Means yöntemleri kullanılmıştır. Her bir algoritma için başarı ölçütleri incelenerek uygun küme sayıları bulunmuş ve bulunan sonuçlar karşılaştırılmıştır. Kümeleme sonuçları incelendiğinde GMM ile optimal küme sayısı oldukça yüksek hesaplanmış, DBSCAN küme atayamamış, Hierarchical clustering ise zaman açısından maliyetli bulunmuştur. En iyi sonuçların K - means ve Fuzzy c - Means algoritmalarıyla elde edildiği gözlemlenmiştir.
  • Master Thesis
    Predicting the preference of liking using fNIRS and machine learning algorithms
    (MEF Üniversitesi, 2023) Köksal, Mehmet Yiğit; Çakar, Tuna
    Davranışsal örüntüleri tespit etmede genel olarak kullanılan fMRI yöntemi pahalı ve pratik olmayan özellikleriyle dikkat çekmektedir. Buna karşın yakın kızılötesi spektroskopi (fNIRS) yöntemi daha ucuz ve portatif özelliklere sahip olmak ile birlikte, iyi bir tahmin modeli oluşturmada fMRI kadar etkilidir. Bu yöntem ile çeşitli makine öğrenmesi algoritmaları kullanılarak insanların bir görsel uyaranı beğenip beğenmediğini tahmin edebilecek bir model geliştirilmiştir. Kullanılan klasik makine öğrenmesi metotları Destekleyici Vektör Makineleri (SVM), Rastgele Orman algoritması, XGBoost, LightGBM, k En Yakın Komşu (KNN) algoritmalarıdır. SVM ve KNN gibi fNIRS çalışmalarında sık kullanılan ve başarıları onaylanmış algoritmaların yanında, artırma ve ağaç bazlı algoritmalar da ek olarak kullanılarak tamamlayıcı bir karşılaştırma yapılması amaçlanmıştır. Bunun yanında, verideki eksik değerleri tamamlamak amacıyla çeşitli eksik veri doldurma yöntemleri kullanılmış ve bu tarz bir sınıflama problemi için aralarından en uygun olanı seçilmiştir. Model geliştirilirken ana odak olan öznitelik indirgeme yöntemleri arasında karşılaştırma yapılmıştır. Gözetimsiz bir eğitme yöntemi olan K-means kümeleme yaklaşımı kullanılarak benzer fNIRS ölçümlerine sahip olan katılımcılar kümelendikten sonra bu kümeler One-hot-encoding yöntemi ile kodlanarak sınıflama sonuçlarının daha başarılı çıkacağı düşünülmüştür. Bunun yanında, ikincil görev olarak, çeşitli öznitelik çıkarım ve sarıcı (öznitelik seçme) yöntemleri de uygulanarak beğeni tahmini modelleri performanslarının artırılması adına denemelerde bulunulmuştur. Kullanılan öznitelik çıkarım metotları arasında PCA, Isomap, t-SNE gibi yaklaşımlar yer almakla birlikte, sarıcı yöntem olarak ileri seçim sarıcı dizaynı ek bir adım olarak kullanılarak modellerin daha da geliştirilmesi amaçlanmıştır. Bu yöntemlerin sınıflama skorları kendi aralarında karşılaştırılarak sonuçlar gösterilmiştir. Modellerin çapraz doğrulama yönteminden gelen F1 skorları kullanılarak en iyi modeller aranmıştır. Tek bir grubu dışarıda bırakan çapraz doğrulama yöntemi kullanılarak modeller arasında karşılaştırma yapılmıştır. Böylece bu çapraz doğrulama yöntemi kullanılarak her katta farklı bir katılımcının verisi tek başına test edilecek şekilde bir kurgu yapılmıştır. Bu şekilde hem her katılımcı özelinde skorlar görülmüş, hem de model performanslarından çıkan sonuçların istatiksel olarak daha güvenilir olması amaçlanmıştır. Son performans değerlendirme ve karşılaştırma yöntemleri olarak permütasyon ve Wilcoxon İşaretli Sıralama teknikleri kullanılarak modellerin skorları istatiksel olarak karşılaştırılmış ve istatiksel anlamları tespit edilmiştir.
  • Master Thesis
    Customer churn prediction for a personal care product retail chain operating in Turkey
    (MEF Üniversitesi, 2024) Işık, Ercan; Çakar, Tuna
    Müşteri kaybının nedenlerini ve buna yol açan müşteri davranışlarını anlamak, ayrıca müşterinin bir sektöre veya şirkete olan sadakatini tahmin edebilmek, mevcut müşterileri elde tutmada ve yeni müşterilere ulaşmak için yapılan pazarlama ve reklam maliyetlerinden kaynaklanan gelir kaybını önlemede büyük avantaj sağlar. Bu çalışmada, Türkiye'de faaliyet gösteren bir kişisel bakım ürünleri perakende zincirine ait 29 aylık veri kullanılmış; veri setindeki dengesiz dağılım ve müşteri olmayan girişler nedeniyle aşırı örnekleme ve sentetik örnekleme yöntemleri uygulanmıştır. Model geliştirme aşamasında Lojistik Regresyon, Karar Ağacı, K-En Yakın Komşu, Rassal Orman, Ekstra Ağaç Sınıflandırıcı, MLP (Çok Katmanlı Algılayıcı) Sınıflandırıcı uygulanmış ve doğruluk, geri çağırma, F1 skoru, kesinlik ve karmaşıklık matrisi gibi metrikler kullanılarak performansları değerlendirilmiştir. Bu karşılaştırmalar sonucunda, Rassal Orman ve MLP Sınıflandırıcı modellerinin bu veri seti için en iyi performansı gösterdiği gözlemlenmiş; Ekstra Ağaç Sınıflandırıcı ve Karar Ağacı gibi diğer ağaç tabanlı algoritmaların ise biraz daha düşük fakat karşılaştırılabilir performans sağladığı tespit edilmiştir.
  • Master Thesis
    Comparing the effectiveness of graph neural networks and machine learning algorithms for fNIRS-based neuromarketing research
    (MEF Üniversitesi, 2024) Güngör, Atakan; Çakar, Tuna
    Fonksiyonel yakın kızılötesi spektroskopinin (fNIRS) maliyet ve taşınabilirlik açısından diğer beyin görüntüleme yöntemlerine göre bazı avantajları vardır. Bu nedenle nöropazarlama alanında kullanımı gittikçe artmaktadır. Ancak fNIRS, sağladığı avantajların yanında bazı zorlukları da beraberinde getirmektedir. Çok kanallı ölçüm ve yüksek zamansal çözünürlük gibi özellikler nedeniyle fNIRS verilerinin doğası karmaşık ve çok boyutludur [7]. Nöropazarlama araştırmacıları, bu zorlukların üstesinden gelebilmek için makine öğrenimi algoritmalarından yararlanmıştır. Bu çalışmalar incelendiğinde başarılı sonuçların ortaya çıktığı görülmüştür. Makine öğrenimi, nöropazarlama araştırmacılarının yanı sıra çizge üzerinde çalışan araştırmacıları da etkilemiştir. Böylece yapay sinir ağlarının çizge veri yapılarına uygulanmasına izin veren çizge sinir ağları ortaya çıkmıştır. Beynin fonksiyonel bağlantılar kullanılarak çizge yapısı şeklinde modellenebilmesi [14] ve fNIRS'in yüksek zamansal çözünürlüğü sayesinde [7], çizge sinir ağları ile fNIRS'in birlikte kullanıldığı nörogörüntüleme çalışmaları mevcuttur. Ancak başarılı sonuçlara rağmen bu kombinasyona yer veren nöropazarlama araştırmasına rastlanmamıştır. Bu nedenle bu çalışmada, çizge sinir ağlarının fNIRS temelli nöropazarlama alanındaki performansı incelenmiş ve bu bağlamda başarılı sonuçlar verdiği görülen makine öğrenimi algoritmaları ile karşılaştırılması yapılmıştır. Karşılaştırma için, markalara yönelik algıları belirlemek amacıyla yürütülen bir nöropazarlama deneyinin fNIRS ölçümleri kullanılmıştır. Deneyde, tüketicilerden marka logosuyla birlikte gösterilen sıfatın markaya uygun olup olmadığına dair karar vermeleri (evet/hayır) istenmiştir. Elde edilen ölçümler temizlenerek veri seti elde edilmiştir. İlk olarak bu veri setine gözetimli makine öğrenimi yaklaşımı uygulanmıştır. Veri seti birkaç veri ön işleme aşamasından geçirildikten sonra üzerinde çeşitli algoritmalar eğitilmiştir. Bunlar, K-Nearest Neighbors, Support Vector Machines, Random Forest, Naive Bayes ve XGBoost algoritmalarıdır. Sonrasında ise diğerlerine göre daha başarılı olan algoritmalardan, biri soft voting diğeri hard voting olmak üzere iki farklı voting classifier oluşturulmuştur. Makine öğrenimi yaklaşımı tamamlandıktan sonra çizge sinir ağları yaklaşımına geçilmiştir. fNIRS aracılığı ile elde edilen veriler, beyindeki fonksiyonel bağlantılar kullanılarak çizge yapısına dönüştürülmüştür. Fonksiyonel bağlantıların hesaplanmasında Pearson korelasyon katsayısı kullanılmıştır. Katılımcıların her denemesi için bir çizge oluşturulduğundan ve her çizgenin etiketi (evet/hayır) bulunduğundan, çizge seviyesinde sınıflandırma yapılmıştır. Çizgelerin sınıflandırılması için, oluşturulan çizgeler, çizge sinir ağları mimarilerine girdi olarak verilmiştir. Çalışmada kullanılan mimariler, Graph Convolutional Network, Graph Attention Network ve Graph Isomorphism Network'ten oluşmaktadır. Son olarak, bu mimarilerin bir araya getirilmesiyle bir soft voting classifier oluşturulmuştur. Tüm yöntemlerin test accuracy değerleri hesaplanmış ve bu değerlere güven aralıkları eklenmiştir. Karşılaştırma sonuçları, genel olarak makine öğrenimi algoritmalarının çizge sinir ağlarından daha iyi performans verdiğini göstermiştir. Ek olarak, topluluk öğrenimine dayalı makine öğrenimi modelleri en iyi skorlara sahiptir.
  • Master Term Project
    Machine Learning Applications To Increase Customer Satisfaction In Finance Sector
    (MEF Üniversitesi, Fen Bilimleri Enstitüsü, 2019) Yiğit, Leyla; Çakar, Tuna
    In this project, consumers’ complaints about financial data are analyzed. After the analysis, we aim to provide a tool for financial companies such as banks, Lenders that will help them in managing communication with the consumers. Our main aim is to answer the question “How do consumers feel?” This analysis will give a complete picture of consumers’ feedback. We start the project by clustering the customers into different groups. In order to classify customers, we use classification algorithms XGBOOST and Random Forest. XGBOOST is used to predict the probability of getting a complaint. XGBOOST is also tested as an ensemble learning technique. By Using Random Forest the comparison of Bagging and Boosting is performed. This kind of model is very useful for a customer service department that wants to classify the complaints they receive from their customers. These kinds of models can also be expanded into a system that can recommend automatic solutions to future complaints as they come. The topic is motivated by the researcher’s experience in finance where she intends to increase credit sell numbers by anticipating customer feelings. The data set that we use has many measures and dimensions that facilitate to use more than 3 machine learning algorithms. The complaints database is published by the Consumer Financial Protection Bureau (https://www.consumerfinance.gov/). It provides consumers’ feedback in a string format. We also aim to analyze consumers’ complaints dataset from the perceptive of a consumer dispute.
  • Master Term Project
    Boarding Pass Detection In Social Media To Prevent Flight Information Thft
    (MEF Üniversitesi, Fen Bilimleri Enstitüsü, 2019) Ekici, Hasan Oktay; Çakar, Tuna
    During the past few years, along with social media gaining bigger share on people’s lives, everyone has started to share their moments with detailed information on multiple platforms instantly. Sharing these kinds of information on posts may cause security bugs in people’s lives, such as undesired flight changes/cancellations because of flight information theft, frequent flyers miles theft, and even car theft and burglary. This project’s aim is to develop an artificial intelligence algorithm that can help to prevent these security bugs. In this project, we use data that is collected from instagram posts that contain boarding passes. Our main purpose is to build an artificial intelligence that makes decisions and processes following procedures: a machine learning algorithm that decides if the shared instagram post contains a boarding pass shared with #boardingpass; an optical character recognition algorithm that gathers text information from the post and scripts that send the information instantly to the relevant air carrier about the shared post. With this information, air carrier will be able to inform the passenger about their concern on the flight safety only in a couple of minutes after the post is shared.