Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.11779/1785

Browse

Search Results

Now showing 1 - 10 of 20
  • Master Thesis
    EAFT: Evrimsel Algoritmalar ile GCC İşaretçi Optimizasyonu
    (2023) Tağtekin, Burak; Çakar, Tuna
    The runtime of written codes is a matter of great importance, especially for code that is compiled once and executed multiple times. It is very important for developers to ensure that the resources required by a code are used as efficiently as possible, and that the runtime is as low as possible. Developers who use compilers such as GCC or LLVM to compile and run code written in C or C++ can optimize their code manually and, with certain optimization pointers, are able to make it run faster. This will provide the shorter runtime, but completıng this manual optimization is within the abilities of every developer since determining the right combination from more than 200 flags requires significant expertise. Many studies have tackled this issue. In this study, Evolutionary Algorithms for GCC Flag Tuning (EAFT) have been developed as a solution to this problem. This Autotuner, which is completely open-source, runs the code provided by the end user according to the specifications also selected by the end user, and searches for the most suitable optimization markers. For the code to be given In line with this study, which specifically addresses the end user, the user can input the code path directly from the Terminal, as well as specify the selection method and the crossover to be used. These choices can be made without the need to alter the code. The genetic algorithm and particle swarm optimization to be used is also presented to the user in EAFT, and unlike in other studies, genetic algorithm contain not one but several models.
  • Master Thesis
    Makine Öğrenme ve Derin Öğrenme Modelleri Kullanılarak Gümrük İşlem Belgelerinin Görsel Sınıflandırılması
    (2025) Demir, Hasan Hürşad; Çakar, Tuna
    Gümrük işlemlerinde kullanılan belgelerin imgesel hallerini, makine öğrenmesi ve derin öğrenme modelleri ile sınıflandırma yapılmıştır. Resim sınıflandırma yöntemleri olarak, bu tez kapsamında, makine öğrenmesi alanında Gaussian Naive Bayes, Rastgele Orman ve Destek Vektör Makinesi; derin öğrenme alanında Evrişimsel Sinir Ağları, Görsel Dönüştürücü, ConvNext ve EfficientNetV2 yöntemleri kullanılmıştır. Model tiplerine özel olarak veri setleri düzenlenmiş olup, modellerin en uygun düzeyde çalışmasını sağlayacak şekilde belirlenen parametre değerleriyle modeller oluşturulmuş ve ilgili veri setleri ile eğitim ve testleri yapılmıştır. Modellerin karşılaştırılmaları eğitim süreleri ve doğruluk oranları açısından yapılmıştır. En iyi sonuçlar, yaklaşık 11 dakikalık eğitim süresi ve %98,32 doğruluk oranı ile Evrişimsel Sinir Ağı modeliyle elde edilmiştir. İkinci en yüksek doğruluk oranı %97,94 ile Rastgele Orman modelinde elde edilirken, genel anlamda ikinci en iyi sonuçlar ise yaklaşık 22 dakikalık eğitim süresi ve %95,89 doğruluk oranı ile EfficientNetV2 modeliyle elde edilmiştir.
  • Master Thesis
    Uçtan Uca Yöntemi İle Büyük Dil Modeli Tabanlı Sohbet Botlarının Performans Değerlendirmesi:Llama-8b,Llama-7b,Gemma-7b ve Mistral-7b
    (2025) Cenk, Naile; Karahoca, Adem
    Bu çalışma, müşteri destek sohbet robotları bağlamında büyük dil modellerinin (LLM) performansını uçtan uca (E2E) değerlendirme çerçevesi kullanarak incelemektedir. Özellikle, Gemma-7B, Mistral-7B,Llama-8B ve Llama-7B adlı dört önde gelen açık kaynak model; kullanıcı sorgularını anlamada ve anlamlı, doğru yanıtlar üretmede gösterdikleri başarıya göre karşılaştırılmıştır. İncelenen chatbot uygulaması, eğitim içerikleri sunan bir dijital platformda danışmanlık hizmeti vermek amacıyla tasarlanmış ve 3000'den fazla özenle hazırlanmış soru-cevap çiftiyle test edilmiştir. Değerlendirme süreci, hem anlamsal hem de sözcük düzeyinde ölçütleri birleştirmektedir. Model yanıtlarının uzmanlarca yazılmış yanıtlarla ne derece örtüştüğünü belirlemek için kosinüs benzerliği; sözcük düzeyindeki doğruluğu ölçmek için ise ROUGE metrikleri kullanılmıştır. Bulgular, Gemma-7B ve Llama-8B modelinin tüm metrikler boyunca en tutarlı performansı sergilediğini, Mistral-7B'nin dengeli ancak zaman zaman değişken çıktılar ürettiğini, Llama-7B'nin ise yapısal olarak güçlü olmasına rağmen anlamlı ve bağlama uygun yanıtlar üretmede zorlandığını göstermektedir. Sonuçlar, gerçek dünya chatbot uygulamaları için model seçiminin pratik sonuçlarını ortaya koymakta ve LLM performansının müşteri etkileşimi bağlamında değerlendirilmesinde çok boyutlu analiz yöntemlerinin önemini vurgulamaktadır.
  • Master Thesis
    Makine Öğrenmesi İle Churn Talebi Analizi
    (2025) Genç, Önder; Çakar, Tuna
    Son günlerde Pay TV hizmetleri çeşitlenmektedir. Çeşitlenen hizmetlerle birlikte şirketler arasındaki rekabette artmaktadır. Strait Reserch araştırmalarına göre 2021 yılında 183 milyon dolar olan Global Pay TV pazarının 2030 yılında 210 milyon dolara yükselmesi tahmin edilmiştir. Bunun yanısıra Neflix'in araştırmasına göre edinilmiş veya elde tutulan abonelerin daha değerli olduğu belirtilmektedir. Aboneliklerini sonlandırmayı düşünen müşterilerin önceden tahmin edilebilmesi şirketler açısından oldukça önemli bir hal almıştır. Son yıllarda etkinliği gittikçe artan makine öğrenmesi ve yapay sinir ağları gibi tekniklerle tahminlemeyi yapmak daha kolay hale gelmiş ve şirketlere önemli katkılar sağlamaktadır. Bu çalışmada, bazı makine öğrenmesi modelleri ile ilgili bilgiler verilmiştir. Pay TV hizmeti veren bir şirketin verileri kullanılarak bazı makine öğrenmesi modelleri ile tahminlemeler yapılmıştır. Son olarak abonelik iptal talep edebilecek müşterilerin, son yaptığı abonelik iptal talebi ve en çok yaptığı iptal talepleri ile ilgili bilgilerde sonuca eklenerek, abonelik iptal talebi gerçekleşmeden, müşteriyle iletişime geçilmesi ve uygun bir kampanya önerilerek iptali önlemek hedeflenmiştir. Bu çalışma da etiketli veriler kullanılarak denetimli öğrenme teknikleri ile çalışılmıştır. Çalışma kapsamında Random Forest, XGBoost Classifier, KNeigbors Classifier, Logistic Regression, Ada Boost Classifier, Linear Discriminant Analysis, Decision Tree Classifier ve Extra Tree Classifier modelleri kullanılmıştır. Bütün modeller için başarı ölçütleri bulunmuş ve karşılaştırılmıştır. Servis sağlayıcıdan elde edilen veriler açısından en uygun model Random Forest olarak belirlenmiştir.
  • Master Thesis
    Dengesiz Veri Ambarları İçin Düşük Maliyetli ve Yüksek Performanslı Veri Tabanı Sistemi Çözümleri
    (2025) Demir, Bedrun Gazanfer; Karahoca, Adem
    1970'lerden itibaren RDBMS veritabanları, yalnızca OLTP sistemlerinde değil, aynı zamanda analitik sistemlerde de en yaygın kullanılan veritabanı türü olmuştur. Bu durum, hem teknik faktörler hem de veritabanı sistemlerinin ihtiyaçlara göre tarihsel gelişimiyle açıklanabilir. 1980'lerden önce analitik ihtiyaçlar doğrudan OLTP sistemleri üzerinden karşılanıyordu. Ancak 1980'lerden sonra, Inmon ve Kimball modelleri temel alınarak analitik veritabanları geliştirildi. Bu modeller, geleneksel 3NF modeline alternatif olarak ortaya çıktı ve OLTP sistemlerinden bağımsız, farklı platformlarda çalışan sistemler haline geldi. Kolon bazlı veritabanı uygulamaları 1969'dan itibaren var olmasına rağmen [1,2], son 15 yıla kadar yaygınlaşmamıştır. Bu veritabanlarının giderek daha fazla tercih edilmesinin temel nedeni, verinin olağanüstü boyutlara ulaşması ve hızla artmaya devam etmesidir. Mimari yapıları sayesinde, özellikle veri ambarı (DWH) çözümlerinde daha başarılı sonuçlar sunmaktadırlar. Bu tezde öncelikle, kolon bazlı veritabanlarının RDBMS sistemlerinden daha başarılı olup olmadığını inceleyeceğiz. Eğer daha başarılılarsa, ne ölçüde daha iyi performans sunduklarını, hangi koşullarda avantaj sağladıklarını ve en önemlisi, bu üstün performansın temel nedenlerini araştıracağız. İkinci olarak, bu karşılaştırmanın maliyet boyutuna odaklanacağız. Çalışmamız, kolon bazlı veritabanlarının iş dünyasında nasıl uygulanabileceğini de göz önünde bulundurmaktadır. Bu nedenle, maliyetlerini RDBMS sistemleriyle kıyaslayacağız. Performans artışı ile maliyet arasında bir korelasyon olmalıdır; ideal senaryoda, kolon bazlı veritabanları sadece daha iyi performans sunmakla kalmayıp, aynı zamanda RDBMS sistemlerine kıyasla daha düşük maliyetli olmalıdır. Eğer bu mümkünse, en iyi seçenek bu olacaktır. Bir diğer önemli konu ise, gerçek bir veri ambarı (DWH) uygulaması üzerinde inceleme yaparak, teorik sonuçların iş dünyasındaki istisnalar nedeniyle doğrulanmasının zor olduğu durumları anlamaktır. Bu nedenle, Star Schema Benchmark (SSBM) [3] yerine, bir GSM şirketinin boyutsal modelleme (özellikle takımyıldızı/galaksi alt tipi) kullanan veri ambarı üzerinde çalışarak karşılaştırma yapacağız. Anahtar Kelimeler: (Kolon, database, RDBMS, DWH, MPP) Bilim Dalı Sayısal Kodu: 92432
  • Master Thesis
    Toprak Özelliklerini ve İklim Değişikliğini Tahmin Etmek için Derin Öğrenme
    (2025) Çelik, Nurçin; Drias, Yassine
    Toprak, bitki büyümesi için gerekli olan temel besinleri, mineralleri ve elementleri sağlamakla kalmayıp aynı zamanda iklim düzenlemesinde ve daha geniş ekosistem işleyişinde hayati bir rol oynayan temel bir doğal kaynaktır. Bu yüksek lisans tezi, arazi örtüsü, topografya, iklim verileri ve diğer mekansal faktörler gibi temel çevresel değişkenleri entegre ederek Türkiye genelinde Dijital Toprak Haritalama (DSM) uygulamalarında modern Yapay Zeka (AI) metodolojilerinin uygulanmasını iyileştirmeyi amaçlamaktadır. Bu hedefe ulaşmak için, bu değişkenlere dayalı olarak toprak özelliklerini tahmin etme performanslarını değerlendirmek üzere yedi farklı makine öğrenimi modelinin karşılaştırmalı analizi yürütülmüştür.
  • Master Thesis
    E-Ticarette Müşteri-Mağaza Alışverış Davranışı Modeli
    (2025) Güney, Görkem; Çakar, Tuna
    E-ticaretin hızlı gelişimi, işletmelerin müşteri davranışları ve satıcı performansını analiz etmek için ileri düzey analitik modellere ihtiyaç duymasına neden olmuştur. Bu çalışmada, müşteri tercihleri, satın alma alışkanlıkları ve satıcıların ürün tekliflerini birleştiren, 'Müşteri-Satıcı Alışveriş Davranışı Modeli' önerilmiştir. Model, RFM (Recency, Frequency, Monetary), kategori tercihleri ve müşteri yaşam boyu değeri gibi müşteri metrikleri ile satıcıların kategori odağı ve satış performansı verilerini kullanarak segmentasyon ve kişiselleştirilmiş öneriler sunmaktadır. K-Means, hiyerarşik kümeleme ve karar ağacı algoritmaları kullanılarak müşteriler ve satıcılar benzer davranışlara göre gruplandırılmıştır. Ayrıca, müşterilerin satın alma eğilimlerini tahmin etmek ve satıcılar ile eşleştirmek için tahmin modelleri ve hibrit öneri sistemleri uygulanmıştır. Sonuçlar, önerilen modelin müşteri bağlılığını, satıcı performansını ve platformun genel etkinliğini önemli ölçüde artırdığını göstermektedir. Bu çalışma, e-ticaret platformları için veri odaklı, ölçeklenebilir ve dinamik bir analitik çerçeve sunmaktadır.
  • Master Thesis
    Kozmetik E-Ticaretinde Kişiselleştirilmiş Ürün Önerileri için İki Kuleli (Two-Tower) Bir Getirme Yaklaşımı
    (2025) Tuncer, Suat; Çakar, Tuna
    Tavsiye sistemleri, e-ticaret platformlarında kullanıcı deneyimini geliştirmek ve etkileşimi artırmak açısından hayati bir rol oynamaktadır. Bu tez, TensorFlow Recommenders (TFRS) kullanılarak uygulanan geri getirme (retrieval) tabanlı sinir ağı mimarileriyle oluşturulmuş iki kişiselleştirilmiş ürün tavsiye yaklaşımının karşılaştırmalı analizini sunmaktadır. İlk yaklaşım, yalnızca kullanıcı ve ürün kimliklerine (ID) dayalı gömlemeleri (embedding) kullanmaktadır. İkinci model ise ürün temsilini, özellikle ürün başlığı ve üst kategori bilgilerini içeren anlamsal (semantik) içerik özellikleriyle zenginleştirmektedir. Her iki model de örtük satın alma verileriyle eğitilmiş ve en yakın komşu getirimi üzerinden recall@K ölçümünü yapan FactorizedTopK metriği ile değerlendirilmiştir. Çalışma, sıcak başlangıç (warm-start) senaryosu varsayımına dayanmakta ve ürün getirimi için gömleme uzayında anlamsal bağlamın değerine vurgu yapmaktadır. Bulgularımız, özellikle ürünler arasındaki anlamsal benzerliğin önemli olduğu durumlarda, içerik özelliklerinin dahil edilmesinin tavsiye doğruluğunu artırmada fayda sağladığını ortaya koymaktadır.
  • Master Thesis
    Forecasting for e-commerce sales using supervised machine learning algorithms
    (MEF Üniversitesi, 2024) Pamuk, Ayçelen; Çakar, Tuna
    E-ticaretin gelişimi için temel olan öngörüsel analitiklere büyük ölçüde bağımlı olan büyüyen e-ticaret manzarası, operasyonel verimliliği ve stratejik karar alma süreçlerini yönlendirmektedir. Bu tez, makine öğrenimi algoritmalarının teorik temellerine derinlemesine inerken, çevrimiçi ticaretin büyümesini kolaylaştırmadaki evrimini ve kilit rolünü sergilemektedir. Bu araştırma, geniş çaplı bir e-ticaret veri kümesinin analizi yoluyla satış desenlerini öngörme odaklıdır. Öngörme, e-ticaret işletmelerinde çeşitli kritik işlevler için bir anahtar görev üstlenmektedir. Envanter yönetimini, optimal stok seviyelerini ve düzenli teslimatları sağlayarak, stratejik varlık yönetimi aracılığıyla finansal planlamayı, dinamik fiyatlandırma stratejilerini ve etkili teslimat operasyonlarıyla müşteri memnuniyetini artırmayı içeren çok yönlü uygulamaları kapsar. Ayrıca, öngörme, özelleştirilmiş kampanyaları ve akıllı bütçe tahsisini mümkün kılarak pazarlama çabalarını geliştirmede de temel bir rol oynamaktadır. Makine öğrenimi algoritmalarının entegrasyonu, bu işlevleri güçlendirmektedir. Bu araştırmanın merkezinde e-ticaret alanındaki temel bir satış tahmini görevi bulunmaktadır ve özellikle kampanya değişkenlerini entegre etme odaklıdır. Altı farklı makine öğrenimi algoritmasını kullanarak, çalışma en doğru ve açıklayıcı modeli belirlemeyi amaçlamaktadır. Dikkat çekici bir şekilde, araştırma LGBM'yi en uygun algoritma olarak belirler. Önceki tahmin çalışmalarında nadiren keşfedilen kampanya değişkenlerinin dahil edilmesi, ilginç içgörüler sunar. Ancak, başlangıçtaki varsayımların aksine, SHAP analizi, kampanya değişkenlerinin modelin açıklanabilirliği üzerinde daha az etkiye sahip olduğunu ortaya koymaktadır. Bu sınırlama farkındalığını kabul eden çalışma, değişkenleri etkili bir şekilde temsil etmek için kümeleme algoritmalarını kullanarak modelin açıklanabilirliğini artırma potansiyeline dikkat çekmektedir.
  • Master Thesis
    Serverless vs. on-premises: A performance analysis of ml deployment with aws fargate, GCP Cloud run, and On-Prem
    (MEF Üniversitesi, 2024) Kırçiçek, Oğuz; Çakar, Tuna
    Bu çalışmada, makine öğrenimi modellerinin dağıtım sürecinde meydana gelen değişikliklerin On-Premises sistemler ve bulut hizmet sağlayıcılarındaki karşılaştırmalı analizini sunmaktayım. Makine öğrenimi modellerinin başarılı bir şekilde dağıtılması, üretkenliklerini artırmayı amaçlayan işletmeler ve kuruluşlar için kritik bir öneme sahiptir. Modellerin farklı ortamlarda nasıl davrandığını anlamak ve karşılaştırmak, bilinçli kararlar vermek için büyük öneme sahiptir. AWS ve GCP gibi önde gelen ticari organizasyonlar, özelleştirilmiş web uygulamaları sunmak üzere tasarlanmış güvenilir ve maliyet etkin bulut hizmetleri sunmaktadır. Bu makalenin temel amacı, en tanınmış bulut hizmeti sağlayıcılarının anahtar özelliklerini vurgulayarak bulut müşterilerini yönlendirmek ve On-Premises seçeneği ile karşılaştırmalar yaparak bilinçli karar almayı kolaylaştırmaktır. Ayrıca, AWS Fargate ve Google Cloud Run gibi yönetilen hizmetlerin avantajlarını keşfediyoruz, bu hizmetler uygulama dağıtımını kolaylaştırmaktadır. Bu araştırma aracılığıyla, işletmelerin stratejik kararlar alarak dinamik ve rekabetçi iş dünyasında başarı elde etmelerine olanak tanıyan değerli içgörüler sağlamak amaçlanmıştır.