Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.11779/1785

Browse

Search Results

Now showing 1 - 9 of 9
  • Master Thesis
    EAFT: Evrimsel Algoritmalar ile GCC İşaretçi Optimizasyonu
    (2023) Tağtekin, Burak; Çakar, Tuna
    The runtime of written codes is a matter of great importance, especially for code that is compiled once and executed multiple times. It is very important for developers to ensure that the resources required by a code are used as efficiently as possible, and that the runtime is as low as possible. Developers who use compilers such as GCC or LLVM to compile and run code written in C or C++ can optimize their code manually and, with certain optimization pointers, are able to make it run faster. This will provide the shorter runtime, but completıng this manual optimization is within the abilities of every developer since determining the right combination from more than 200 flags requires significant expertise. Many studies have tackled this issue. In this study, Evolutionary Algorithms for GCC Flag Tuning (EAFT) have been developed as a solution to this problem. This Autotuner, which is completely open-source, runs the code provided by the end user according to the specifications also selected by the end user, and searches for the most suitable optimization markers. For the code to be given In line with this study, which specifically addresses the end user, the user can input the code path directly from the Terminal, as well as specify the selection method and the crossover to be used. These choices can be made without the need to alter the code. The genetic algorithm and particle swarm optimization to be used is also presented to the user in EAFT, and unlike in other studies, genetic algorithm contain not one but several models.
  • Master Thesis
    Makine Öğrenme ve Derin Öğrenme Modelleri Kullanılarak Gümrük İşlem Belgelerinin Görsel Sınıflandırılması
    (2025) Demir, Hasan Hürşad; Çakar, Tuna
    Gümrük işlemlerinde kullanılan belgelerin imgesel hallerini, makine öğrenmesi ve derin öğrenme modelleri ile sınıflandırma yapılmıştır. Resim sınıflandırma yöntemleri olarak, bu tez kapsamında, makine öğrenmesi alanında Gaussian Naive Bayes, Rastgele Orman ve Destek Vektör Makinesi; derin öğrenme alanında Evrişimsel Sinir Ağları, Görsel Dönüştürücü, ConvNext ve EfficientNetV2 yöntemleri kullanılmıştır. Model tiplerine özel olarak veri setleri düzenlenmiş olup, modellerin en uygun düzeyde çalışmasını sağlayacak şekilde belirlenen parametre değerleriyle modeller oluşturulmuş ve ilgili veri setleri ile eğitim ve testleri yapılmıştır. Modellerin karşılaştırılmaları eğitim süreleri ve doğruluk oranları açısından yapılmıştır. En iyi sonuçlar, yaklaşık 11 dakikalık eğitim süresi ve %98,32 doğruluk oranı ile Evrişimsel Sinir Ağı modeliyle elde edilmiştir. İkinci en yüksek doğruluk oranı %97,94 ile Rastgele Orman modelinde elde edilirken, genel anlamda ikinci en iyi sonuçlar ise yaklaşık 22 dakikalık eğitim süresi ve %95,89 doğruluk oranı ile EfficientNetV2 modeliyle elde edilmiştir.
  • Master Thesis
    Uçtan Uca Yöntemi İle Büyük Dil Modeli Tabanlı Sohbet Botlarının Performans Değerlendirmesi:Llama-8b,Llama-7b,Gemma-7b ve Mistral-7b
    (2025) Cenk, Naile; Karahoca, Adem
    Bu çalışma, müşteri destek sohbet robotları bağlamında büyük dil modellerinin (LLM) performansını uçtan uca (E2E) değerlendirme çerçevesi kullanarak incelemektedir. Özellikle, Gemma-7B, Mistral-7B,Llama-8B ve Llama-7B adlı dört önde gelen açık kaynak model; kullanıcı sorgularını anlamada ve anlamlı, doğru yanıtlar üretmede gösterdikleri başarıya göre karşılaştırılmıştır. İncelenen chatbot uygulaması, eğitim içerikleri sunan bir dijital platformda danışmanlık hizmeti vermek amacıyla tasarlanmış ve 3000'den fazla özenle hazırlanmış soru-cevap çiftiyle test edilmiştir. Değerlendirme süreci, hem anlamsal hem de sözcük düzeyinde ölçütleri birleştirmektedir. Model yanıtlarının uzmanlarca yazılmış yanıtlarla ne derece örtüştüğünü belirlemek için kosinüs benzerliği; sözcük düzeyindeki doğruluğu ölçmek için ise ROUGE metrikleri kullanılmıştır. Bulgular, Gemma-7B ve Llama-8B modelinin tüm metrikler boyunca en tutarlı performansı sergilediğini, Mistral-7B'nin dengeli ancak zaman zaman değişken çıktılar ürettiğini, Llama-7B'nin ise yapısal olarak güçlü olmasına rağmen anlamlı ve bağlama uygun yanıtlar üretmede zorlandığını göstermektedir. Sonuçlar, gerçek dünya chatbot uygulamaları için model seçiminin pratik sonuçlarını ortaya koymakta ve LLM performansının müşteri etkileşimi bağlamında değerlendirilmesinde çok boyutlu analiz yöntemlerinin önemini vurgulamaktadır.
  • Master Thesis
    Makine Öğrenmesi İle Churn Talebi Analizi
    (2025) Genç, Önder; Çakar, Tuna
    Son günlerde Pay TV hizmetleri çeşitlenmektedir. Çeşitlenen hizmetlerle birlikte şirketler arasındaki rekabette artmaktadır. Strait Reserch araştırmalarına göre 2021 yılında 183 milyon dolar olan Global Pay TV pazarının 2030 yılında 210 milyon dolara yükselmesi tahmin edilmiştir. Bunun yanısıra Neflix'in araştırmasına göre edinilmiş veya elde tutulan abonelerin daha değerli olduğu belirtilmektedir. Aboneliklerini sonlandırmayı düşünen müşterilerin önceden tahmin edilebilmesi şirketler açısından oldukça önemli bir hal almıştır. Son yıllarda etkinliği gittikçe artan makine öğrenmesi ve yapay sinir ağları gibi tekniklerle tahminlemeyi yapmak daha kolay hale gelmiş ve şirketlere önemli katkılar sağlamaktadır. Bu çalışmada, bazı makine öğrenmesi modelleri ile ilgili bilgiler verilmiştir. Pay TV hizmeti veren bir şirketin verileri kullanılarak bazı makine öğrenmesi modelleri ile tahminlemeler yapılmıştır. Son olarak abonelik iptal talep edebilecek müşterilerin, son yaptığı abonelik iptal talebi ve en çok yaptığı iptal talepleri ile ilgili bilgilerde sonuca eklenerek, abonelik iptal talebi gerçekleşmeden, müşteriyle iletişime geçilmesi ve uygun bir kampanya önerilerek iptali önlemek hedeflenmiştir. Bu çalışma da etiketli veriler kullanılarak denetimli öğrenme teknikleri ile çalışılmıştır. Çalışma kapsamında Random Forest, XGBoost Classifier, KNeigbors Classifier, Logistic Regression, Ada Boost Classifier, Linear Discriminant Analysis, Decision Tree Classifier ve Extra Tree Classifier modelleri kullanılmıştır. Bütün modeller için başarı ölçütleri bulunmuş ve karşılaştırılmıştır. Servis sağlayıcıdan elde edilen veriler açısından en uygun model Random Forest olarak belirlenmiştir.
  • Master Thesis
    Dengesiz Veri Ambarları İçin Düşük Maliyetli ve Yüksek Performanslı Veri Tabanı Sistemi Çözümleri
    (2025) Demir, Bedrun Gazanfer; Karahoca, Adem
    1970'lerden itibaren RDBMS veritabanları, yalnızca OLTP sistemlerinde değil, aynı zamanda analitik sistemlerde de en yaygın kullanılan veritabanı türü olmuştur. Bu durum, hem teknik faktörler hem de veritabanı sistemlerinin ihtiyaçlara göre tarihsel gelişimiyle açıklanabilir. 1980'lerden önce analitik ihtiyaçlar doğrudan OLTP sistemleri üzerinden karşılanıyordu. Ancak 1980'lerden sonra, Inmon ve Kimball modelleri temel alınarak analitik veritabanları geliştirildi. Bu modeller, geleneksel 3NF modeline alternatif olarak ortaya çıktı ve OLTP sistemlerinden bağımsız, farklı platformlarda çalışan sistemler haline geldi. Kolon bazlı veritabanı uygulamaları 1969'dan itibaren var olmasına rağmen [1,2], son 15 yıla kadar yaygınlaşmamıştır. Bu veritabanlarının giderek daha fazla tercih edilmesinin temel nedeni, verinin olağanüstü boyutlara ulaşması ve hızla artmaya devam etmesidir. Mimari yapıları sayesinde, özellikle veri ambarı (DWH) çözümlerinde daha başarılı sonuçlar sunmaktadırlar. Bu tezde öncelikle, kolon bazlı veritabanlarının RDBMS sistemlerinden daha başarılı olup olmadığını inceleyeceğiz. Eğer daha başarılılarsa, ne ölçüde daha iyi performans sunduklarını, hangi koşullarda avantaj sağladıklarını ve en önemlisi, bu üstün performansın temel nedenlerini araştıracağız. İkinci olarak, bu karşılaştırmanın maliyet boyutuna odaklanacağız. Çalışmamız, kolon bazlı veritabanlarının iş dünyasında nasıl uygulanabileceğini de göz önünde bulundurmaktadır. Bu nedenle, maliyetlerini RDBMS sistemleriyle kıyaslayacağız. Performans artışı ile maliyet arasında bir korelasyon olmalıdır; ideal senaryoda, kolon bazlı veritabanları sadece daha iyi performans sunmakla kalmayıp, aynı zamanda RDBMS sistemlerine kıyasla daha düşük maliyetli olmalıdır. Eğer bu mümkünse, en iyi seçenek bu olacaktır. Bir diğer önemli konu ise, gerçek bir veri ambarı (DWH) uygulaması üzerinde inceleme yaparak, teorik sonuçların iş dünyasındaki istisnalar nedeniyle doğrulanmasının zor olduğu durumları anlamaktır. Bu nedenle, Star Schema Benchmark (SSBM) [3] yerine, bir GSM şirketinin boyutsal modelleme (özellikle takımyıldızı/galaksi alt tipi) kullanan veri ambarı üzerinde çalışarak karşılaştırma yapacağız. Anahtar Kelimeler: (Kolon, database, RDBMS, DWH, MPP) Bilim Dalı Sayısal Kodu: 92432
  • Master Thesis
    Toprak Özelliklerini ve İklim Değişikliğini Tahmin Etmek için Derin Öğrenme
    (2025) Çelik, Nurçin; Drias, Yassine
    Toprak, bitki büyümesi için gerekli olan temel besinleri, mineralleri ve elementleri sağlamakla kalmayıp aynı zamanda iklim düzenlemesinde ve daha geniş ekosistem işleyişinde hayati bir rol oynayan temel bir doğal kaynaktır. Bu yüksek lisans tezi, arazi örtüsü, topografya, iklim verileri ve diğer mekansal faktörler gibi temel çevresel değişkenleri entegre ederek Türkiye genelinde Dijital Toprak Haritalama (DSM) uygulamalarında modern Yapay Zeka (AI) metodolojilerinin uygulanmasını iyileştirmeyi amaçlamaktadır. Bu hedefe ulaşmak için, bu değişkenlere dayalı olarak toprak özelliklerini tahmin etme performanslarını değerlendirmek üzere yedi farklı makine öğrenimi modelinin karşılaştırmalı analizi yürütülmüştür.
  • Master Thesis
    E-Ticarette Müşteri-Mağaza Alışverış Davranışı Modeli
    (2025) Güney, Görkem; Çakar, Tuna
    E-ticaretin hızlı gelişimi, işletmelerin müşteri davranışları ve satıcı performansını analiz etmek için ileri düzey analitik modellere ihtiyaç duymasına neden olmuştur. Bu çalışmada, müşteri tercihleri, satın alma alışkanlıkları ve satıcıların ürün tekliflerini birleştiren, 'Müşteri-Satıcı Alışveriş Davranışı Modeli' önerilmiştir. Model, RFM (Recency, Frequency, Monetary), kategori tercihleri ve müşteri yaşam boyu değeri gibi müşteri metrikleri ile satıcıların kategori odağı ve satış performansı verilerini kullanarak segmentasyon ve kişiselleştirilmiş öneriler sunmaktadır. K-Means, hiyerarşik kümeleme ve karar ağacı algoritmaları kullanılarak müşteriler ve satıcılar benzer davranışlara göre gruplandırılmıştır. Ayrıca, müşterilerin satın alma eğilimlerini tahmin etmek ve satıcılar ile eşleştirmek için tahmin modelleri ve hibrit öneri sistemleri uygulanmıştır. Sonuçlar, önerilen modelin müşteri bağlılığını, satıcı performansını ve platformun genel etkinliğini önemli ölçüde artırdığını göstermektedir. Bu çalışma, e-ticaret platformları için veri odaklı, ölçeklenebilir ve dinamik bir analitik çerçeve sunmaktadır.
  • Master Thesis
    Kozmetik E-Ticaretinde Kişiselleştirilmiş Ürün Önerileri için İki Kuleli (Two-Tower) Bir Getirme Yaklaşımı
    (2025) Tuncer, Suat; Çakar, Tuna
    Tavsiye sistemleri, e-ticaret platformlarında kullanıcı deneyimini geliştirmek ve etkileşimi artırmak açısından hayati bir rol oynamaktadır. Bu tez, TensorFlow Recommenders (TFRS) kullanılarak uygulanan geri getirme (retrieval) tabanlı sinir ağı mimarileriyle oluşturulmuş iki kişiselleştirilmiş ürün tavsiye yaklaşımının karşılaştırmalı analizini sunmaktadır. İlk yaklaşım, yalnızca kullanıcı ve ürün kimliklerine (ID) dayalı gömlemeleri (embedding) kullanmaktadır. İkinci model ise ürün temsilini, özellikle ürün başlığı ve üst kategori bilgilerini içeren anlamsal (semantik) içerik özellikleriyle zenginleştirmektedir. Her iki model de örtük satın alma verileriyle eğitilmiş ve en yakın komşu getirimi üzerinden recall@K ölçümünü yapan FactorizedTopK metriği ile değerlendirilmiştir. Çalışma, sıcak başlangıç (warm-start) senaryosu varsayımına dayanmakta ve ürün getirimi için gömleme uzayında anlamsal bağlamın değerine vurgu yapmaktadır. Bulgularımız, özellikle ürünler arasındaki anlamsal benzerliğin önemli olduğu durumlarda, içerik özelliklerinin dahil edilmesinin tavsiye doğruluğunu artırmada fayda sağladığını ortaya koymaktadır.
  • Master Thesis
    Fraud detection and prediction with machine learning applications
    (MEF Üniversitesi, 2023) Sayar, Alperen; Çakar, Tuna
    Bu çalışmanın temel amacı, faktoring sektöründe faaliyet gösteren bir şirketin müşterilerinin işlemleri üzerindeki dolandırıcılık faaliyetlerini tespit etmek ve buna bağlı olarak müşterilerin geçmiş işlem ve bağlantı verilerine dayalı keşifsel veri analizi ile ölçülebilir parametreler yakalamaktır. ve ardından hedef için tahmine dayalı modeller gerçekleştirmek. Sınıflandırma modeli algoritmaları olan XGBoost ve CATBoost modellerinde %79 civarında isabet oranı elde edilmiştir. Bu sayede dolandırıcılık yapma potansiyeli yüksek müşteri tespit edildikten sonra daha etkin, verimli ve doğru bir yaklaşımla hareket edilerek işlem bazında dolandırıcılık faaliyetlerinin doğrudan tespit edilmesi amaçlanmaktadır.