Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11779/1218
Title: A comprasion of ensemble learning methods in retail sales forecasting
Other Titles: Perakende satış tahminlemesinde topluluk öğrenme metodlarının karşılaştırması
Authors: Süer, Serhan
Advisors: Güney, Evren
Keywords: Retail Sales Forecasting
Regression
Exploratory Data Analysis
Ensemble Learning Methods
Perakende Satış Tahmini
Regresyon
Keşifçi Veri Analizi
Topluluk Yöntemleri
Publisher: MEF Üniversitesi, Fen Bilimleri Enstitüsü
Source: Süer, S. (2019). A comprasion of ensemble learning methods in retail sales forecasting, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
Abstract: Forecasting has always been an essential skill which companies try to have and implement in various areas. Sales forecasting is one of the major usage areas of forecasting which is used in almost all sectors. This study refers to forecasting sales of Walmart Stores based on several features such as store id, department id, date, and store size. Walmart sales data which was used in this study contains information of stores between 2010 and 2012. At the beginning of the study, the introduction of the dataset and exploratory data analysis were made to identify dependent/independent variables and their characteristics. To apply machine learning algorithms, data preprocessing methods such as missing value treatment, outlier treatment, and feature selection was applied. Ensemble learning methods in machine learning algorithms were applied in the modeling stage. These methods were addressed in three parts such as Bootstrap Aggregation, Boosting, and Stacked Generalization and these parts consist of six different algorithms in total. The models were compared based on four regression metrics as Root Mean Square Error, Mean Absolute Error, R-Squared, and runtime. After selecting the main metric which models were evaluated, cross-validation was applied to achieve unbiased estimates. Finally, parameters of the model which have the highest score in cross-validation were tuned in the hyperparameter optimization stage and a machine learning model which can be used in forecasting sales of Walmart stores and its success score were obtained.
Tahminleme her zaman şirketlerin sahip olmaya çalıştığı ve birçok alanda uygulanan önemli bir beceri olmuştur. Satış tahminlemesi ise neredeyse bütün sektörlerde kullanılan tahminlemenin en büyük kullanım alanlarından biridir. Bu çalışma, Walmart mağazalarının mağaza numarası, reyon numarası, tarih, ve mağaza büyüklüğü gibi özellikler üzerinden satış tahminlemesinin yapılması ile ilgilidir. Bu çalışmada kullanılan Walmart satış verisi, 2010 ve 2012 yılları arasındaki mağaza bilgilerini içerir. Çalışmanın başlangıcında bağımlı ve bağımsız değişkenlerinin özelliklerinin belirlenmesi için veri setinin tanıtılması ve keşifçi veri analizi yapılmıştır. Makine Öğrenmesi algoritmalarının uygulanabilmesi için kayıp veri iyileştirmesi, aykırı verilerin işlenmesi ve özellik seçimi gibi veri önişleme yöntemleri kullanıldı. Modelleme aşamasında makine öğrenmesi algoritmaları içinde bulunan Topluluk Öğrenme Yöntemleri uygulandı. Bu yöntemler, Torbalama, Yükseltme, ve İstifli Genelleştirme olarak üç farklı kısımda ele alındı ve toplamda altı farklı algoritma içerecek şekilde hazırlandı. Modeller, Hataların Ortalama Karekökü, Hataların Mutlak Ortalaması, R-Kare ve süre olmak üzere dört metriğe göre karşılaştırıldı. Modellerin değerlendirileceği temel regresyon metriğinin seçiminin ardından tarafsız tahminler elde etmek için çaprazdoğrulama tekniği uygulandı. Son olarak, parametre eniyileme aşamasında en yüksek sonucu veren modelin parametreleri ayarlandı ve Walmart mağaza satışlarını tahminlemekte kullanılabilecek makine öğrenmesi modeli ve modelin başarı oranı elde edilmiş olundu.
URI: https://hdl.handle.net/20.500.11779/1218
Appears in Collections:FBE, Yüksek Lisans, Proje Koleksiyonu

Files in This Item:
File Description SizeFormat 
SerhanSüer.pdfYL-Proje Dosyası1.15 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.