A Comprasion of Ensemble Learning Methods in Retail Sales Forecasting

dc.contributor.advisor Güney, Evren
dc.contributor.author Süer, Serhan
dc.date.accessioned 2019-11-12T13:42:05Z
dc.date.available 2019-11-12T13:42:05Z
dc.date.issued 2019
dc.description.abstract Forecasting has always been an essential skill which companies try to have and implement in various areas. Sales forecasting is one of the major usage areas of forecasting which is used in almost all sectors. This study refers to forecasting sales of Walmart Stores based on several features such as store id, department id, date, and store size. Walmart sales data which was used in this study contains information of stores between 2010 and 2012. At the beginning of the study, the introduction of the dataset and exploratory data analysis were made to identify dependent/independent variables and their characteristics. To apply machine learning algorithms, data preprocessing methods such as missing value treatment, outlier treatment, and feature selection was applied. Ensemble learning methods in machine learning algorithms were applied in the modeling stage. These methods were addressed in three parts such as Bootstrap Aggregation, Boosting, and Stacked Generalization and these parts consist of six different algorithms in total. The models were compared based on four regression metrics as Root Mean Square Error, Mean Absolute Error, R-Squared, and runtime. After selecting the main metric which models were evaluated, cross-validation was applied to achieve unbiased estimates. Finally, parameters of the model which have the highest score in cross-validation were tuned in the hyperparameter optimization stage and a machine learning model which can be used in forecasting sales of Walmart stores and its success score were obtained.
dc.description.abstract Tahminleme her zaman şirketlerin sahip olmaya çalıştığı ve birçok alanda uygulanan önemli bir beceri olmuştur. Satış tahminlemesi ise neredeyse bütün sektörlerde kullanılan tahminlemenin en büyük kullanım alanlarından biridir. Bu çalışma, Walmart mağazalarının mağaza numarası, reyon numarası, tarih, ve mağaza büyüklüğü gibi özellikler üzerinden satış tahminlemesinin yapılması ile ilgilidir. Bu çalışmada kullanılan Walmart satış verisi, 2010 ve 2012 yılları arasındaki mağaza bilgilerini içerir. Çalışmanın başlangıcında bağımlı ve bağımsız değişkenlerinin özelliklerinin belirlenmesi için veri setinin tanıtılması ve keşifçi veri analizi yapılmıştır. Makine Öğrenmesi algoritmalarının uygulanabilmesi için kayıp veri iyileştirmesi, aykırı verilerin işlenmesi ve özellik seçimi gibi veri önişleme yöntemleri kullanıldı. Modelleme aşamasında makine öğrenmesi algoritmaları içinde bulunan Topluluk Öğrenme Yöntemleri uygulandı. Bu yöntemler, Torbalama, Yükseltme, ve İstifli Genelleştirme olarak üç farklı kısımda ele alındı ve toplamda altı farklı algoritma içerecek şekilde hazırlandı. Modeller, Hataların Ortalama Karekökü, Hataların Mutlak Ortalaması, R-Kare ve süre olmak üzere dört metriğe göre karşılaştırıldı. Modellerin değerlendirileceği temel regresyon metriğinin seçiminin ardından tarafsız tahminler elde etmek için çaprazdoğrulama tekniği uygulandı. Son olarak, parametre eniyileme aşamasında en yüksek sonucu veren modelin parametreleri ayarlandı ve Walmart mağaza satışlarını tahminlemekte kullanılabilecek makine öğrenmesi modeli ve modelin başarı oranı elde edilmiş olundu.
dc.identifier.citation Süer, S. (2019). A comprasion of ensemble learning methods in retail sales forecasting, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
dc.identifier.uri https://hdl.handle.net/20.500.11779/1218
dc.language.iso en
dc.publisher MEF Üniversitesi, Fen Bilimleri Enstitüsü
dc.rights info:eu-repo/semantics/openAccess
dc.subject Retail Sales Forecasting
dc.subject Regression
dc.subject Exploratory Data Analysis
dc.subject Ensemble Learning Methods
dc.subject Perakende Satış Tahmini
dc.subject Regresyon
dc.subject Keşifçi Veri Analizi
dc.subject Topluluk Yöntemleri
dc.title A Comprasion of Ensemble Learning Methods in Retail Sales Forecasting
dc.title.alternative Perakende satış tahminlemesinde topluluk öğrenme metodlarının karşılaştırması
dc.type Master's Degree Project
dspace.entity.type Publication
gdc.author.institutional Süer, Serhan
gdc.author.institutional Güney, Evren
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department Lisansüstü Eğitim Enstitüsü, Büyük Veri Analitiği Yüksek Lisans Programı
gdc.description.publicationcategory YL-Bitirme Projesi
gdc.description.scopusquality N/A
gdc.description.wosquality N/A
relation.isAuthorOfPublication 6cd6fa8d-207e-4ab4-a977-c3a42684f2d1
relation.isAuthorOfPublication.latestForDiscovery 6cd6fa8d-207e-4ab4-a977-c3a42684f2d1
relation.isOrgUnitOfPublication 636850bf-e58c-4b59-bcf0-fa7418bb7977
relation.isOrgUnitOfPublication 0d54cd31-4133-46d5-b5cc-280b2c077ac3
relation.isOrgUnitOfPublication a6e60d5c-b0c7-474a-b49b-284dc710c078
relation.isOrgUnitOfPublication.latestForDiscovery 636850bf-e58c-4b59-bcf0-fa7418bb7977

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
SerhanSüer.pdf
Size:
1.12 MB
Format:
Adobe Portable Document Format
Description:
YL-Proje Dosyası

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
0 B
Format:
Item-specific license agreed upon to submission
Description: