Customer churn prediction for a personal care product retail chain operating in Turkey

Loading...
Thumbnail Image

Date

2024

Journal Title

Journal ISSN

Volume Title

Publisher

MEF Üniversitesi

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Müşteri kaybının nedenlerini ve buna yol açan müşteri davranışlarını anlamak, ayrıca müşterinin bir sektöre veya şirkete olan sadakatini tahmin edebilmek, mevcut müşterileri elde tutmada ve yeni müşterilere ulaşmak için yapılan pazarlama ve reklam maliyetlerinden kaynaklanan gelir kaybını önlemede büyük avantaj sağlar. Bu çalışmada, Türkiye'de faaliyet gösteren bir kişisel bakım ürünleri perakende zincirine ait 29 aylık veri kullanılmış; veri setindeki dengesiz dağılım ve müşteri olmayan girişler nedeniyle aşırı örnekleme ve sentetik örnekleme yöntemleri uygulanmıştır. Model geliştirme aşamasında Lojistik Regresyon, Karar Ağacı, K-En Yakın Komşu, Rassal Orman, Ekstra Ağaç Sınıflandırıcı, MLP (Çok Katmanlı Algılayıcı) Sınıflandırıcı uygulanmış ve doğruluk, geri çağırma, F1 skoru, kesinlik ve karmaşıklık matrisi gibi metrikler kullanılarak performansları değerlendirilmiştir. Bu karşılaştırmalar sonucunda, Rassal Orman ve MLP Sınıflandırıcı modellerinin bu veri seti için en iyi performansı gösterdiği gözlemlenmiş; Ekstra Ağaç Sınıflandırıcı ve Karar Ağacı gibi diğer ağaç tabanlı algoritmaların ise biraz daha düşük fakat karşılaştırılabilir performans sağladığı tespit edilmiştir.
Understanding the reasons for customer loss and the customer behaviors leading to it, as well as being able to predict customer's loyalty to an industry or a company provides enormous advantages in retaining existing customers and avoiding revenue loss due to the marketing and advertising costs associated with attracting new customers. In this study, the 29-month data from a personal care product retail chain operating in Turkey was used, and because of the imbalanced values and non-customer entries of the dataset, the oversampling method and synthetic sampling was applied. During the model development phase, Logistic Regression, Decision Tree, K-Nearest Neighbors, Random Forest, Extra Trees Classifier, and MLP (Multi-Layer Perceptron) Classifier were applied, and their performances were evaluated using metrics such as accuracy, recall, F1-score, precision, and confusion matrix. Based on these comparisons, it was observed that the Random Forest and MLP Classifier models demonstrated the best performances for this dataset, while other tree-based algorithms, such as the Extra Trees Classifier and Decision Tree, achieved slightly lower but comparable performance.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

1

End Page

55

Collections

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

1

NO POVERTY
NO POVERTY Logo

3

GOOD HEALTH AND WELL-BEING
GOOD HEALTH AND WELL-BEING Logo

5

GENDER EQUALITY
GENDER EQUALITY Logo

10

REDUCED INEQUALITIES
REDUCED INEQUALITIES Logo

16

PEACE, JUSTICE AND STRONG INSTITUTIONS
PEACE, JUSTICE AND STRONG INSTITUTIONS Logo