Predicting Yelp Stars Based on Business Attributes

dc.contributor.advisor Arısoy Saraçlar, Ebru
dc.contributor.author Tek, Ahmet
dc.date.accessioned 2019-11-12T13:42:02Z
dc.date.available 2019-11-12T13:42:02Z
dc.date.issued 2018
dc.description.abstract Yelp is a business review website where consumers can comment on a business from their point of view. This allows other consumers to have prior knowledge of the business. Whenever we search something we try and hope to get the most relevant results, and recommender systems can achieve this. Review websites, such as Yelp and TripAdvisor allow users to post online reviews for various businesses, products and services and have been recently shown to have a significant influence on consumer shopping behavior [1]. This paper aims to predict restaurant ratings using their attributes such as alcohol, noise level, Wifi, music, a smoking area and to find the most important attributes for higher ratings. Yelp dataset has lots of information about businesses and consumer behaviors and it is free for academic usage. For these reasons, Yelp dataset has been selected in this project. Machine Learning models have been executed for two-star label classification. Since we aim to find the most important features for a higher rating we only choose 4 and 5-star labels from the dataset. In our research, restaurant rating prediction is implemented as binary-class classification where the class labels are the star ratings. Restaurant attributes are the input features of the classifier. We will investigate Decision Trees, Naive Bayes Classifier, Two-Class Decision Forest, Two-Class Boosted Decision Trees, TwoClass Neural Network, Two-Class Support Vector Machine, Two-Class Logistic Regression and choose the most important 10 attributes resulting in high ratings.
dc.description.abstract Yelp bir işletme inceleme ve yorumlama sitesidir. Tüketici, bir işletmeyi kendi bakış açısıyla yorumlayabilir. Bu durum diğer tüketicilerin işletmeler hakkında önceden bilgi sahibi olmasını sağlar. İnternetten bir şey aradığımız zaman, aradığımız nesneyle ilgili en yakın sonuçları elde etmeyi umarız ve günümüzde tavsiye sistemleri bunu başarabilir. Yelp, TripAdvisor gibi web siteleri, kullanıcılara işletmeler, ürünler ve kullandıkları servisler hakkında çevrimiçi yorum yapmaya izin vermektedir. Araştırmalar, bu durumun tüm tüketicilerin alışveriş yapma davranışı üzerinde önemli bir etkiye sahip olduğunu ortaya koymaktadır [1]. Bu makale, alkol, gürültü seviyesi, Wifi, müzik, sigara içme alanı gibi işletmenin özelliklerini kullanarak restorana verilen puanları öngörmeyi ve daha yüksek puan için en önemli özellikleri bulmayı amaçlamaktadır. Yelp, bizlere büyük bir veri seti sağlamaktadır. Ayrıca işletmeler ve müşteriler hakkında bir çok bilgiyi içermekte ve akademik alan için ücretsiz kullanım sağlamaktadır. Bu nedenlerden dolayı, bu projede Yelp veri kümesi seçilmiştir. Projedeki makine öğrenmesi modelleri iki-yıldız etiketli sınıflandırma için çalıştırılmıştır. Yüksek yıldız etiketleri için en önemli restoran özelliklerini bulmaya amaçladığımızdan, datasetinde yalnızca 4 ve 5 yıldızlı etiketleri seçmeyi tercih ediyoruz. Araştırmamızda, restoran derecelendirme tahminlemesi, yıldızların etiket olarak kullanıldığı iki sınıflı bir sınıflandırma problem olarak ele alınmıştır. Restoran özellikleri, sınıflandırma modelleri için girdi olarak kullanılmıştır. Makalede Karar Ağaçları, Naïve Bayes Sınıflandırma, İki Sınıflı Decision Forest, İki Sınıflı Boosted Decision Trees, İki Sınıflı Neural Network, İki Sınıflı Support Vector Machine ve İki Sınıflı Logistic Regression algoritmaları üzerinde çalışılacaktır ve yüksek yıldız derecesi sağlayan en önemli 10 özellik seçilecektir.
dc.identifier.citation Tek, A. (2018). Predicting yelp stars based on business attributes, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
dc.identifier.uri https://hdl.handle.net/20.500.11779/1192
dc.language.iso en
dc.publisher MEF Üniversitesi, Fen Bilimleri Enstitüsü
dc.rights info:eu-repo/semantics/openAccess
dc.subject Content-Based Filtering
dc.subject Yelp
dc.subject Restaurant Reviews
dc.subject İçerik Tabanlı Filtreleme
dc.subject Restoran Değerlendirme
dc.title Predicting Yelp Stars Based on Business Attributes
dc.type Master's Degree Project
dspace.entity.type Publication
gdc.author.institutional Tek, Ahmet
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department Lisansüstü Eğitim Enstitüsü, Büyük Veri Analitiği Yüksek Lisans Programı
gdc.description.publicationcategory YL-Bitirme Projesi
gdc.publishedmonth N/A
gdc.virtual.author Arısoy Saraçlar, Ebru
relation.isAuthorOfPublication 0b895153-5793-4e46-bc2f-06a28b30f531
relation.isAuthorOfPublication.latestForDiscovery 0b895153-5793-4e46-bc2f-06a28b30f531
relation.isOrgUnitOfPublication de19334f-6a5b-4f7b-9410-9433c48d1e5a
relation.isOrgUnitOfPublication 0d54cd31-4133-46d5-b5cc-280b2c077ac3
relation.isOrgUnitOfPublication a6e60d5c-b0c7-474a-b49b-284dc710c078
relation.isOrgUnitOfPublication.latestForDiscovery de19334f-6a5b-4f7b-9410-9433c48d1e5a

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
AhmetTek.pdf
Size:
440.71 KB
Format:
Adobe Portable Document Format
Description:
YL-Proje Dosyası

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
0 B
Format:
Item-specific license agreed upon to submission
Description: