Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11779/1192
Title: Predicting yelp stars based on business attributes
Authors: Tek, Ahmet
Advisors: Arısoy Saraçlar, Ebru
Keywords: Content-Based Filtering
Yelp
Restaurant Reviews
İçerik Tabanlı Filtreleme
Restoran Değerlendirme
Publisher: MEF Üniversitesi, Fen Bilimleri Enstitüsü
Source: Tek, A. (2018). Predicting yelp stars based on business attributes, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
Abstract: Yelp is a business review website where consumers can comment on a business from their point of view. This allows other consumers to have prior knowledge of the business. Whenever we search something we try and hope to get the most relevant results, and recommender systems can achieve this. Review websites, such as Yelp and TripAdvisor allow users to post online reviews for various businesses, products and services and have been recently shown to have a significant influence on consumer shopping behavior [1]. This paper aims to predict restaurant ratings using their attributes such as alcohol, noise level, Wifi, music, a smoking area and to find the most important attributes for higher ratings. Yelp dataset has lots of information about businesses and consumer behaviors and it is free for academic usage. For these reasons, Yelp dataset has been selected in this project. Machine Learning models have been executed for two-star label classification. Since we aim to find the most important features for a higher rating we only choose 4 and 5-star labels from the dataset. In our research, restaurant rating prediction is implemented as binary-class classification where the class labels are the star ratings. Restaurant attributes are the input features of the classifier. We will investigate Decision Trees, Naive Bayes Classifier, Two-Class Decision Forest, Two-Class Boosted Decision Trees, TwoClass Neural Network, Two-Class Support Vector Machine, Two-Class Logistic Regression and choose the most important 10 attributes resulting in high ratings.
Yelp bir işletme inceleme ve yorumlama sitesidir. Tüketici, bir işletmeyi kendi bakış açısıyla yorumlayabilir. Bu durum diğer tüketicilerin işletmeler hakkında önceden bilgi sahibi olmasını sağlar. İnternetten bir şey aradığımız zaman, aradığımız nesneyle ilgili en yakın sonuçları elde etmeyi umarız ve günümüzde tavsiye sistemleri bunu başarabilir. Yelp, TripAdvisor gibi web siteleri, kullanıcılara işletmeler, ürünler ve kullandıkları servisler hakkında çevrimiçi yorum yapmaya izin vermektedir. Araştırmalar, bu durumun tüm tüketicilerin alışveriş yapma davranışı üzerinde önemli bir etkiye sahip olduğunu ortaya koymaktadır [1]. Bu makale, alkol, gürültü seviyesi, Wifi, müzik, sigara içme alanı gibi işletmenin özelliklerini kullanarak restorana verilen puanları öngörmeyi ve daha yüksek puan için en önemli özellikleri bulmayı amaçlamaktadır. Yelp, bizlere büyük bir veri seti sağlamaktadır. Ayrıca işletmeler ve müşteriler hakkında bir çok bilgiyi içermekte ve akademik alan için ücretsiz kullanım sağlamaktadır. Bu nedenlerden dolayı, bu projede Yelp veri kümesi seçilmiştir. Projedeki makine öğrenmesi modelleri iki-yıldız etiketli sınıflandırma için çalıştırılmıştır. Yüksek yıldız etiketleri için en önemli restoran özelliklerini bulmaya amaçladığımızdan, datasetinde yalnızca 4 ve 5 yıldızlı etiketleri seçmeyi tercih ediyoruz. Araştırmamızda, restoran derecelendirme tahminlemesi, yıldızların etiket olarak kullanıldığı iki sınıflı bir sınıflandırma problem olarak ele alınmıştır. Restoran özellikleri, sınıflandırma modelleri için girdi olarak kullanılmıştır. Makalede Karar Ağaçları, Naïve Bayes Sınıflandırma, İki Sınıflı Decision Forest, İki Sınıflı Boosted Decision Trees, İki Sınıflı Neural Network, İki Sınıflı Support Vector Machine ve İki Sınıflı Logistic Regression algoritmaları üzerinde çalışılacaktır ve yüksek yıldız derecesi sağlayan en önemli 10 özellik seçilecektir.
URI: https://hdl.handle.net/20.500.11779/1192
Appears in Collections:FBE, Yüksek Lisans, Proje Koleksiyonu

Files in This Item:
File Description SizeFormat 
AhmetTek.pdfYL-Proje Dosyası440.71 kBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Page view(s)

2
checked on Jun 26, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.