Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.11779/1169
Title: | Text Classification Using Apache Spark | Other Titles: | Apache Spark İle metin Sınıflandırma | Authors: | Azizoğlu, Umut Rezan | Advisors: | Özlük, Özgür | Keywords: | Text Classification Sentiment Analysis Apache Spark Python (Pyspark) Databricks Metin Kategorileştirme Sentiment Analizi |
Publisher: | MEF Üniversitesi, Fen Bilimleri Enstitüsü | Source: | Azizoğlu, UR. (2018). Text classification using apache spark, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye | Abstract: | One of the biggest problems of enterprises which are marketplace e-commerce business model with social platform; The improper communication of their social platform is the negative impact of the customer experience and the damage of the brand's value both materially and morally. As the number of daily commentaries is in numbers that cannot be read manually with optimal human resources in terms of company profitability, the interpretation modules in social market places are left unconscious. With this Project; established a model that prevents sentences that spoil the customer experience in their social platforms. Both data preparation and machine learning model were developed on Databricks notebook, using the apache spark platform with SparkML libraries and Pyspark language. The “Text Classification” approach is adopted when determining the model. Sosyal platformu bulunan,elektronik pazar yeri iş modeliyle çalışan girişimlerin, en büyük problemlerinden biri; sosyal mecralarında ki uygunsuz yorumların, müşteri deneyimini olumsuz etki etmesi ve girişimin marka değerinin hem maddi hem manevi zarar görmesidir. Günlük yorum sayılarının şirket karlılığı açısından, optimal insan kaynağı ile manuel olarak okunamayacak sayılarda olması nedeniyle çoğunlukla sosyal pazar yerlerinde ki yorumlaşma modülleri deyim yerindeyse başıboş bırakılmaktadır. Bu Proje ile; bu durumu çözmek amacıyla girişimlerin sosyal mecralarında müşteri deneyimini bozan cümleleri engelleyen bir model geliştirilmiştir. Hem mevcut datanın hazırlığı, hem de Makine öğrenmesi modeli; databricks notebook kullanılarak, Apache Spark üzerinden Python(Pyspark) dili ile sparkml kütüphaneleri kullanılarak geliştirilmiştir. Model belirlenirken metin sınıflandırma yaklaşımı benimsenmiştir. |
URI: | https://hdl.handle.net/20.500.11779/1169 |
Appears in Collections: | FBE, Yüksek Lisans, Proje Koleksiyonu |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Umut Rezan Azizoğlu.pdf | YL-Proje Dosyası | 623.04 kB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
28
checked on Nov 18, 2024
Download(s)
12
checked on Nov 18, 2024
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.