Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11779/1177
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorKoç, Utku-
dc.contributor.authorGürkan, Cem Kaya-
dc.date.accessioned2019-11-12T13:42:01Z
dc.date.available2019-11-12T13:42:01Z
dc.date.issued2018-
dc.identifier.citationGürkan, CK. (2018). Sms spam detection in Turkish language, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiyeen_US
dc.identifier.urihttps://hdl.handle.net/20.500.11779/1177-
dc.description.abstractShort message (SMS) is one of the most common communication methods. The growth of mobile phone users has led to a dramatic increase in using short messages. With the increasing number of mobile phone users, mobile phone users have started receiving unsolicited text messages. The use of SMS as a spam tool after the e-mail is due to a direct access to customer and high reversion to the users. These unsolicited short messages are disturbing the users even content intended for deceiving or defrauding (phishing). Up to date, all of the research carried out on SMS Spam detection was focused on the English language. In this study, Turkish datasets tagged with spam information is introduced and existing methods for English are applied to these datasets. The SMS dataset used in this study is gathered from different people and all messages are tagged according to whether they are spam or not. Naïve Bayes, Logistic Regression, SGD, SVM and Random Forest classification algorithms are tested with three feature extraction methods and a number of performance measures are evaluated. The evaluation resulted in a f-measure of 96.4% for SVM classification algorithm with TF-IDF (Term Frequency-Inverse Document Frequency) extraction method.en_US
dc.description.abstractSMS en çok kullanılan iletişim yöntemlerimden biridir. Mobil telefon kullanımı artmasıyla kısa mesaj kullanımını da artmıştır. Mobil telefon kullanımın artmasıyla mobil kullanıcılar da izinsiz olarak kısa mesaj (reklam, kumar vs.) almaya başlamışlardır. Epostadan sonra kısa mesajın da izinsiz iletişim yöntemi olarak kullanılmasının amacı kullanıcılara direk erişim ve geri dönüşün yüksek olmasıdır. İzinsiz gönderilen kısa mesajlar kullanıcıları rahatsız etmekte hatta kandırmaya veya dolandırmaya yönelik içerik barındırmaktadır. Günümüze kadar izinsiz SMS algılama yöntemleri, genelde İngilizce üzerine yoğunlaşmıştır. Bu çalışma kapsamında izinsiz SMS algılama için Türkçe veri seti oluşturulmuş ve daha önce İngilizce’ de yapılmış çalışmalarda denenen yöntemlerin Türkçe’ de gösterdikleri başarılar incelenmiştir. Çalışmada kullanılan SMS veri seti için gönüllü kişilerden gönderilen veya alınan mesajlar toplanmış ve mesajlar istenmeyen olup olmadığına göre işaretlenmiştir. Naïve Bayes, Logistic Regression, SGD, SVM ve Random Forest sınıflandırma algoritmaları 3 farklı özellik çıkarma yöntemiyle test edilmiş ve farklı performans ölçümleme skorları çıkarılmıştır. Sonuçta en iyi performans %96,4 F1-skoru ile TF-IDF özellik çıkarma metoduyla SVM sınıflandırma algoritması kullanıldığında ölçümlenmiştir.en_US
dc.language.isoenen_US
dc.publisherMEF Üniversitesi, Fen Bilimleri Enstitüsüen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectSMS Spam Filteringen_US
dc.subjectText Classificationen_US
dc.subjectTurkish SMSen_US
dc.subjectNaïve Bayesen_US
dc.subjectLogistic Regressionen_US
dc.subjectSGDen_US
dc.subjectSVMen_US
dc.subjectRandom Foresten_US
dc.subjectKısa Mesajen_US
dc.subjectİzinsiz Mesaj Filtrelemeen_US
dc.subjectTürkçe Metin Sınıflandırmaen_US
dc.subjectTürkçe SMSen_US
dc.titleSms spam detection in Turkish languageen_US
dc.typeMaster's Degree Projecten_US
dc.relation.publicationcategoryYL-Bitirme Projesien_US
dc.departmentBüyük Veri Analitigi Yüksek Lisans Programıen_US
dc.institutionauthorGürkan, Cem Kaya-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.grantfulltextopen-
item.languageiso639-1en-
item.cerifentitytypePublications-
item.fulltextWith Fulltext-
item.openairetypeMaster's Degree Project-
Appears in Collections:FBE, Yüksek Lisans, Proje Koleksiyonu
Files in This Item:
File Description SizeFormat 
CemKayaGürkan.pdforgınal3.07 MBAdobe PDFThumbnail
View/Open
Show simple item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.