Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11779/1214
Title: Football player profiling using opta match event data: hierarchical clustering
Other Titles: Opta maç verisi kullanarak futbolcu profillme: hiyerarşik kümeleme
Authors: Kalenderoğlu, Uğurcan
Advisors: Koç, Utku
Keywords: Unsupervised Learning
Hierarchical Clustering
Football Data Analysis
Player Profiling
Güdümsüz Öğrenme
Hiyerarşik Kümeleme
Futbol Veri Analitiği
Oyuncu Profilleme
Publisher: MEF Üniversitesi, Fen Bilimleri Enstitüsü
Source: Kalenderoğlu, U. (2019). Football player profiling using opta match event data: hierarchical clustering, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
Abstract: Increasing popularity of data analytics has impacted the sport industry. Dimension of available data and best practices on the usage of data analytics increased as a result of this trend. Player profiling is one of emerging hot topics among those, especially in football. On the other hand, income and expense balance of transfers has been biggest burden on clubs’ financials while it should be reverse. Scouting processes are currently dominated by bilateral relations and intuitive comments of scouting staff. It is an important step to transform into data driven decision framework to overcome this situation. It is crucial to replace a player who leave the team with someone who has potential and very close playing style. Player profiling is the first step to do this. The data set used in this project is obtained from Opta – a sport focused data company – and contains all actions performed on-ball at player level from Turkish Super League, English Premier League and German Bundesliga in three seasons between 2015 and 2018. Principal component analysis is applied to the dataset in order to reduce dimensionality to the 15 features which consists of 2469 players and 271 features at the beginning. As a result of this study, it is observed that there are twelve different player clusters within the traditional main positions; three for defenders, four for midfielders and five for forwards. Clubs can enrich and benefit from these clusters in three ways: 1) evaluation of a player style over a period of time and detecting the best role fit 2) analyzing the effect of cluster combination to decide which line-up yields better team results 3) finding the closest match to a player who is subject to replacement.
Veri analitiğinin her alana hükmetmesiyle beraber futbolda da hem toplanan verinin boyutu hem de veri temelli yapılan iyi örneklerin sayısı artmaktadır. Futbolcu profilleme de bu alanlardan en revaçta olanlarından biridir. Kulüplerin finansal sağlığını koruması için transfer gelir gider dengesi en önemli kalem iken; genelde, izlenen yanlış transfer politikaları sonucu en büyük zarar kaynağı olarak dikkat çekmektedir. Bu alanda atılacak en önemli adımlardan biri ise şimdiye kadar geleneksel ve kişisel ilişkiler üzerinden gelişen futbolcu keşif süreçlerinin veri analitiğinden beslenen bir sürece evrilmesi olacaktır. Özellikle takımdan ayrılan bir yeteneğin yerine hem potansiyeli yüksek hem de oldukça benzer oyun stiline sahip adaylar bulmak için futbolcu profilleme doğru bir başlangıç adımı olacaktır. Bu projede, Opta ismindeki spor odaklı veri şirketinin 20152018 arasındaki üç sezonda Türkiye Süper Ligi, Almanya Bundesliga ve İngiltere Premier Ligi’ni kapsayan ve topla yapılan tüm hamleleri içeren veri seti kullanılmıştır. 2469 futbolcunun oynadığı tüm maçları içeren ve 271 öznitelik bulunan veri seti, temel bileşen analizi kullanılarak 15 özniteliğe indirgenip hiyerarşik kümeleme algoritması kullanılmıştır. Çalışma sonucunda, ana pozisyonlardaki farklı oyun stillerini temsilen; defans için üç, orta saha için dört, forvet içinse beş olmak üzere toplamda on iki farklı oyuncu kümesi olduğu gözlenmiştir. Kulüpler bu kümelerden üç farklı şekilde faydalanabilir: 1) mevcut oyuncunun yıllar içinde evrildiği roller ve oyuncuya en uygun rolün tespiti 2) farklı oyuncu küme kombinasyonlarının maç sonuçlarına etki analizi sonucu en verimli ilk on birin belirlenmesi 3) transfere konu oyuncuya stil veya rol olarak en yakın adayın bulunması.
URI: https://hdl.handle.net/20.500.11779/1214
Appears in Collections:FBE, Yüksek Lisans, Proje Koleksiyonu

Files in This Item:
File Description SizeFormat 
UğurcanKalenderoğlu.pdfYL-Proje Dosyası789.64 kBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.