Football Player Profiling Using Opta Match Event Data: Hierarchical Clustering

dc.contributor.advisor Koç, Utku
dc.contributor.author Kalenderoğlu, Uğurcan
dc.date.accessioned 2019-11-12T13:42:05Z
dc.date.available 2019-11-12T13:42:05Z
dc.date.issued 2019
dc.description.abstract Increasing popularity of data analytics has impacted the sport industry. Dimension of available data and best practices on the usage of data analytics increased as a result of this trend. Player profiling is one of emerging hot topics among those, especially in football. On the other hand, income and expense balance of transfers has been biggest burden on clubs’ financials while it should be reverse. Scouting processes are currently dominated by bilateral relations and intuitive comments of scouting staff. It is an important step to transform into data driven decision framework to overcome this situation. It is crucial to replace a player who leave the team with someone who has potential and very close playing style. Player profiling is the first step to do this. The data set used in this project is obtained from Opta – a sport focused data company – and contains all actions performed on-ball at player level from Turkish Super League, English Premier League and German Bundesliga in three seasons between 2015 and 2018. Principal component analysis is applied to the dataset in order to reduce dimensionality to the 15 features which consists of 2469 players and 271 features at the beginning. As a result of this study, it is observed that there are twelve different player clusters within the traditional main positions; three for defenders, four for midfielders and five for forwards. Clubs can enrich and benefit from these clusters in three ways: 1) evaluation of a player style over a period of time and detecting the best role fit 2) analyzing the effect of cluster combination to decide which line-up yields better team results 3) finding the closest match to a player who is subject to replacement.
dc.description.abstract Veri analitiğinin her alana hükmetmesiyle beraber futbolda da hem toplanan verinin boyutu hem de veri temelli yapılan iyi örneklerin sayısı artmaktadır. Futbolcu profilleme de bu alanlardan en revaçta olanlarından biridir. Kulüplerin finansal sağlığını koruması için transfer gelir gider dengesi en önemli kalem iken; genelde, izlenen yanlış transfer politikaları sonucu en büyük zarar kaynağı olarak dikkat çekmektedir. Bu alanda atılacak en önemli adımlardan biri ise şimdiye kadar geleneksel ve kişisel ilişkiler üzerinden gelişen futbolcu keşif süreçlerinin veri analitiğinden beslenen bir sürece evrilmesi olacaktır. Özellikle takımdan ayrılan bir yeteneğin yerine hem potansiyeli yüksek hem de oldukça benzer oyun stiline sahip adaylar bulmak için futbolcu profilleme doğru bir başlangıç adımı olacaktır. Bu projede, Opta ismindeki spor odaklı veri şirketinin 20152018 arasındaki üç sezonda Türkiye Süper Ligi, Almanya Bundesliga ve İngiltere Premier Ligi’ni kapsayan ve topla yapılan tüm hamleleri içeren veri seti kullanılmıştır. 2469 futbolcunun oynadığı tüm maçları içeren ve 271 öznitelik bulunan veri seti, temel bileşen analizi kullanılarak 15 özniteliğe indirgenip hiyerarşik kümeleme algoritması kullanılmıştır. Çalışma sonucunda, ana pozisyonlardaki farklı oyun stillerini temsilen; defans için üç, orta saha için dört, forvet içinse beş olmak üzere toplamda on iki farklı oyuncu kümesi olduğu gözlenmiştir. Kulüpler bu kümelerden üç farklı şekilde faydalanabilir: 1) mevcut oyuncunun yıllar içinde evrildiği roller ve oyuncuya en uygun rolün tespiti 2) farklı oyuncu küme kombinasyonlarının maç sonuçlarına etki analizi sonucu en verimli ilk on birin belirlenmesi 3) transfere konu oyuncuya stil veya rol olarak en yakın adayın bulunması.
dc.identifier.citation Kalenderoğlu, U. (2019). Football player profiling using opta match event data: hierarchical clustering, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
dc.identifier.uri https://hdl.handle.net/20.500.11779/1214
dc.language.iso en
dc.publisher MEF Üniversitesi, Fen Bilimleri Enstitüsü
dc.rights info:eu-repo/semantics/openAccess
dc.subject Unsupervised Learning
dc.subject Hierarchical Clustering
dc.subject Football Data Analysis
dc.subject Player Profiling
dc.subject Güdümsüz Öğrenme
dc.subject Hiyerarşik Kümeleme
dc.subject Futbol Veri Analitiği
dc.subject Oyuncu Profilleme
dc.title Football Player Profiling Using Opta Match Event Data: Hierarchical Clustering
dc.title.alternative Opta maç verisi kullanarak futbolcu profillme: hiyerarşik kümeleme
dc.type Master's Degree Project
dspace.entity.type Publication
gdc.author.institutional Kalenderoğlu, Uğurcan
gdc.coar.access open access
gdc.coar.type text::thesis::master thesis
gdc.description.department Lisansüstü Eğitim Enstitüsü, Büyük Veri Analitiği Yüksek Lisans Programı
gdc.description.publicationcategory YL-Bitirme Projesi
gdc.publishedmonth N/A
gdc.virtual.author Koç, Utku
relation.isAuthorOfPublication 033fab1f-fc1b-4bcd-a954-b68f6409c2dd
relation.isAuthorOfPublication.latestForDiscovery 033fab1f-fc1b-4bcd-a954-b68f6409c2dd
relation.isOrgUnitOfPublication 636850bf-e58c-4b59-bcf0-fa7418bb7977
relation.isOrgUnitOfPublication 0d54cd31-4133-46d5-b5cc-280b2c077ac3
relation.isOrgUnitOfPublication a6e60d5c-b0c7-474a-b49b-284dc710c078
relation.isOrgUnitOfPublication.latestForDiscovery 636850bf-e58c-4b59-bcf0-fa7418bb7977

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
UğurcanKalenderoğlu.pdf
Size:
789.64 KB
Format:
Adobe Portable Document Format
Description:
YL-Proje Dosyası

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
0 B
Format:
Item-specific license agreed upon to submission
Description: