Klasifikasi Kesesuaian Market Value dan Performa Pemain Sepak Bola Liga Eredivisie Menggunakan Random Forest dan Gradient Boosting (Studi Kasus: Liga Eredivisie Musim 2023/2024)
Abstract
Penelitian ini bertujuan mengembangkan model klasifikasi untuk mengevaluasi
kesesuaian antara market value dan performa aktual pemain sepak bola Liga
Eredivisie Belanda musim 2023/2024. Dataset terdiri dari 347 pemain dengan data
performa (WhoScored) dan market value (Transfermarkt), yang dikategorikan ke
dalam kelas 'Undervalued', 'Overvalued', atau 'Fairly Valued'. Ketidakseimbangan
kelas signifikan (72,91% 'Fairly Valued') diatasi melalui cost-sensitive learning
pada algoritma Random Forest dan Gradient Boosting. Hasil komparatif
menunjukkan Random Forestsebagai model superior dengan Akurasi 81,43%, F1-
Score Macro 0,7306, dan ROC-AUC Macro 0,9261, serta profil risiko bisnis lebih
aman (Presisi 62% vs 47% Gradient Boosting untuk kelas 'Undervalued'). Analisis
kepentingan fitur mengungkap temuan orisinal: metrik distribusi bola Average Pass
Length (0,0844) dan Pass Success Accuracy (0,0843) mendominasi klasifikasi
valuasi, mengungguli statistik gol. Fenomena ini memvalidasi "development league
hypothesis", di mana Liga Eredivisie sebagai liga pengembangan talenta
menempatkan premi tinggi pada transferable skills dibanding end product.
Penelitian ini mengusulkan Tiered Scouting System sebagai framework hybrid yang
mengintegrasikan prediksi model (Tier 1) dengan validasi human scout (Tier 2)
untuk mitigasi risiko investasi. Temuan ini berkontribusi sebagai instrumen analitik
berbasis bukti bagi manajemen klub dalam strategi rekrutmen dan investasi pemain.
Collections
- Statistics [1232]
