"Gamblers can price in random quirks that statisticians struggle to capture in their models" (The Economist).
Saat ini, demam Piala Dunia sedang melanda seluruh belahan dunia. Mata semua penggila bola sedang tertuju ke Rusia. Salah satu pertanyaan besar yang ditunggu jawabannya di ujung perhelatan akbar ini adalah siapa yang bakal keluar sebagai juara?
Untuk menjawab pertanyaan ini, orang lalu mencoba membuat berbagai prediksi dengan cara yang beragam mulai dari penggunaan hewan di kebun binatang hingga model-model statistik canggih dan machine learning.
Kita tentu masih mengingat Paul, seekor gurita dari Oberhausen, Jerman, yang berhasil memprediksi hasil pertandingan sepak bola dengan, boleh dibilang, sangat akurat. Betapa tidak, sepanjang perhelatan Piala Eropa 2008 hingga Piala Dunian 2010, prediksi Paul hanya dua kali melesat.
Sayangnya, sang prediktor hebat ini sudah mati. Lalu, di tengah perkembangan ilmu pengetahuan yang kian pesat dan era big data saat ini, mampukah kita menghasilkan model saintifik yang dapat memprediksi pemenang Piala Dunia 2018 dengan sangat akurat atau setidaknya menyamai akurasi tebakan Paul?
Sulit diprediksiÂ
Memprediksi outcome dari sebuah turnamen sepak bola seperti Piala Dunia bukanlah pekerjaan yang mudah. Pasalnya, hampir semua tim yang berlaga di Piala Dunia kali ini memiliki kekuatan yang hampir merata. Dalam hal ini, ungkapan bahwa bola itu bundar ada benarnya karena segala kemungkinan bisa terjadi hingga menit akhir pertandingan.
Karena itu, kejutan akan terjadi di hampir setiap laga karena unsur acak (randomness) dan ketidakpastiaan (uncertainty) yang sangat dominan. Dan, memodelkan kedua komponen ini agar hasil sebuah pertandingan dapat diprediksi secara akurat adalah pekerjaan yang sangat rumit dalam pemodelan dengan metode kuantitatif.
Barangkali, hal ini jauh lebih rumit dibanding memprediksi persentase perolahan suara partai politik atau calon gubernur dalam pemilihan umum yang hampir selalu melesat meski dilakukan oleh berbagai lembaga survei secara keroyokan.
Terkait penggunaan model saintifik untuk memprediksi pemenang Piala Dunia kali ini, ada sebuah contoh menarik. Sebuah tim yang beranggotakan ahli statistik dan matematik dari Jerman dan Belgia pada awal bulan ini merilis sebuah makalah berjudul 'Prediction of the FIFA World Cup 2018 -- A random forest approach with an emphasis on estimated team ability parameters.'
Dalam makalah ini, mereka menyajikan hasil prediksi pemenang Piala Dunia 2018 yang didasarkan pada hasil simulasi dengan menggunakan metode kuantitatif yang mengkombinasikan metode ranking (rangking methods) dan metode pohon acak (random forests).