"Gamblers can price in random quirks that statisticians struggle to capture in their models" (The Economist).
Saat ini, demam Piala Dunia sedang melanda seluruh belahan dunia. Mata semua penggila bola sedang tertuju ke Rusia. Salah satu pertanyaan besar yang ditunggu jawabannya di ujung perhelatan akbar ini adalah siapa yang bakal keluar sebagai juara?
Untuk menjawab pertanyaan ini, orang lalu mencoba membuat berbagai prediksi dengan cara yang beragam mulai dari penggunaan hewan di kebun binatang hingga model-model statistik canggih dan machine learning.
Kita tentu masih mengingat Paul, seekor gurita dari Oberhausen, Jerman, yang berhasil memprediksi hasil pertandingan sepak bola dengan, boleh dibilang, sangat akurat. Betapa tidak, sepanjang perhelatan Piala Eropa 2008 hingga Piala Dunian 2010, prediksi Paul hanya dua kali melesat.
Sayangnya, sang prediktor hebat ini sudah mati. Lalu, di tengah perkembangan ilmu pengetahuan yang kian pesat dan era big data saat ini, mampukah kita menghasilkan model saintifik yang dapat memprediksi pemenang Piala Dunia 2018 dengan sangat akurat atau setidaknya menyamai akurasi tebakan Paul?
Sulit diprediksiÂ
Memprediksi outcome dari sebuah turnamen sepak bola seperti Piala Dunia bukanlah pekerjaan yang mudah. Pasalnya, hampir semua tim yang berlaga di Piala Dunia kali ini memiliki kekuatan yang hampir merata. Dalam hal ini, ungkapan bahwa bola itu bundar ada benarnya karena segala kemungkinan bisa terjadi hingga menit akhir pertandingan.
Karena itu, kejutan akan terjadi di hampir setiap laga karena unsur acak (randomness) dan ketidakpastiaan (uncertainty) yang sangat dominan. Dan, memodelkan kedua komponen ini agar hasil sebuah pertandingan dapat diprediksi secara akurat adalah pekerjaan yang sangat rumit dalam pemodelan dengan metode kuantitatif.
Barangkali, hal ini jauh lebih rumit dibanding memprediksi persentase perolahan suara partai politik atau calon gubernur dalam pemilihan umum yang hampir selalu melesat meski dilakukan oleh berbagai lembaga survei secara keroyokan.
Terkait penggunaan model saintifik untuk memprediksi pemenang Piala Dunia kali ini, ada sebuah contoh menarik. Sebuah tim yang beranggotakan ahli statistik dan matematik dari Jerman dan Belgia pada awal bulan ini merilis sebuah makalah berjudul 'Prediction of the FIFA World Cup 2018 -- A random forest approach with an emphasis on estimated team ability parameters.'
Dalam makalah ini, mereka menyajikan hasil prediksi pemenang Piala Dunia 2018 yang didasarkan pada hasil simulasi dengan menggunakan metode kuantitatif yang mengkombinasikan metode ranking (rangking methods) dan metode pohon acak (random forests).
Data yang digunakan adalah hasil pertandingan Piala Dunia sebelumnya sepanjang 2002-2014 yang merupakan representasi performa tim dan informasi tambahan lainnya, seperti GDP per kapita, populasi, rangking FIFA, rata-rata umur pemain, jumlah pemain yang berlaga di Liga Champion, jumlah pemaian yang bermain di luar negeri, dan performa pelatih setiap negara peserta.
Mereka menyimpulkan bahwa Jerman bakal keluar sebagai juara dengan mengalahkan Brazil di partai final. Peluang Jerman bakal menang di laga pamungkas bahkan diperkirakan mencapai 64 persen.
Tumbangnya Sang Juara Bertahan memberi pelajaran berharga kepada kita bahwa memprediksi masa depan adalah pekerjaan yang tidak mudah, secanggih apa pun model yang digunakan. Terkait hal ini, statistikawan kenamaan George P. Box pernah menulis "The most that can be expected from any model is that it can supply a useful approximation to reality: All models are wrong; some models are useful."
Karena itu, tidak semua yang dikemas dengan model-model statistik canggih itu akurat, termasuk ramalan siapa yang bakal menjuarai Piala Dunia 2018. Dalam hal ini, yang bisa kita lakukan adalah menikmati setiap pertandingan sembari bersiap untuk setiap kejutan yang bakal terjadi. (*)
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H