Perhitungan poin akan mengikuti standar yang berlaku, dimana masing-masing kemenangan dihitung 2 poin dan masing-masing seri 1 poin. Sebagai contoh, jika selama ini sebuah tim tercatat memiliki 20 kemenangan dan 12 seri, poinnya adalah 52 (20 x 2 + 12).
Di bawah adalah tabel data masing-masing tim yang saya peroleh dari Wikipedia, dimana G adalah gol, M adalah kemenangan, S adalah seri, dan P adalah poin.
Sekarang kita memiliki data yang dibutuhkan untuk memprediksi pemenang Piala Dunia Qatar mendatang, kita dapat menggunakan model statistika untuk menentukan faktor mana yang paling penting dalam memenangkan pertandingan.Â
Ada sejumlah model yang dapat digunakan untuk memprediksi olahraga, tetapi saya akan menggunakan model regresi linier untuk tujuan ini.
Model ini didasarkan pada konsep bahwa tim dapat meningkatkan peluang mereka untuk menang dengan meningkatkan skor mereka di area permainan tertentu.Â
Misalnya, jika sebuah tim memiliki jumlah gol yang tinggi yang dicetak oleh penyerang mereka dan jumlah tembakan ke gawang yang tinggi, maka mereka cenderung lebih berhasil daripada tim yang memiliki lebih sedikit statistik ini.
Dalam model ini, yang akan menjadi variabel prediktor adalah jumlah gol yang dicetak oleh tim selama Piala Dunia, dan variabel responsnya adalah jumlah poin yang dicetak selama Piala Dunia.Â
Model regresi mengasumsikan bahwa ada hubungan langsung antara variabel prediktor dan respons. Dengan kata lain, semakin banyak gol yang dicetak oleh sebuah tim, semakin banyak poin yang mungkin mereka cetak di pertandingan berikutnya.
Kita sudah memperoleh data dan memasukkannya ke dalam tabel seperti di atas. Bagian selanjutnya akan melibatkan pembuatan plot pencar (scatter plot) dan memeriksa hubungan linier antara kedua variabel.Â
Scatter plot adalah grafik yang menunjukkan hubungan antara dua variabel pada bidang dua dimensi. Dalam hal ini, variabel respon (raihan poin) akan diplot pada sumbu vertikal atau sumbu y, dan variabel prediktor (jumlah gol yang dicetak) akan diplot pada sumbu horizontal atau sumbu x.