Bagian ini akan membahas penggunaan teori dasar matematika dan statistika yang digunakan pada Data Mining khususnya pada metode Clustering.Â
Metode Clustering memiliki tujuan utama mengelompokkan data berdasarkan suatu nilai 'kemiripan' (sering disebut juga similarity) yang dimiliki oleh data-data tersebut.Â
Baca juga : Mengenal Jurusan Statistika dan Dunia Perkuliahannya
Salah satu teknik untuk mengukur kemiripan suatu data dengan data lain adalah dengan mencari nilai Euclidean Distance (ED) kedua data tersebut.
Dalam ilmu matematika Euclidean Distance merupakan jarak garis lurus "biasa" antara dua titik dalam ruang Euclidean.Â
Dengan jarak ini ruang Euclidian menjadi ruang metrik, sehingga norma yang terkait dengan hal tersebut disebut norma Euclidean.Â
Baca juga : Membincang Pendidikan, Ini 7 Catatan Bapak Statistika Indonesia
Euclidean Distance antara dua titik  dan  adalah panjang segmen garis yang menghubungkannya.
Baca juga : Pentingnya Ilmu Statistika Guna Bantu Menanggulangi Wabah Virus Corona
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H