Bagian ini akan membahas penggunaan teori dasar matematika dan statistika yang digunakan pada Data Mining khususnya pada metode Clustering.
Metode Clustering memiliki tujuan utama mengelompokkan data berdasarkan suatu nilai 'kemiripan' (sering disebut juga similarity) yang dimiliki oleh data-data tersebut.
Baca juga : Mengenal Jurusan Statistika dan Dunia Perkuliahannya
Salah satu teknik untuk mengukur kemiripan suatu data dengan data lain adalah dengan mencari nilai Euclidean Distance (ED) kedua data tersebut.
Dalam ilmu matematika Euclidean Distance merupakan jarak garis lurus "biasa" antara dua titik dalam ruang Euclidean.
Dengan jarak ini ruang Euclidian menjadi ruang metrik, sehingga norma yang terkait dengan hal tersebut disebut norma Euclidean.
Baca juga : Membincang Pendidikan, Ini 7 Catatan Bapak Statistika Indonesia
Euclidean Distance antara dua titik dan adalah panjang segmen garis yang menghubungkannya.
Sumber : https://en.wikipedia.org/wiki/Euclidean_distance
Berikut link artikel lengkap : pdfBaca juga : Pentingnya Ilmu Statistika Guna Bantu Menanggulangi Wabah Virus Corona
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI