Cluster adalah kumpulan objek data sedemikian rupa sehingga objek dalam suatu cluster mirip satu sama lain dan tidak mirip dengan objek di cluster lain. Analisis outlier juga menggunakan teknik berbasis clustering untuk mengidentifikasi outlier potensial sebagai objek yang berbeda dengan objek yang lain.Â
Ketika mengukur kesamaan dan ketidaksamaan, kita dapat menyebutnya juga sebagai ukuran kedekatan. Sebagai informasi juga, biasanya untuk mengukur ukuran jarak unntuk menghitung ketidakmiripan suatu objek menggunakan atribut numerik. Langkah-langkah yang digunakan termasuk jarak Euclidean, Manhattan, dan Minkowski
Demikian pengenalan data pada data mining yang dapat saya jelaskan pada artikel ini, semoga dapat membantu dan menambah pengetahuan teman-teman mengenai Data Mining. Tolong berikan reaksi atau tanggapan anda terhadap artikel saya ini. Terima kasih.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H