*Unsupervised Machine Learning melibatkan analisis data yang tak memiliki label untuk menggali pola, struktur, dan hubungan pada data tanpa adanya kolom ‘target’ (label).
*Pada supervised learning objektifnya adalah mempelajari hubungan antara fitur input dan output yang sesuai. →prediksi, klasifikasi. Sedangkan unsupervised learning bertujuan untuk mengeksplorasi dan memahami kemiripan karakteristik pada data. → eksplorasi, memahami data, mencari pola tersembunyi.
* Clustering digunakan untuk pengelompokan object-object data kedalam kelompok atau cluster yang tiap cluster memiliki object-object dengan tingkat kesamaan feature antar object yang tinggi.
• Algoritma clustering dapat digunakan untuk analisis cluster yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.
• Analisis cluster mengklasifikasikan objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama.
* Ada beberapa pendekatan yang digunakan algoritma clustering untuk mengelompokkan object-object ke dalam tiap cluster:
1. Pendekatan Partisi
Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada.
contoh : K-Means
2. Pendekatan Hirarki
Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical. clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan.