Langkah-3: Pada langkah-M, ini memperbarui parameter model.
Langkah-4: Algoritma mengulangi Langkah 2 dan 3 hingga distribusi cluster dan parameter model menjadi sama.
6. Algoritma PageRank
PageRank umumnya digunakan oleh mesin pencari seperti Google. Ini adalah algoritma analisis tautan yang menentukan kepentingan relatif dari suatu objek yang terhubung dalam jaringan objek. Analisis tautan adalah jenis analisis jaringan yang mengeksplorasi asosiasi di antara objek. Pencarian Google menggunakan algoritma ini dengan memahami tautan balik antar halaman web.
Ini adalah salah satu metode yang digunakan Google untuk menentukan kepentingan relatif halaman web dan memberi peringkat lebih tinggi di mesin pencari google. Merek dagang PageRank adalah milik Google dan algoritma PageRank dipatenkan oleh Universitas Stanford. PageRank diperlakukan sebagai pendekatan pembelajaran tanpa pengawasan karena menentukan kepentingan relatif hanya dengan mempertimbangkan tautan dan tidak memerlukan masukan lain.
Beberapa situs web menautkan secara internal, dan semuanya memiliki bobot dalam jaringan. Sebuah situs web memperoleh lebih banyak suara jika lebih banyak halaman ditautkan ke sana. Oleh karena itu, banyak sumber menganggapnya penting dan relevan. Setiap peringkat halaman dibentuk tergantung pada kelas situs web yang ditautkan.
Google mengalokasikan PageRank dari '0' hingga '10'. Peringkat ini didasarkan pada relevansi halaman dan jumlah tautan keluar, masuk, dan internal. Anda dapat menggunakan algoritme tanpa pengawasan ini saat mengerjakan topik proyek mini terkait web untuk CSE tahun ke-3.
7. Algoritma Adaboost
AdaBoost adalah algoritma boosting yang digunakan untuk membangun classifier. Classifier adalah alat penambangan data yang mengambil data, memprediksi kelas data berdasarkan input. Algoritma boosting adalah algoritma pembelajaran ensemble yang menjalankan beberapa algoritma pembelajaran dan menggabungkannya.
Algoritma boosting mengambil sekelompok pelajar yang lemah dan menggabungkannya untuk membuat satu pelajar yang kuat. Pelajar yang lemah mengklasifikasikan data dengan akurasi yang kurang. Contoh terbaik dari algoritma yang lemah adalah algoritma decision stump yang pada dasarnya merupakan pohon keputusan satu langkah.Â
Adaboost adalah pembelajaran terawasi yang sempurna karena bekerja dalam iterasi dan di setiap iterasi, ia melatih pelajar yang lebih lemah dengan kumpulan data berlabel. Adaboost adalah algoritma yang sederhana dan cukup mudah untuk diterapkan.