Mohon tunggu...
farid rahman laode
farid rahman laode Mohon Tunggu... Programmer - mahasisiwa

saya sangat senang mencari tau hal hal baru dan membagikan hasil pencarian saya kepada banyak orang

Selanjutnya

Tutup

Ilmu Alam & Tekno

10 Algoritma Data Mining yang Harus Kamu Ketahui

20 Oktober 2022   04:49 Diperbarui: 20 Oktober 2022   04:54 1320
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Langkah-3: Pada langkah-M, ini memperbarui parameter model.

Langkah-4: Algoritma mengulangi Langkah 2 dan 3 hingga distribusi cluster dan parameter model menjadi sama.

6. Algoritma PageRank

PageRank umumnya digunakan oleh mesin pencari seperti Google. Ini adalah algoritma analisis tautan yang menentukan kepentingan relatif dari suatu objek yang terhubung dalam jaringan objek. Analisis tautan adalah jenis analisis jaringan yang mengeksplorasi asosiasi di antara objek. Pencarian Google menggunakan algoritma ini dengan memahami tautan balik antar halaman web.

Ini adalah salah satu metode yang digunakan Google untuk menentukan kepentingan relatif halaman web dan memberi peringkat lebih tinggi di mesin pencari google. Merek dagang PageRank adalah milik Google dan algoritma PageRank dipatenkan oleh Universitas Stanford. PageRank diperlakukan sebagai pendekatan pembelajaran tanpa pengawasan karena menentukan kepentingan relatif hanya dengan mempertimbangkan tautan dan tidak memerlukan masukan lain.

Beberapa situs web menautkan secara internal, dan semuanya memiliki bobot dalam jaringan. Sebuah situs web memperoleh lebih banyak suara jika lebih banyak halaman ditautkan ke sana. Oleh karena itu, banyak sumber menganggapnya penting dan relevan. Setiap peringkat halaman dibentuk tergantung pada kelas situs web yang ditautkan.

Google mengalokasikan PageRank dari '0' hingga '10'. Peringkat ini didasarkan pada relevansi halaman dan jumlah tautan keluar, masuk, dan internal. Anda dapat menggunakan algoritme tanpa pengawasan ini saat mengerjakan topik proyek mini terkait web untuk CSE tahun ke-3.

7. Algoritma Adaboost

AdaBoost adalah algoritma boosting yang digunakan untuk membangun classifier. Classifier adalah alat penambangan data yang mengambil data, memprediksi kelas data berdasarkan input. Algoritma boosting adalah algoritma pembelajaran ensemble yang menjalankan beberapa algoritma pembelajaran dan menggabungkannya.

Algoritma boosting mengambil sekelompok pelajar yang lemah dan menggabungkannya untuk membuat satu pelajar yang kuat. Pelajar yang lemah mengklasifikasikan data dengan akurasi yang kurang. Contoh terbaik dari algoritma yang lemah adalah algoritma decision stump yang pada dasarnya merupakan pohon keputusan satu langkah. 

Adaboost adalah pembelajaran terawasi yang sempurna karena bekerja dalam iterasi dan di setiap iterasi, ia melatih pelajar yang lebih lemah dengan kumpulan data berlabel. Adaboost adalah algoritma yang sederhana dan cukup mudah untuk diterapkan.

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun