Regresi logistik memungkinkan kita untuk memodelkan probabilitas peristiwa atau kelas tertentu.biasanya untuk memodelkan variabel dependen biner. Ini memberi kita probabilitas dari satu percobaan. Karena regresi logistik dibuat untuk klasifikasi yang membantu kita memahami dampak dari beberapa variabel independen pada satu variabel hasil. Masalah algoritma ini adalah hanya berfungsi ketika variabel prediksi Anda adalah biner, dan semua prediktornya independen.dan juga data tidak boleh memiliki nilai yang hilang.
- K-Nearest Neighbor
Algoritma k-nearest neighbor memiliki batas prediksi non-linear karena merupakan pengklasifikasi non-linear. Ini memprediksi kelas titik data uji baru dengan menemukan k kelas tetangga terdekatnya. Kita akan memilih k tetangga terdekat dari titik data uji dengan menggunakan jarak Euclidean. Di k tetangga terdekat,kita harus menghitung jumlah titik data yang ada dalam kategori berbeda, dan kita akan menetapkan titik data baru ke kategori dengan tetangga terbanyak. Ini adalah algoritma yang cukup sulit karena menemukan nilai k membutuhkan banyak sumber daya. Selain itu juga kita harus menghitung jarak setiap instance ke setiap sampel pelatihan, yang akan memperlambat komputasi.
Pengaplikasian algoritma klasifikasi
- Ahli meteorologi menggunakan algoritma ini untuk memprediksi kondisi cuaca menurut berbagai parameter seperti kelembaban, suhu, dll.Â
- Pakar kesehatan masyarakat menggunakan pengklasifikasi untuk memprediksi risiko berbagai penyakit dan membuat strategi untuk mengurangi penyebarannya.Â
- Lembaga keuangan menggunakan algoritma klasifikasi untuk menemukan menentukan kartu dan pinjaman siapa yang harus mereka setujui. Ini juga membantu dalam mendeteksi penipuan.
Nah itulah tadi penjelasan dari salah satu salah satu metode data mining yaitu klasifikasi semoga informasi ini dapat berguna bagi pembaca
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H