Meskipun namanya mengandung kata "regresi", Logistic Regression sebenarnya adalah salah satu algoritma klasifikasi yang paling populer dan sering digunakan dalam Machine Learning. Algoritma ini sangat berguna untuk memprediksi kemungkinan suatu data point (sampel) termasuk dalam kelas tertentu.
Misalnya, apakah sebuah email adalah spam atau bukan, apakah seorang pelanggan akan berhenti berlangganan (churn) atau tidak, atau apakah sebuah tumor bersifat ganas atau jinak. Bagaimana Cara Kerjanya?
Berbeda dengan Linear Regression yang menghasilkan nilai numerik kontinu, Logistic Regression menghasilkan probabilitas antara 0 dan 1. Nilai ini kemudian dapat diubah menjadi prediksi kelas dengan menetapkan ambang batas tertentu.
Misalnya, jika probabilitas suatu email diklasifikasikan sebagai spam lebih dari 0.8, maka email tersebut akan dianggap sebagai spam. Salah satu kunci keberhasilan Logistic Regression adalah penggunaan fungsi sigmoid. Fungsi ini mengubah nilai input (yang bisa berupa nilai apa pun) menjadi nilai antara 0 dan 1. Hal ini memungkinkan kita untuk menginterpretasikan output sebagai probabilitas.
3. Decision Tree
Decision Tree, atau dalam bahasa Indonesia sering disebut Pohon Keputusan, adalah salah satu algoritma machine learning yang paling populer dan mudah dipahami. Visualisasinya yang menyerupai pohon dengan cabang-cabang dan daun membuat proses pengambilan keputusan menjadi lebih intuitif.
Setiap simpul pada pohon mewakili suatu atribut atau fitur dari data, sedangkan setiap cabang merepresentasikan hasil dari suatu tes pada atribut tersebut. Daun pada pohon merupakan hasil akhir atau prediksi yang ingin kita capai.
Proses pembuatan Decision Tree melibatkan algoritma seperti ID3, C4.5, atau CART yang secara rekursif membagi dataset menjadi subset yang lebih murni. Pembagian ini dilakukan berdasarkan atribut yang paling efektif dalam memisahkan data.
Proses pembagian berulang terus dilakukan hingga mencapai kondisi berhenti tertentu, misalnya ketika semua data pada suatu cabang memiliki kelas yang sama atau ketika kedalaman pohon mencapai batas yang ditentukan. Contoh Penggunaan Decision Tree:
Klasifikasi: Memprediksi apakah email adalah spam atau bukan, mengklasifikasikan pelanggan berdasarkan perilaku pembelian, atau mendiagnosis penyakit berdasarkan gejala.
Regresi: Memprediksi harga rumah berdasarkan luas tanah, jumlah kamar, dan lokasi, atau memprediksi tingkat kepuasan pelanggan berdasarkan survei.
Decision Tree adalah alat yang sangat berguna dalam machine learning. Dengan kemampuannya untuk menghasilkan model yang mudah diinterpretasi dan fleksibel.