Rumus Gain Ration : Gain Ratio = Gain/Split Information
Kelebihan Dan Kekurangan Decision Tree
Kelebihan:Â
- Mudah Dipahami: Karena decision tree berbasis visual, metode ini mudah dipahami oleh pemula. Modelnya sangat intuitif dan transparan
- Tidak Membutuhkan Pranormalisasi: Tidak seperti metode lain (misalnya KNN), decision tree tidak memerlukan normalisasi atau scalling data
- Fleksibilitas: Decision tree dapat digunakan untuk klasifikasi maupun regresi.
- Dapat Menangani Data Kategori dan Numerik: Baik data kategori (seperti "Ya/Tidak") maupun data numerik bisa di proses dengan baik oleh decision tree
Kekurangan:
- Overfitting: Jika pohon terlalu dalam, decision tree bisa menjadi terlalu rumit dan spesifik pada data latih, sehingga tidak bekerja dengan baik pada data baru
- Sensitif Terhadap Data: Perubahan kecil pada data dapat mengubah struktur pohon secara drastis.
- Inefisien pada Dataset Besar: Untuk dataset yang sangat besar dan kompleks, decision tree mungkin tidak seefisien metode lain, seperti random forest atau gradient boosting.
Kesimpulan
Decision Tree adalah alat yang sangat berguna dalam machinelearning untuk tugas klasifikasi. Degnan menggunakan konsep entropy, gain, Gini index, dan gain ratio, kita dapat memebangun model yang mampu memprediksi dengan akurat. Meskipun ada kelemahan seperti overfitting decision tree tetap menjadi metode yang populer, terutama karena kemudahannya dipahami dan diaplikasikan
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana
Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI