Lihat ke Halaman Asli

Penerapan Algoritma Machine Learning dalam Prediksi Penyakit Diabetes

Diperbarui: 24 Mei 2024   21:09

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

https://www.ncbi.nlm.nih.gov

Penerapan Algoritma Machine Learning dalam Prediksi Penyakit Diabetes

Penelitian ini bertujuan untuk menerapkan algoritma machine learning dalam prediksi penyakit diabetes. Algoritma yang digunakan meliputi K-Nearest Neighbors (KNN), Decision Tree, dan Random Forest. Data yang digunakan merupakan data sekunder dari Pima Indian Diabetes Dataset yang berisi berbagai parameter medis. Hasil penelitian menunjukkan bahwa algoritma Random Forest memberikan akurasi tertinggi dibandingkan dengan algoritma lainnya.

Apa itu Penyakit Diabetes

Penyakit diabetes merupakan salah satu penyakit kronis yang mempengaruhi jutaan orang di seluruh dunia. Deteksi dini dan prediksi penyakit ini sangat penting untuk mengurangi dampak buruk yang ditimbulkannya. Dengan kemajuan teknologi, penerapan algoritma machine learning menjadi salah satu metode yang efektif untuk melakukan prediksi penyakit ini.

Metode Penelitian ini menggunakan tiga algoritma machine learning yaitu K-Nearest Neighbors (KNN), Decision Tree, dan Random Forest. Dataset yang digunakan adalah Pima Indian Diabetes Dataset yang diunduh dari UCI Machine Learning Repository. Dataset ini terdiri dari 768 sampel dengan 8 fitur medis, seperti kadar glukosa, tekanan darah, dan indeks massa tubuh (BMI).

Preprocessing DataSebelum dilakukan penerapan algoritma, data harus melalui proses preprocessing yang meliputi normalisasi data dan penanganan missing values. Normalisasi dilakukan untuk memastikan bahwa setiap fitur memiliki kontribusi yang setara dalam model prediksi.

Algoritma K-Nearest Neighbors (KNN)KNN adalah algoritma non-parametrik yang digunakan untuk klasifikasi dan regresi. Algoritma ini bekerja dengan cara mencari sejumlah k tetangga terdekat dari data yang akan diklasifikasikan.

Algoritma Decision TreeDecision Tree adalah algoritma yang menggunakan struktur pohon untuk membuat keputusan berdasarkan fitur-fitur dari data. Keputusan diambil dengan membuat pertanyaan berurutan yang membagi data menjadi subset berdasarkan nilai fitur.

Algoritma Random ForestRandom Forest adalah metode ensemble learning yang menggabungkan beberapa decision tree untuk meningkatkan akurasi prediksi. Algoritma ini bekerja dengan cara membuat multiple decision tree dari subset data yang berbeda dan mengambil keputusan berdasarkan mayoritas voting dari semua tree.

Hasil dan PembahasanModel machine learning dievaluasi menggunakan metrik akurasi, precision, recall, dan F1-score. Dari hasil evaluasi, algoritma Random Forest menunjukkan performa terbaik dengan akurasi 78%, precision 75%, recall 77%, dan F1-score 76%. Algoritma KNN dan Decision Tree masing-masing menunjukkan akurasi 73% dan 74%.

Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline