Data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Data mining memiliki tujuan untuk menemukan pola yang berupa informasi dari banyaknya data, serta melalukan analisis data dan pola yang dilakukan secara otomatis dan semi otomatis. Data mining sangat diperlukan untuk memgelola data dalam skala besar.
Pada dasarnya, data mining mempunyai empat fungsi dasar yaitu:
-Fungsi Prediksi (prediction). Proses untuk menemukan pola dari data dengan menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenis atau nilainya.
-Fungsi Deskripsi (description). Proses untuk menemukan suatu karakteristik penting dari data dalam suatu basis data.Â
-Fungsi Klasifikasi (classification). Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan.Â
-Fungsi Asosiasi (association). Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data.
Dalam penerapannya dalam bidang kesehatan data mining digunakan untuk mencegah adanya kejadian medical error, yang terbagi menjadi 3 mekanisme besar yaitu:
 1. PencegahanÂ
2. Respon cepatÂ
3. Umpan balik
Data mining pun sudah banyak diterapkan dalam bidang kesehatan, contohnya sistem untuk memprediksi penyakit hipertensi pada kehamilan. Hipertensi merupakan salah satu masalah yang paling sering muncul pada ibu hamil, masalah kesehatan tersebut jika berlanjut maka dapat menyebabkan kematian pada ibu dan janin.Â