Namun dari banyaknya data yang masuk, apakah semua data yang ada merupakan data yang bermanfaat? Tentu saja tidak.Â
Sehingga untuk menghasilkan sesiatu yang bermanfaat, data harus kita olah menjadi suatu pengetahun. Dengan pengetahuan tersebut, manusia dapat:
- Melakukan estimasi dan prediksi terhadap apa yang akan terjadi di masa depan
- Melakukan analisis tentang asosiasi, korelasi, dan pengelompokan antar data dan atribut
- Memabantu pengambilan keputusan dan pembuatan kebijakan
Data -> Informasi -> Pengetahuan -> Kebijakan
Proses pengekstrakan data menjadi pengetahuan dinamakan data mining. Berdasarkan penjelasan pada video Kak Romi, beliau mengartikan bahwa
Data Mining adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar.
Adapun tahap pengekstrasian data menjadi pengetahuan, ialah sebagai berikut.
1. Data -> Fakta yang terekam dan tidak memiliki arti
2. Informasi -> Rekap, rangkuman, penjelasan, dan statistik dari data
3. Pengetahuan -> Pola, rumus, aturan atau model yang muncul dari data
 Definisi Data Mining Menurut Beberapa Sumber
- Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumny tidak iketahui dari suatu data (Witten et al., 2011)
- Kegiatan yang meliputi pengumpulan, pemakaian data histois untuk menemukan keteratutan, pola dan hubungan dalam set data berukuran besar (Santosa, 2007)
- Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data (Han et al, 2011)