Langkah kelima dalam tahapan data mining adalah selection. Seleksi data didefinisikan sebagai proses penentuan jenis dan sumber data yang sesuai dan instrumen yang sesuai untuk mengumpulkan data. Pemilihan data mendahului praktik pengumpulan data yang sebenarnya. Dalam seleksi data digunakan dua metode seleksi yaitu berdasarkan referensi dan berdasarkan statistik.
Langkah keenam dalam tahapan data mining adalah database dimana pada tahapan ini terjadi penambangan data. Pada tahapan ini juga harus sangat penting untuk menentukan metode penambangan data itu sendiri.
Langkah ketujuh dalam tahapan data mining adalah pattern evaluation. Setelah selesai melakukan proses penambangan data dan menentukan metode penambangan data itu sendiri, metode-metode yang didapatkan dari proses tadi perlu untuk dievaluasi. Tujuan dari dilakukannya evaluasi adalah untuk menguji hipotesis awal. Setelah teruji data bisa dipresentasikan kepada pengguna.
Dari ketujuh langkah tahapan data mining akan menghasilkan output knowledge (pengetahuan). Dan dari ketujuh langkah tahapan data mining dapat ditarik kesimpulan bahwa salah satu fungsi dari data mining itu sendiri adalah untuk menentukan pola yang sebelumnya tidak kita ketahui menjadi tahu dan untuk mencari algoritma yang tepat.
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI