Langkah kelima dalam tahapan data mining adalah selection. Seleksi data didefinisikan sebagai proses penentuan jenis dan sumber data yang sesuai dan instrumen yang sesuai untuk mengumpulkan data. Pemilihan data mendahului praktik pengumpulan data yang sebenarnya. Dalam seleksi data digunakan dua metode seleksi yaitu berdasarkan referensi dan berdasarkan statistik.
Langkah keenam dalam tahapan data mining adalah database dimana pada tahapan ini terjadi penambangan data. Pada tahapan ini juga harus sangat penting untuk menentukan metode penambangan data itu sendiri.
Langkah ketujuh dalam tahapan data mining adalah pattern evaluation. Setelah selesai melakukan proses penambangan data dan menentukan metode penambangan data itu sendiri, metode-metode yang didapatkan dari proses tadi perlu untuk dievaluasi. Tujuan dari dilakukannya evaluasi adalah untuk menguji hipotesis awal. Setelah teruji data bisa dipresentasikan kepada pengguna.
Dari ketujuh langkah tahapan data mining akan menghasilkan output knowledge (pengetahuan). Dan dari ketujuh langkah tahapan data mining dapat ditarik kesimpulan bahwa salah satu fungsi dari data mining itu sendiri adalah untuk menentukan pola yang sebelumnya tidak kita ketahui menjadi tahu dan untuk mencari algoritma yang tepat.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H