Jumlah informasi atau data yang disimpan secara elektronik selama dua dekade terakhir telah berkembang sangat cepat. Diperkirakan bahwa jumlah informasi di dunia akan berlipat ganda setiap 20 bulan dan ukuran database akan meningkat lebih cepat lagi.
Sekarang, penyimpanan data dengan jumlah yang besar akan semakin mudah dengan penggunaan teknologi database. Kemudian ledakan data akan menjadi masalah. Dimana data- data ini harus disimpan dan mengapa sangat penting untuk menentukan penggunaannya. Kemudian muncul pertanyaan. Lalu bagaimana kita harus menggunakan data itu?
Nah, disinilah Data Mining akan berperan :D
1. Apa Itu Data Mining?
Analisis data dan penggunaan perangkat lunak untuk menemukan pola dan kesamaan dalam kumpulan data pada dasarnya terkait dengan data mining. Proses analisis data mining menggunakan data memiliki kecenderungan untuk berkembang dari waktu ke waktu dan kemudian disesuaikan untuk menghasilkan penilaian dan keputusan yang paling rasional. Knowledge Discovery in Databases (KDD), Knowledge Extraction dan Data Analysis/patterns, adalah beberapa contoh nama lain dari data mining.
2. Mengapa Data Mining Diperlukan?
Kebutuhan akan data mining sebagian disebabkan oleh ukuran dan volume data yang sangat besar. Prosedur dan output data mining adalah informasi yang akan digunakan untuk memandu keputusan di masa depan, sehingga keakuratan informasi yang dihasilkan sangat penting. Hasilnya akan lebih dapat diandalkan jika lebih besar dan lebih banyak data yang digunakan. Selain itu pjuga karena pemeriksaan data secara manual adalah teknik yang tidak efisien dan tidak masuk akal.
3. Apa tujuan Data Mining?
Tujuan data mining adalah untuk menemukan kebenaran atau kesimpulan yang disimpulkan dari memilah-milah data untuk mencari pola dan keputusan. Ada 5 fungsi data mining yaitu :
- Classification, yaitu proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
- Clustering, yaitu proses pengelompokkan data berdasarkan karakteristik tertentu.
- Association, yaitu pengidentifikasian produk yang kemungkinan akan dimiliki bersamaan dengan produk lain.
- Estimation, yaitu penerkaan sebuah nilai yang belum diketahui.
- Forecasting, yaitu proses untuk memperkirakan nilai yang akan datang.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H