Lihat ke Halaman Asli

Tasya Berlianiswah

Mahasiswi Jurusan Teknik Informatika Fakultas Teknik Universitas Halu Oleo

Data Mining

Diperbarui: 14 September 2022   16:13

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Apa itu Data Mining ?

Data mining merupakan sebuah teknik yang menggabungkan beberapa bidang ilmu dasar diantaranya yaitu matematika, statistika dan ilmu komputer. Data mining erat kaitannya dengan data science, artificial intelligence dan machine learning. Data mining merupakan proses mengolah data yang berjumlah besar untuk mendapatkan suatu informasi. 

Data mining dapat di analogikan seperti sebuah gunung yang mengandung emas yang kemudian melalui proses ekstraksi, proses pemuliaan dan proses lainnya sehingga menjadi bongkahan emas yang bernilai mahal. Dimana gunung di ibaratkan sebagai data yang berjumlah banyak, proses ekstraksi,pemuliaan dan proses lainnya di ibaratkan sebagai proses mengolah data dan bongkahan emas di ibaratkan sebagai informasi yang didapatkan. 

Proses Mendapatkan Informasi (KDD Process)

Data mining merupakan proses yang terbilang iterative atau berulang dan juga merupakan bagian dari proses mendapatkan informasi. Proses ini disebut Knowledge Discovery in Databases (KDD), proses dimulai dari database, ada yg bersifat relational atau non-relational, sql atau non sql. Sebelum memperoleh informasi, harus terlebih dahulu mendapatkan data yang nantinya akan di kelola. Misalnya, data produksi cabai rawit di sulawesi tenggara, data ini di dapatkan dari database Badan Pusat Statistik Sultra. 

Setelah itu, memasuki proses data integration. Lalu memasuki proses data cleaning atau pembersihan data. Hal ini dilakukan untuk  mencegah ketidaksesuaian data dalam databases (data yang null, tidak sesuai format). 

Barulah setelah data bersih, data tersebut di simpan ke warehouse/ gudang data, yang selanjutnya data yang berada dalam gudang data akan dipilih (melalui tahap selection). Pemilihan tidak dilakukan begitu saja, melainkan berdasarkan Task-relevant data atau data relevant yang hanya akan dipilih sebelum memasuki tahap data mining. 

Setelah memilih data yang relevan maka masuklah ke tahap data mining, selanjutnya dari tahap data mining akan masuk ke tahap pattern evaluation atau proses mengevaluasi pola yang kemudian setelah itu menghasilkan sebuah informasi atau pengetahuan. 

Adapun beberapa aspek data mining yang terlihat dari beberapa sisi atau perspektif :
1. Data yang akan di mining, data berasal dari databases, data warehouse, data transaksi, teks dan web dan masih banyak  lagi
2. Fungsi data mining, data mining punya 3 tugas yaitu karakterisasi, diskriminasi, asosiasi, klasifikasi, klustering, deviasi dan lainnya. Kemudian deskriptif dan prediktif data mining dan beberapa fungsi lain di berbagai tingkatan
3. Teknik yang digunakan, ada machine learning, data warehouse, data-intensive, visualisasi, pengenalan pola dan lainnya
4. Aplikasi yang di adaptasi seperti banking, analisa stok market/pasar, retail dan masih banyak lagi

Selain itu ada beberapa jenis data yang bisa di mining, seperti data streams atau data yang berasal dari sensor seperti data cuaca , time-series data,temporal data dan sequence data seperti DNA dan masih banyak lagi. Selain jenis data, ada pula fungsi dari data mining yaitu generalization, salah satu contohnya integrasi informasi dan konstruksi gudang data. Kemudian fungsi lainnya yaitu analisis asosiasi dan korelasi, salah satu contohnya yaitu frequent patterns.

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H




BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline