Hai terima kasih sudah mampir di artikel saya, perkenalkan saya Marsita Harim. Saya merupakan Mahasiswa Teknik Informatika dengan NIM E1E120014.
Dalam artikel saya yang pertama ini, saya akan perkenalan kepada pembaca apa itu Data Mining dari yang saya pelajari pada pertemuan sebelumnya.
Dalam Data Mining terdapat dua kata yaitu Data dan Mining. Pertama kita fokus pada kata Data. Data merupakan fakta/peristiwa yang telah terjadi yang belum diolah, kemudian ketika data tersebut diolah akan menjadi suatu informasi. Orang sering kali salah mengira bahwa data dan informasi adalah hal yang sama, namun nyatanya mereka berbeda.Â
Sebagai contoh agar kita bisa membedakan data dan informasi. Data : Jumlah 68 mahasiswa. Informasi : Mahasiswa yang mengambil mata kuliah Data Mining TA 2022/2023 berjumlah 68 orang. Data yang telah diolah tadi sehingga menjadi informasi kemudian akan diolah kembali sehingga menjadi suatu pengetahuan yang kemudian akan menjadi referensi untuk pengambilan keputusan.
Kata kedua setelah Data adalah Mining, Mining jika diterjemahkan ke dalam bahasa Indonesia adalah pertambangan/menambang. Menambang merupakan proses mengolah suatu barang/hal yang berharga. Dimana dalam hal ini (Data Mining), hal berharga tersebut ialah Pengetahuan.
Dari kedua pengertian dari data dan mining, dapat saya simpulkan bahwa data mining merupakan proses mengolah data lalu data tersebut diolah kembali menjadi suatu informasi yang kemudian informasi tersebut diolah sehingga menjadi suatu pengetahuan yang berharga yang dapat dijadikan sebagai referensi untuk pengambilan suatu keputusan.
Namun ternyata Data Mining hanyalah sebagian dari proses KDD (Knowledge Discovery). Proses pertama dalam KDD ini adalah kita harus mempunyai Database, dimana tentunya dalam database tersebut memiliki berbagai jenis data sehingga kemudian proses selanjutnya yaitu data integration, kemudian dilakukan data cleaning.
Proses ini dilakukan agar data tidak ada yang bernilai NULL (kosong). Proses selanjutnya setelah dilakukan data cleaning adalah penyimpanan data di Data Warehouse atau Gudang Data. Prosess selanjutnya dilakukan selection (seleksi). Pada proses ini mempunyai dasar yang digunakan untuk melakukan selection yaitu Task-relevant Data.Â
Dari tahap pertama tadi hingga tahap seleksi / task-relevant data dalam beberapa referensi disebut sebagai tahap Data preprocessing. Setelah tahapan data preprocessing tadi selesai akhirnya masuklah ke tahapan Data Mining kemudian Pattern Evaluation (Evaluasi Pola) yang kemudian dari proses panjang ini akan menghasilkan suatu Knowledge (pengetahuan)
Dalam kehidupan sehari-hari sebenarnya kita sudah sering jumpai penggunakan Data Mining ini. Contoh pengaplikasian yang paling dekat dengan kita yang tanpa kita sadari telah menggunakan Data Mining yaitu peletakan mie dan telur yang saling berdekatan baik itu di supermarket atau minimarket. Peletakan ini menggunakan MBA (Market Basket Analysis). MBA merupakan suatu teknik penambangan untuk mengetahui pola pembelian. Dimana ketika konsumen membeli mie ada kemungkinan konsumen tersebut juga membeli telur.
Selain itu rekomendasi yang sering kita lihat di social media kita juga menerapkan Data Mining di dalamnya dengan mengenali pola yang kita lakukan selama menggunakan social media tersebut, baik postingan yang disuka, video yang ditonton akan dikenali polanya sehingga nantinya ketika kita membuka kembali social media kita akan ditampilkan beberapa rekomendasi dari pola yang didapat.