Informasi merupakan kumpulan data yang telah diproses sedemikian rupa sehingga dapat menghasilkan sesuatu yang mudah dipahami oleh banyak orang. Kata informasi sendiri berasal dari bahasa Latin yaitu Informationem yang artinya konsep, ide atau garis besar.Â
Menurut Kelly (2011:10), informasi merupakan data yang telah diolah menjadi sebuah bentuk yang berarti bagi penerimanya dan bermanfaat dalam pengambilan keputusan saat ini atau saat mendatang. Kemudian, menurut Carlos Coronel dan Steven Morris (2016:4), informasi merupakan hasil dari data mentah yang telah diproses untuk memberikan hasil di dalamnya.Â
Dari kedua pendapat di atas, penulis dapat menyimpulkan bahwa informasi merupakan suatu hal yang penting bagi semua orang karena kehadirannya dapat memberikan pengetahuan dan wawasan baru sekaligus sebagai bahan dasar dalam mengambil keputusan.Â
Namun, seiring dengan berjalannya waktu seringkali kebutuhan informasi yang tinggi tidak diimbangi dengan penyajian informasi yang relevan sehingga informasi tersebut harus dikelola ulang dari data yang populasinya sangat besar. Â Â
Pemanfaatan data dalam sistem informasi untuk mendapatkan pengetahuan baru dan kegiatan pengambilan keputusan tidak cukup hanya mengandalkan dari sisi data operasional saja, tetapi dibutuhkan suatu teknik analisis data untuk mengelola setiap potensi informasi yang ada.Â
Hal ini dapat dibuktikan pada saat seseorang hendak mengambil keputusan, dimana orang tersebut berusaha untuk memanfaatkan data yang ada untuk dikelola dan digali lebih lanjut menjadi sebuah informasi yang penting.Â
Pernyataan sebelumnya merupakan pembuktian dari data mining, dimana data mining hadir untuk mengolah data yang sebelumnya tersembunyi dalam gudang data (data warehouse) menjadi informasi atau pola yang sangat berharga.
1. Pengertian Data Mining
Data mining adalah proses pengumpulan dan pengolahan data yang bertujuan untuk mengekstrak informasi penting pada data. Menurut Turban & dkk (2005), data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terakit dari berbagai data yang sangat besar atau sering disebut dengan data warehouse.Â
Teknik pada data mining digunakan untuk memeriksa setiap basis data yang berukuran besar sebagai cara untuk menemukan pola yang berguna dan sesuai serta dapat digunakan untuk meningkatkan kemampuan pada sistem information retrieval.
Data mining sering disebut dengan istilah Knowledge Discovery in Database (KDD). KDD bekerja untuk melakukan konversi raw data ke dalam sebuah informasi yang dituju. Berikut ini merupakan proses dalam KDD, yaitu sebagai berikut:
Terkait gambar yang disajikan di atas, berikut ini merupakan detail penjelasannya, yaitu sebagai berikut:
- Input data berfungsi untuk memasukkan data sesuai dengan kebutuhan sekaligus dapat disimpan dalam berbagai format file seperti flat file dan spreadsheet maupun tabel relasional.
- Setelah data berhasil dimasukkan, langkah selanjutnya yaitu tahapan preprocessing. Preprocessing bertujuan untuk mengubah data input mentah ke dalam format yang sesuai untuk analisis selanjutnya. Pada tahap ini, langkah-langkah yang terlibat yaitu seperti menggabungkan data dari berbagai sumber, cleaning data untuk membuang noise dan observasi yang duplikat serta menyeleksi fitur dan rekaman yang relevan untuk pekerjaan data mining. Perlu diketahui, tahapan preprocessing merupakan tahapan dengan langkah yang paling banyak memakan waktu dalam proses KDD.
- Tahapan selanjutnya yaitu data mining. Pada tahap ini, data mining sering kali diintegrasikan dengan Decision Support System (DSS). Integrasi tersebut biasanya memerlukan sebuah tools pendukung untuk dapat digunakan, diuji sekaligus sebagai syarat untuk melangkah ke tahap berikutnya.
- Kemudian, tahapan berikutnya yaitu post-processing. Post-processing bertujuan untuk memvisualisasikan segala kemungkinan yang dilakukan oleh seorang analis data dalam mengeksplor data beserta hasilnya dari berbagai sudut pandang. Biasanya, seorang analis data menggunakan metode pengujian hipotesis untuk membuang hasil data mining yang tidak diperlukan sekaligus merilis informasi resmi dari hasil kegiatan pengolahan yang sebelumnya sudah dilaksanakan.
Berkaitan dengan proses KDD di atas, secara khusus data mining menggunakan ide-ide seperti pengambilan contoh, estimasi dan pengujian hipotesis melalui statistika, algoritma pencarian, teknik pemodelan dan teori pembelajaran dari kecerdasan buatan, pengenalan pola dan pembelajaran mesin.
Selain itu, data mining juga mengadopsi ide-ide lain dari beberapa area seperti optimisasi, pemrosesan sinyal, teori informasi, visualisasi, evolutionary computing dan information retrieval.Â
Perlu diketahui bahwa seluruh area yang sudah diadopsi tersebut memberikan sejumlah kontribusi melalui sistem basis data, seperti menyediakan tempat penyimpanan yang efisien dan dapat melakukan proses indexing dan query.
2. Fungsi Data Mining
Berikut ini merupakan fungsi dari data mining, yaitu sebagai berikut:
- Association
Association merupakan proses mengidentifikasi sebuah relasi dari setiap kejadian atau peristiwa yang sudah terjadi pada waktu tertentu. Contohnya yaitu seperti isi dari keranjang belanja.
- Classification
Classification merupakan proses penemuan model yang menjelaskan suatu konsep sekaligus berfungsi untuk menyimpulkan beberapa definisi pada suatu grup. Contohnya yaitu seperti pelanggan suatu perusahaan e-commerce yang berpindah ke kompetitor saingan perusahaan tersebut.
- Clustering
Clustering merupakan proses mengidentifikasi kelompok dari produk atau barang yang memiliki karakteristik khusus seperti yang dibutuhkan. Contohnya yaitu seperti seseorang ingin membeli sebuah barang berdasarkan rating penjualan yang diberikan oleh konsumen lain terhadap barang tersebut.
- Descriptive
Descriptive merupakan proses untuk memahami lebih dalam mengenai data yang berfungsi untuk mengamati setiap perubahan perilaku pada pengguna.
- Forecasting
Forecasting merupakan proses peramalan data yang berfungsi untuk memperkirakan nilai pada waktu yang akan datang berdasarkan pola-pola tertentu melalui sekumpulan data yang sangat besar.
- Predictive
Predictive merupakan fungsi yang digunakan untuk menjelaskan suatu proses dalam menentukan sebuah pola tertentu pada suatu data. Pola tersebut dapat digunakan oleh berbagai macam variabel yang ada pada data tersebut.
- Sequencing
Sequencing merupakan proses identifikasi hubungan-hubungan yang berbeda pada suatu periode dalam jangka waktu tertentu. Contohnya yaitu seperti pelanggan yang mengunjungi pasar secara berulang-ulang.
3. Tujuan Data Mining
Berikut ini merupakan tujuan dari data mining, yaitu sebagai berikut:
- Explanatory
Explanatory merupakan teknik yang berfungsi untuk menjelaskan beberapa kondisi penelitian yang sudah maupun sedang dilakukan. Contohnya yaitu seperti mengapa penjualan masker meningkat di Kota Bandung pada saat ini.
- Confirmatory
Confirmatory merupakan teknik yang berfungsi untuk mempertegas sebuah hipotesis. Contohnya yaitu seperti dua kali pendapatan perusahaan lebih suka digunakan untuk membeli alat tulis kantor dibandingkan dengan satu kali pendapatan perusahaan.
- Exploratory
Exploratory merupakan teknik yang berfungsi untuk menganalisis data pada hubungan baru yang tidak diharapkan. Contohnya yaitu seperti pola apa yang cocok digunakan untuk melakukan kasus penipuan pada laporan akhir keuangan perusahaan.
4. Metode Data Mining
Berikut ini merupakan metode dari data mining, yaitu sebagai berikut:
- Integrasi Data dan Pembersihan Data (Data Integration and Data Cleaning)
Integrasi data dan pembersihan data (data integration and data cleaning) merupakan dua proses yang saling berkaitan, dimana data untuk pertama kalinya diekstrak dari bentuk aslinya berupa Online Transaction Processing (OLTP) basis data, Microsoft Access Database, text file serta dari spreadsheet.Â
Kemudian, data disimpan pada sebuah warehouse yang memiliki struktur sesuai dengan data model tersebut. Lalu, terdapat Data Transformation Service (DTS) yang berfungsi untuk mengekstrak sekaligus membersihkan data yang bersifat noise dan tidak konsisten. Pembersihan data juga nantinya berpengaruh terhadap kinerja performa pada teknik data mining saat bekerja.
- Validitas Data
Data yang sudah diekstrak maupun sudah dibersihkan akan membantu pengguna saat sedang menelusuri model yang sudah dibuat sehingga dapat diyakini bahwa seluruh data yang ada merupakan data terkini dan bersifat tetap.
- Membuat dan Melatih Model
Saat algoritma sudah diterapkan untuk model dan struktur yang sudah dibangun, maka pengguna dapat melihat data yang sudah dibangun untuk memastikan sekaligus meyakini bahwa data tersebut sudah menyerupai fakta berdasarkan data sumber yang tersedia.
- Query Data dari Model Data Mining
Saat model dan struktur sudah dibangun, maka data yang sudah dibuat dapat mendukung pengambilan keputusan. Hal tersebut biasanya akan melibatkan metode penulisan front end query pada aplikasi basis data.
- Â Evaluasi Validitas
Setelah model data mining berhasil dikumpulkan, maka dalam beberapa waktu untuk karakteristik data awal seperti validitas dan granularitas kemungkinan mengalami perubahan. Alasannya yaitu karena model pada data mining terus mengalami perubahan mengikuti perkembangan waktu.
5. Contoh Penerapan Data Mining
Berikut ini merupakan contoh penerapan dari data mining, yaitu sebagai berikut:
- Data Mining di Bidang Asuransi
Pada bidang asuransi, pihak perusahaan memanfaatkan data mining untuk menganalisa pelanggan, mendeteksi penipuan dan mengidentifikasi setiap risiko yang terjadi pada saat pengajuan klaim.
- Data Mining di Bidang Pendidikan
Pada bidang pendidikan, pihak operator sekolah maupun tenaga pendidik memanfaatkan data mining sebagai sarana dalam mengakses data siswa untuk memprediksi tingkat pencapaian kegiatan belajar mengajar siswa, baik dalam segi pengetahuan maupun keterampilan.
- Data Mining di Bidang Retail
Pada bidang retail, pihak perusahaan memanfaatkan data mining untuk meningkatkan hubungan dengan pelanggan dan mengoptimalkan promosi kepada setiap pelanggan melalui produk yang ditawarkan.
- Data Mining di Bidang Telekomunikasi
Pada bidang telekomunikasi, pihak operator seluler memanfaatkan data mining sebagai sarana statistik untuk mencatat kepadatan lalu lintas jumlah penelpon di jam tertentu sehingga operator dapat memberikan skema tarif tertentu bagi pelanggan.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H