Mohon tunggu...
David Basar
David Basar Mohon Tunggu... Mahasiswa - -

Jadilah Berkat Bagi Sesamamu!

Selanjutnya

Tutup

Ilmu Alam & Tekno

Data Mining: Pengertian, Fungsi, Tujuan, Metode dan Penerapannya dalam Kehidupan Sehari-hari

29 September 2022   14:00 Diperbarui: 21 Oktober 2022   12:16 1274
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Gambar 1. Ilustrasi Data Mining (Sumber: Longvan.net)

Informasi merupakan kumpulan data yang telah diproses sedemikian rupa sehingga dapat menghasilkan sesuatu yang mudah dipahami oleh banyak orang. Kata informasi sendiri berasal dari bahasa Latin yaitu Informationem yang artinya konsep, ide atau garis besar. 

Menurut Kelly (2011:10), informasi merupakan data yang telah diolah menjadi sebuah bentuk yang berarti bagi penerimanya dan bermanfaat dalam pengambilan keputusan saat ini atau saat mendatang. Kemudian, menurut Carlos Coronel dan Steven Morris (2016:4), informasi merupakan hasil dari data mentah yang telah diproses untuk memberikan hasil di dalamnya. 

Dari kedua pendapat di atas, penulis dapat menyimpulkan bahwa informasi merupakan suatu hal yang penting bagi semua orang karena kehadirannya dapat memberikan pengetahuan dan wawasan baru sekaligus sebagai bahan dasar dalam mengambil keputusan. 

Namun, seiring dengan berjalannya waktu seringkali kebutuhan informasi yang tinggi tidak diimbangi dengan penyajian informasi yang relevan sehingga informasi tersebut harus dikelola ulang dari data yang populasinya sangat besar.    

Pemanfaatan data dalam sistem informasi untuk mendapatkan pengetahuan baru dan kegiatan pengambilan keputusan tidak cukup hanya mengandalkan dari sisi data operasional saja, tetapi dibutuhkan suatu teknik analisis data untuk mengelola setiap potensi informasi yang ada. 

Hal ini dapat dibuktikan pada saat seseorang hendak mengambil keputusan, dimana orang tersebut berusaha untuk memanfaatkan data yang ada untuk dikelola dan digali lebih lanjut menjadi sebuah informasi yang penting. 

Pernyataan sebelumnya merupakan pembuktian dari data mining, dimana data mining hadir untuk mengolah data yang sebelumnya tersembunyi dalam gudang data (data warehouse) menjadi informasi atau pola yang sangat berharga.

1. Pengertian Data Mining

Data mining adalah proses pengumpulan dan pengolahan data yang bertujuan untuk mengekstrak informasi penting pada data. Menurut Turban & dkk (2005), data mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terakit dari berbagai data yang sangat besar atau sering disebut dengan data warehouse. 

Teknik pada data mining digunakan untuk memeriksa setiap basis data yang berukuran besar sebagai cara untuk menemukan pola yang berguna dan sesuai serta dapat digunakan untuk meningkatkan kemampuan pada sistem information retrieval.

Data mining sering disebut dengan istilah Knowledge Discovery in Database (KDD). KDD bekerja untuk melakukan konversi raw data ke dalam sebuah informasi yang dituju. Berikut ini merupakan proses dalam KDD, yaitu sebagai berikut:

Gambar  2. Proses dalam KDD (Sumber: Academia.edu)
Gambar  2. Proses dalam KDD (Sumber: Academia.edu)

Terkait gambar yang disajikan di atas, berikut ini merupakan detail penjelasannya, yaitu sebagai berikut:

  • Input data berfungsi untuk memasukkan data sesuai dengan kebutuhan sekaligus dapat disimpan dalam berbagai format file seperti flat file dan spreadsheet maupun tabel relasional.
  • Setelah data berhasil dimasukkan, langkah selanjutnya yaitu tahapan preprocessing. Preprocessing bertujuan untuk mengubah data input mentah ke dalam format yang sesuai untuk analisis selanjutnya. Pada tahap ini, langkah-langkah yang terlibat yaitu seperti menggabungkan data dari berbagai sumber, cleaning data untuk membuang noise dan observasi yang duplikat serta menyeleksi fitur dan rekaman yang relevan untuk pekerjaan data mining. Perlu diketahui, tahapan preprocessing merupakan tahapan dengan langkah yang paling banyak memakan waktu dalam proses KDD.
  • Tahapan selanjutnya yaitu data mining. Pada tahap ini, data mining sering kali diintegrasikan dengan Decision Support System (DSS). Integrasi tersebut biasanya memerlukan sebuah tools pendukung untuk dapat digunakan, diuji sekaligus sebagai syarat untuk melangkah ke tahap berikutnya.
  • Kemudian, tahapan berikutnya yaitu post-processing. Post-processing bertujuan untuk memvisualisasikan segala kemungkinan yang dilakukan oleh seorang analis data dalam mengeksplor data beserta hasilnya dari berbagai sudut pandang. Biasanya, seorang analis data menggunakan metode pengujian hipotesis untuk membuang hasil data mining yang tidak diperlukan sekaligus merilis informasi resmi dari hasil kegiatan pengolahan yang sebelumnya sudah dilaksanakan.

Berkaitan dengan proses KDD di atas, secara khusus data mining menggunakan ide-ide seperti pengambilan contoh, estimasi dan pengujian hipotesis melalui statistika, algoritma pencarian, teknik pemodelan dan teori pembelajaran dari kecerdasan buatan, pengenalan pola dan pembelajaran mesin.

Selain itu, data mining juga mengadopsi ide-ide lain dari beberapa area seperti optimisasi, pemrosesan sinyal, teori informasi, visualisasi, evolutionary computing dan information retrieval. 

Perlu diketahui bahwa seluruh area yang sudah diadopsi tersebut memberikan sejumlah kontribusi melalui sistem basis data, seperti menyediakan tempat penyimpanan yang efisien dan dapat melakukan proses indexing dan query.

          Gambar 3. Hubungan Data Mining dengan Area Lain (Sumber: Academia.edu)
          Gambar 3. Hubungan Data Mining dengan Area Lain (Sumber: Academia.edu)

2. Fungsi Data Mining

Berikut ini merupakan fungsi dari data mining, yaitu sebagai berikut:

  • Association

Association merupakan proses mengidentifikasi sebuah relasi dari setiap kejadian atau peristiwa yang sudah terjadi pada waktu tertentu. Contohnya yaitu seperti isi dari keranjang belanja.

  • Classification

Classification merupakan proses penemuan model yang menjelaskan suatu konsep sekaligus berfungsi untuk menyimpulkan beberapa definisi pada suatu grup. Contohnya yaitu seperti pelanggan suatu perusahaan e-commerce yang berpindah ke kompetitor saingan perusahaan tersebut.

  • Clustering

Clustering merupakan proses mengidentifikasi kelompok dari produk atau barang yang memiliki karakteristik khusus seperti yang dibutuhkan. Contohnya yaitu seperti seseorang ingin membeli sebuah barang berdasarkan rating penjualan yang diberikan oleh konsumen lain terhadap barang tersebut.

  • Descriptive

Descriptive merupakan proses untuk memahami lebih dalam mengenai data yang berfungsi untuk mengamati setiap perubahan perilaku pada pengguna.

  • Forecasting

Forecasting merupakan proses peramalan data yang berfungsi untuk memperkirakan nilai pada waktu yang akan datang berdasarkan pola-pola tertentu melalui sekumpulan data yang sangat besar.

  • Predictive

Predictive merupakan fungsi yang digunakan untuk menjelaskan suatu proses dalam menentukan sebuah pola tertentu pada suatu data. Pola tersebut dapat digunakan oleh berbagai macam variabel yang ada pada data tersebut.

  • Sequencing

Sequencing merupakan proses identifikasi hubungan-hubungan yang berbeda pada suatu periode dalam jangka waktu tertentu. Contohnya yaitu seperti pelanggan yang mengunjungi pasar secara berulang-ulang.

3. Tujuan Data Mining

Berikut ini merupakan tujuan dari data mining, yaitu sebagai berikut:

  • Explanatory

Explanatory merupakan teknik yang berfungsi untuk menjelaskan beberapa kondisi penelitian yang sudah maupun sedang dilakukan. Contohnya yaitu seperti mengapa penjualan masker meningkat di Kota Bandung pada saat ini.

  • Confirmatory

Confirmatory merupakan teknik yang berfungsi untuk mempertegas sebuah hipotesis. Contohnya yaitu seperti dua kali pendapatan perusahaan lebih suka digunakan untuk membeli alat tulis kantor dibandingkan dengan satu kali pendapatan perusahaan.

  • Exploratory

Exploratory merupakan teknik yang berfungsi untuk menganalisis data pada hubungan baru yang tidak diharapkan. Contohnya yaitu seperti pola apa yang cocok digunakan untuk melakukan kasus penipuan pada laporan akhir keuangan perusahaan.

4. Metode Data Mining

Berikut ini merupakan metode dari data mining, yaitu sebagai berikut:

Gambar  4. Metode pada Data Mining (Sumber: Universitas Gunadarma)
Gambar  4. Metode pada Data Mining (Sumber: Universitas Gunadarma)
  • Integrasi Data dan Pembersihan Data (Data Integration and Data Cleaning)

Integrasi data dan pembersihan data (data integration and data cleaning) merupakan dua proses yang saling berkaitan, dimana data untuk pertama kalinya diekstrak dari bentuk aslinya berupa Online Transaction Processing (OLTP) basis data, Microsoft Access Database, text file serta dari spreadsheet. 

Kemudian, data disimpan pada sebuah warehouse yang memiliki struktur sesuai dengan data model tersebut. Lalu, terdapat Data Transformation Service (DTS) yang berfungsi untuk mengekstrak sekaligus membersihkan data yang bersifat noise dan tidak konsisten. Pembersihan data juga nantinya berpengaruh terhadap kinerja performa pada teknik data mining saat bekerja.

  • Validitas Data

Data yang sudah diekstrak maupun sudah dibersihkan akan membantu pengguna saat sedang menelusuri model yang sudah dibuat sehingga dapat diyakini bahwa seluruh data yang ada merupakan data terkini dan bersifat tetap.

  • Membuat dan Melatih Model

Saat algoritma sudah diterapkan untuk model dan struktur yang sudah dibangun, maka pengguna dapat melihat data yang sudah dibangun untuk memastikan sekaligus meyakini bahwa data tersebut sudah menyerupai fakta berdasarkan data sumber yang tersedia.

  • Query Data dari Model Data Mining

Saat model dan struktur sudah dibangun, maka data yang sudah dibuat dapat mendukung pengambilan keputusan. Hal tersebut biasanya akan melibatkan metode penulisan front end query pada aplikasi basis data.

  •  Evaluasi Validitas

Setelah model data mining berhasil dikumpulkan, maka dalam beberapa waktu untuk karakteristik data awal seperti validitas dan granularitas kemungkinan mengalami perubahan. Alasannya yaitu karena model pada data mining terus mengalami perubahan mengikuti perkembangan waktu.

5. Contoh Penerapan Data Mining

Berikut ini merupakan contoh penerapan dari data mining, yaitu sebagai berikut:

  • Data Mining di Bidang Asuransi

Pada bidang asuransi, pihak perusahaan memanfaatkan data mining untuk menganalisa pelanggan, mendeteksi penipuan dan mengidentifikasi setiap risiko yang terjadi pada saat pengajuan klaim.

  • Data Mining di Bidang Pendidikan

Pada bidang pendidikan, pihak operator sekolah maupun tenaga pendidik memanfaatkan data mining sebagai sarana dalam mengakses data siswa untuk memprediksi tingkat pencapaian kegiatan belajar mengajar siswa, baik dalam segi pengetahuan maupun keterampilan.

  • Data Mining di Bidang Retail

Pada bidang retail, pihak perusahaan memanfaatkan data mining untuk meningkatkan hubungan dengan pelanggan dan mengoptimalkan promosi kepada setiap pelanggan melalui produk yang ditawarkan.

  • Data Mining di Bidang Telekomunikasi

Pada bidang telekomunikasi, pihak operator seluler memanfaatkan data mining sebagai sarana statistik untuk mencatat kepadatan lalu lintas jumlah penelpon di jam tertentu sehingga operator dapat memberikan skema tarif tertentu bagi pelanggan.

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun