Mohon tunggu...
Yunda Puji Lestari
Yunda Puji Lestari Mohon Tunggu... Freelancer - Mahasiswi IT

Work, work and work

Selanjutnya

Tutup

Ilmu Alam & Tekno

Data Mining dan Perannya dalam Era Digitalisasi

14 September 2022   17:41 Diperbarui: 14 September 2022   17:46 657
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Evolusi Sains (source Data Mining: Concept and Techiques (3rd edition/chapter 1))

Era digitalisasi telah membawa perubahan baru dibidang teknologi dunia tanpa terkecuali negara Indonesia. Kegiatan masyarakat yang terus terkena efek proses digital terus meningkat setiap tahunnya, tidak dapat dipungkiri hal ini tentu saja berdampak pada tingkat data digital yang terus membludak. 

Masyarakat yang dulunya membeli barang dengan mendatangi tempat penjualan langsung sekarang dapat melakukannya dengan sentuhan jari, mencari barang di internet -> mengunjungi online shop -> cek harga barang -> check out barang -> membayar dengan e-wallet. Semuanya dapat dilakukan dari mana saja dan kapan saja secara online. 

Tetapi apakah prosesnya berhenti disitu saja? Tentu saja tidak. Dalam prosesnya contohnya seperti kondisi pembelian barang online diatas terdapat sistem yang menyimpan data pembelian dan data costumer toko itu sendiri tentu saja tidak hanya 1 data pembelian atau data costumer tetapi bisa mencapai berjuta-juta data perhari. 

Nah, pernahkah anda berpikir bagaimana suatu sistem dapat mengelola suatu data yang sangat banyak jumlahnya dengan meminimalisasi kesalahan dalam prosesnya? Jawabannya adalah dengan menggunakan Data Mining.

Pengertian Data Mining

Sebagian besar orang mungkin masih asing dengan istilah data mining padahal data mining ini sangat erat hubungannya dengan kehidupan kita sehari-hari. Hampir semua proses atau kegiatan digital yang kita lakukan melibatkan data mining. 

Lantas apa itu data mining? Secara ilmiah data mining adalah proses penelusuran pola-pola pada data dalam jumlah yang besar yang menggunakan berbagai metode yang merupakan persilangan dari machine learning, statistika dan basis data. 

Sederhanya, bagaimana mengambil informasi/pola dari data yang banyak dengan menggunakan komputer dan pengetahuan tambahan seputar machine learning dan statistika. 

Data mining adalah proses pengolahan data dengan ruang lingkup data yang besar untuk diekstrak menjadi informasi yang berguna untuk menjadi dasar dalam pengambilan keputusan. 

Menurut buku Data Mining : Concept and Techniques (3rd edition/chapter 1) yang ditulis oleh Jiawei Han, Micheline Kamber dan Jian Pei menyatakan "Data mining (Knowledge discovery from data) is extraction of interesting (non-trivial, implicit, previously, unknown and potentially useful) patterns or knowledge from huge amount of data. Data mining memiliki sebutan yang beragam seperti Knowledge discovery (mining) in database (KDD) seperti yang telah disebutkan sebelumnya, knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting dan business intelligence. 

Dewasanya, proses pengolahan data tidak lagi dilakukan secara manual melainkan dengan memanfaatkan data mining yang dapat mengurangi penggunaan sumber daya dan tenaga yang berlebihan. Sejak kapan data mining mulai diperkenalkan kepada dunia? akan dibahas dibawah ini.

Sejarah Data Mining

Data mining mulai berkembang pada tahun 1990-an sampai sekarang diakibatkan pertumbuhan data dan perkembangan teknologi. Sebelum tahun 1990-an dikenal dengan istilah computational science, dimana beberapa disiplin ilmu muncul untuk bekerja sama dan menyimpulkan untuk menciptakan sebuah pengetahuan yang dapat dimanfaatkan untuk melakukan simulasi-simulasi dengan komputer yang bersifat paralel computation. 

Mundur lebih jauh lagi yaitu pada tahun 1600 sampai 1950-an dikategorikan menjadi theoretical science dimana teori-teori dasar dari permasalahan jaman kini ditemukan pada masa ini misalnya teori kalkulus, fisika modern mulai muncul.

Database dan data mining memiliki keterikatan yang kuat. Untuk bisa melakukan "mining" data pertama-tama anda harus mengusai dasar-dasar ilmu tentang database. Adapun database sendiri adalah kumpulan data yang terorganisir yang umumnya diakses, disimpan dan dikelola secara elektronik.

Evolusi Teknologi Database (source Data Mining : Concept and Techniques (3rd edition/chapter 1))
Evolusi Teknologi Database (source Data Mining : Concept and Techniques (3rd edition/chapter 1))

Proses Mining Data

Secara teknis proses mining data dapat dikatakan sebagai suatu proses yang iteratif yang didalamnya terdapat langkah yang dilalui. Landasan paling dasar ketika berbicara tentang data mining berkaitan dengan database dan tidak hanya satu database didalamnya melainkan terdapat kumpulan database yang saling berkaitan. 

Proses Data Mining (source Data Mining : Concept and Techniques (3rd edition/chapter 1)
Proses Data Mining (source Data Mining : Concept and Techniques (3rd edition/chapter 1)

Dalam proses melakukan mining data pertama-tama akan diperlukan database kemudian akan lanjut ke data integration kemuadian data cleaning untuk membuang data yang tidak sesuai syarat yang ditentukan misalnya masih ada data null, data yang tidak sesuai format dan sebagainya. Setelah tahap cleaning maka data akan disimpan di data warehouse setelah melalui tahap ini akan dilakukan proses pemilihan yang didasari dengan kriteria data relavan yang telah ditentukan. 

Sampai ke tahapan ini beberapa sumber menyebutnya dengan tahapan data pre-processing setelahnya dilakukan proses data mining lalu dilakukan proses evaluasi pola dan terakhir didapatkan pengetahuan atau informasi yang bisa digunakan dalam pengambilan keputusan. 

Proses ini bisa saja berulang ke tahapan-tahapan sebelum didapatkan knowledge jika knowledge yang didapatkan pada proses data mining pertama tidak mencapai syarat yang ditentukan dalam pengolahan suatu data. Proses ini bisa dilakukan dengan memperbaiki metode yang digunakan atau menambahkan metode baru dan sebagainya. 

Jika mining data dan objeknya adalah web maka prosesnya :

1. Data cleaning

2. Data integration from multiple sources

3. Warehousing the data

4. Data cube construction

5. Data selection for data mining

6. Data mining

7. Presentation of the mining results

8. Patterns and knowledge to be used or stored into knowledge based

Pemanfaatan Data Mining

Data mining sering digunakan dalam business intelligence yaitu menjadi support business decission contohnya dalam pengambilan keputusan bisnis dengan memanfaatkan analisa informasi menggunkan data mining. Selain dalam bidang business intelligence, data mining dimanfaatkan dalam machine learning, statistika, dunia medis dan masih banyak lagi. 

Pemanfaatan Data Mining dalam Business Intelligence (Source Data Mining : Concept and Techniques (3rd edition/chapter 1)
Pemanfaatan Data Mining dalam Business Intelligence (Source Data Mining : Concept and Techniques (3rd edition/chapter 1)

Tulisan ini, saya maksudkan untuk memenuhi tugas matakuliah data mining. Adapun referensi dari tulisan ini sebagai berikut.

Data Mining: Concepts and Techniques, 3rd ed.

#1 2021.1 Data Mining (Kelas Ilmu Komputer FMIPA UHO)

Semoga tulisan ini bermanfaat bagi semua pihak, Terima Kasih :)

Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana
Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun