Lihat ke Halaman Asli

Atika Nurfadilah

Teknik Informatika UHO

Pengenalan Data Mining

Diperbarui: 14 September 2022   15:25

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Pendidikan. Sumber ilustrasi: PEXELS/McElspeth

Sebuah teknik yang mengintegrasikan beberapa bidang ilmu dasar seperti matematika, statistika, dan ilmu komputer serta bisnis proses. Kemudian ada juga tools yang belakangan ini cukup menjadi perhatian di berbagai bidang ilmu khususnya yang berhubungan dengan penggunaan data, terminology yang sedang trend seperti data science, artificial intelegent, machine learning. Semua itu berkaitan dengan Data Mining.

Secara ringkas data mining adalah proses pengumpulan dan pengolahan data dalam jumlah besar, hingga nantinya diperoleh hasil akhir berupa pengetahuan yang akan menjadi tinjauan dalam pengambilan keputusan.

Sebagai gambaran, yaitu terjadinya penetrasi teknologi informasi dibidang ritel dalam hal ini juga mungkin lebih spesifik di bidang komersial, misalnya toko e-commerce dimana akhirnya menghasilkan data yang laju pertumbuhannya sangat signifikan atau terjadi pertumbuhan yang luar biasa di data ini. Data-data tersebut bisa diperoleh dari tools data collection yang diautomasi (sensor dan sebagainya), database system, website, atau Society computerize Society. 

Masing-masing bidang memiliki sumber-sumber datanya sendiri, antara lain sebagai berikut.

  • Bisnis            : website, e-commerce, tranksaksi, stok
  • Sains             : Remote Sensing, bioinformatics, scientific simulation
  • Society and everyone    : news, digital camera, youtube

Dengan banyaknya data yang tersedia saat ini, terciptalah data mining sebagai solusi dari masalah "bagaimana kita memanfaatkan dan memperoleh informasi yang diinginkan dari dalam data yang berjumlah besar tersebut?"

Data maining berbicara tentang proses bagaimana caranya kita melakukan ekstraksi atau penambangan ekstraksi data-data menjadi pengetahuan-pengetahuan. Bisa saja saat proses data mining kita tidak memperoleh apa-apa, namun paling tidak di awal kita sudah punya prediksi atau memproyeksikan kira-kira hasil apa yang akan kita peroleh, tetapi apakah hasilnya nanti turun atau lebih dari yang diharapkan itu tergantung hasil sebanarnya yang nanti kita peroleh.

Data mining disebut dengan knowledge discovery from data atau pencarian pengetahuan dari data. Data mining ini merupakan proses ekstraksi sesuatu yang "menarik" (non-trivial, previously unknown, potentially usefull) yang nantinya menghasilkan sebuah pola atau pengetahuan. Data mining memiliki sebutan lain knowledge discovery (mining) in databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, dan business intelligence.

Landasan paling dasar pada data mining adalah menyiapkan database, setelah kita memiliki beberapa database yang dibutuhkan maka masuk ke tahap berikutnya, yaitu data integration dan data cleaning untuk memilah mana data yang benar-benar sesuai dengan yang kita butuhkan. Kemudian data-data yang telah melalui proses cleaning ini disimpan dalam gudang data yang disebut dengan data warehouse. Setelah itu dilakukan lagi data selection untuk masuk ke task relevant data. Seluruh proses ini disebut dengan data pre-procesing. Jadi, setelah data sudah mengalami pre-procesing barulah masuk ke tahap data mining, kemudian menjadi pattern evaluation (proses evaluasi pola) yang akhirnya menghasilkan knowledge (pengetahuan) sebagai pendukung pengambilan keputusan.

Artikel ini bersumber dari  rekaman perkuliahan mata kuliah Data Mining yang selengkapnya dapat ditonton di bawah ini.


Terima Kasih, Semoga Bermanfaat.

Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline