SEJARAH DATA MINING
Data mining muncul sekitar tahun 90-an. Kehadiran data mining dilatarbelakangi oleh problem data explosion yang dialami akhir-akhir ini di mana banyak organisasi telah mengumpulkan data seperti data pembelian, penjualan, nasabah, transaksi dan masih banyak lagi dengan kurun waktu yang cukup lama.Â
Hampir semua data tersebut dimasukkan dengan menggunakan aplikasi komputer yang digunakna untuk menangani transaksi sehari-hari yang kebanyakan adalah OLTP ( On Line Transaction Procesing). Sehingga ditemukannya data mining untuk mengeksplorasi basis data untuk menemukan pola-pola tersembunyi, mencari informasi pemrediksi yang munkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka.
PENGERTIAN DATA MINING
Data mining merupakan suatu proses melibatkan data-data yang bersifat mentah kemudian diolah agar dapat dijadikan sebagai informasi yang faktual dan dapat dijadikan sebagai sumber ilmu pengetahuan atau knowloedge.
Data mining ini melibatkan beberapa bidang ilmu seperti Matematika, Statistika, Sistem Informasi, Dan lain-lain.
FUNGSI DATA MINING
Adapun fungsi dari data mining ini adalah sebagai berikut.
- Data mining berfungsi sebagai sarana untuk menjelaskan suatu kondisi yang terdapat pada penelitian tertentu. Disini Data mining memudahkan peneliti untuk mengolah data-data yang masih bersifat mentah agar dapat dijadikan sebagai informasi yang faktual.
- Data mining juga berfungsi sebagai dasar untuk memperkuat suatu argumen yang telah di tetapkan. Dari data mining ini seseorang dapat memperkuat hipotesa yang telah ditetapkan dengan memanfaatkan data mining untuk mengumpulkan informasi yang berkaitan dengan hipotesa yang telah di tetapkan.
- dan yang terakhir, adapun fungsi dari data mining adalah untuk menentukan pola baru yang sebelumnya belum ditemukan.
Knowledge Discovery (KDD) Process
Knowledge Discovery Process (KDP), juga disebut penemuan pengetahuan dalam database, mencari pengetahuan baru dalam beberapa domain aplikasi. Ini didefinisikan sebagai proses mengidentifikasi pola yang valid, baru, berpotensi berguna, dan pada akhirnya dapat dipahami dalam data. Itu proses generalisasi ke sumber data nondatabase, meskipun menekankan database sebagai sumber data utama.
 Ini terdiri dari banyak langkah (salah satunya adalah DM), masing-masing mencoba untuk menyelesaikan tugas penemuan tertentu dan masing-masing diselesaikan dengan penerapan penemuan metode. Penemuan pengetahuan menyangkut seluruh proses ekstraksi pengetahuan, termasuk bagaimana data disimpan dan diakses, cara menggunakan algoritme yang efisien dan terukur untuk menganalisis secara masif kumpulan data, bagaimana menafsirkan dan memvisualisasikan hasil, dan bagaimana memodelkan dan mendukung interaksi antara manusia dan mesin.Â
Â
Adapun tahap-tahap data mining adalah sebagai berikut.
1. Data Cleaning/Pembersihan data
Pemebersihan data merupakan prose menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki data-data yang tidak sempurna.
Â
2.Data Integration/ Integrasi data
Integrasi data merupakan proses penggabungan data dari berbagai database ke dalam suatu database baru.
Â
3. Data Selection/Seleksi data
Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database.
Â
4. Transformasi data/Data Transformation
Pada tahap ini data akan diubah atau digabung ke dalam format yang telah ditentukan dan sesuai agar dapat diproses dalam dataa mining.
Â
5. Proses Mining
proses mining merupakan proses terakhir dan yang berfungsi untuk menemukan pengetahuan berharga dan tersembunyi dari data.
Â
Referensi:
Â
https://link.springer.com/chapter/10.1007/978-0-387-36795-8_2
Â
Â
Â
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H