Mohon tunggu...
SRI ADININGSI
SRI ADININGSI Mohon Tunggu... Mahasiswa - Mahasiswa

E1E120020

Selanjutnya

Tutup

Ilmu Alam & Tekno

Proses, Metode dan Atribut Data Mining

27 September 2022   19:45 Diperbarui: 27 September 2022   19:52 1231
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Hai teman-teman, seperti yang sudah saya jelaskan di artikel sebelumnya tentang data mining dalam kehidupan sehari-hari, pastinya teman-teman sudah tahu apa itu data mining dan contohnya dalam lingkup kehidupan sehari-hari. Nah sekarang kita akan memahami bagaiman proses suatu data menjadi data mining dan apa saja atribut pada data mining. 

1. Proses Data Mining

Data mining merupakan bagian dari tahapan proses Knowledge Discovery in Database (KDD). Dengan data mining, kita dapat melakukan pengklasifikasian, memprediksi, memperbaiki dan mendapatkan informasi lain yang bermanfaat dari kumpulan data dalam jumlah yang besar. 

Untuk itu KDD dan data mining seringkali digunakan secara bergantian untuk menjelaskan proses menemukan informasi tersembunyi dalam data yang cukup besar. Namun kedua istilah ini tentu memeiliki konsep yang berbeda, tetapi saling berkaitan satu sama lain karena salah satu tahap dalam proses KDD adalah data mining.

Adapun  gambar  di atas dan tahapan Knowledge Discovery in Database (KDD) sebagai berikut:

1. Pada tahap awal ini kita melakukan pengumpulan data, dimana data masih berupa data mentah.

2. Data Integration. Setelah data terkumpul maka kita akan melakukan penyatuan data dari berbagai sumber yang kemudian  menjadi sebuah data warehause.

3. Data Cleaning. Tahap ini kita akan membuang data yang tidak konsisten dan kemudian memperbaiki data yang belum lengkap.

4. Selection. Tahap ini untuk menyeleksi data yang akan dipakai kemudian di ubah menjadi bentuk yang sesuai untuk di-mining disebut data transformation.

5. Data Mining. Pada tahap ini kita akan menggunakan metode data mining.

6. Pattern Evaluasi. Setelah metode mining data yang menghasilkan dataset maka kita akan mengevaluasi pola yang ditemukan.

7. Presentasi pola yang ditemukan untuk menghasilkan pengetahuan dan aksi.

Dari ke-7 tahap tersebut kita mengelompokkan tahapnya menjadi 4 proses yaitu:

  • Data Selction/Pemilihan
  • Pre-processing/Cleaning
  • Tranformation
  • Evaluasi

2. Metode Data Mining

Dalam proses KDD ini terdapat proses data mining yang menggunakan beberapa metode. adapun metode yang digunakan dalam data mining yaitu:

1. Klasifikasi

Klasifikasi adalah metode dalam data mining dengan memberikan kelompok pada setiap keadaan ataupun situasi berdasarkan atrubutnya.

2. Klustering

Klustering adalah metode dalam data mining dengan mengidentifikasi setiap kelompok dari sebuah kasus kemudian mengelompokkan data berdasarkan atribut.

3. Asosiasi

Asosiasi adalah metode dalam data mining dengan menemukan suatu kombinasi item yang muncul bersamaan. Dalam dunia bisnis, sering disebut dengan Affinity Analysis atau Market Basket Analysis. Dalam hal ini mencari tahu produk apa yang biasanya terjual bersamaan dan mencari tahu apa aturan yang menyebabkan kesamaan tersebut.

3. Atribut Data Mining

Kita ketahui bahwa atribut adalah karakteristik dari suatu objek data yang nilainya bisa bermacam-macam diantaranya  objek data yang diamati, misalnya tinggi badan seseorang bisa berbeda dari waktu ke waktu, warna kulit juga memiliki nilai berbeda. Berat badanmempunyai nilai dengan jenis numerik (kuantitatif) sedangkan warna kulit memiliki jenis nilai bersifat kualitatif. Pada umumnya tipe atribut terdiri dari kualitatif (diskrit) dan kuantitatif (numerik).

1. Tipe Diskrit (kualitatif)

Atribut tipe diskrit terbagi menjadi dua yaitu:

  • Nominal yaitu nilai atribut berupa nama yang membedakan dengan nilai lainnya (=,<>). Contohnya nim, kode pos, n0-ktp, jenis kelamin.
  • Ordinal adalah nilai atribut berupa nama yang memiliki arti informasi terurut (<,<=,>=,>). Contohnya kondisi barang (baik, buruk).

2. Tipe Numerik (kuantitatif)

Atribut tipe numerik terbagi menjadi dua yaitu:

  • Interval adalah perbedaan dari dua nilai atribut memeiliki makna berarti (+,=) data diukur pada skala interval. contohnya tanggal, temperatur, rating IQ dll.
  • Rasio adalah perbedaan dan rasio dari dua nilai atribut memiliki perbedaan berarti (*,/). Contohnya tinggi,, panjang, umur dll.

Nah teman-teman mungkin itu saja penjelasan singak tentang proses, metode dan atribut data mining. Sekian dan terima kasih.

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun