Lihat ke Halaman Asli

Tasya Berlianiswah

Mahasiswi Jurusan Teknik Informatika Fakultas Teknik Universitas Halu Oleo

Mengetahui Konsep dan Teknik Data Mining

Diperbarui: 28 September 2022   01:19

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Dalam data mining, ada 3 teknik yang paling sering disebut atau sudah tidak menjadi asing lagi yaitu klasifikasi, klustering dan asosiasi. Namun sebelum itu, ada beberapa tahap yang untuk melakukan data mining yaitu :

1. Database, kumpulan data yang diambil dari berbagai sumber yang tersimpan di database baik relational ataupun non-relational.

2. Integration, setelah data didapatkan, selanjutnya menyatukan data tersebut atau menyamakan format data secara keseluruhan. Hal ini dilakukan karena data yang dikumpulkan dari tahap database, bisa saja  memiliki format yang berbeda-beda.

3. Cleaning, data yang formatnya telah sama,selanjutnya dilakukan pembersihan. Yang berarti dilakukan perbaikan terhadap data yang formatnya telah sama namun tidak memiliki nilai/ bersifat null atau memuat data yang tidak diperlukan. 

Yang kemudian setelah melalui ketiga proses tersebut, data di simpan di data warehouse. Dari tahap database -> Integration -> Cleaning -> Warehouse, tahapan tersebut disebut tahap Pre-Processing.

4. Selection, data yang berada di warehouse, selanjutnya di seleksi berdasarkan suatu atribut yang  memiliki rujukan atau berdasarkan hasil uji statistik. Hal tersebut biasanya disebut Task-Relevant. Perlu diketahui dalam tahapan ini, data yang ada bisa bertransformasi berdasarkan atribut yang  dibutuhkan dalam memproses data.

5. Data Mining, tahapan ini sudah menggunakan algoritma dalam mengolah data-data tersebut berdasarkan teknik yang dipilih (Klasifikasi,Klustering, Asosiasi)

6. Pattern Evaluation, setelah mengolah data tersebut, maka diperolehlah hasil berupa suatu pola untuk diamati statistik pola tersebut.

7. Knowledge, setelah mengamati pola hasil mengolah data maka di dapatkan suatu informasi atau pengetahuan

Tahapan diatas biasa disebut dengan KDD (Knowledge Discovery in Database). Hal terpenting yang dilakukan dalam data mining yaitu mengetahui data yang akan di mining atau yang akan diolah. Untuk mengetahui data yang akan diolah bisa dengan mengetahui objek data dan tipe atribut, deskripsi statistik dasar data, visualisasi data, dan mengukur kesamaan dan ketidaksamaan suatu data. Atribut, merepresentasikan karakter atau ciri-ciri dari objek data tersebut. Adapun beberapa tipe dari atribut yaitu :

1. Nominal, atribut yang digunakan untuk kategori, keadaan, status perkawinan, pekerjaan atau nama benda.

Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline