Mohon tunggu...
Tasya Berlianiswah
Tasya Berlianiswah Mohon Tunggu... Mahasiswa - Mahasiswi Jurusan Teknik Informatika Fakultas Teknik Universitas Halu Oleo

Dream, Believe, and Make it happen

Selanjutnya

Tutup

Ilmu Alam & Tekno

Mengetahui Konsep dan Teknik Data Mining

28 September 2022   01:07 Diperbarui: 28 September 2022   01:19 182
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Dalam data mining, ada 3 teknik yang paling sering disebut atau sudah tidak menjadi asing lagi yaitu klasifikasi, klustering dan asosiasi. Namun sebelum itu, ada beberapa tahap yang untuk melakukan data mining yaitu :

1. Database, kumpulan data yang diambil dari berbagai sumber yang tersimpan di database baik relational ataupun non-relational.

2. Integration, setelah data didapatkan, selanjutnya menyatukan data tersebut atau menyamakan format data secara keseluruhan. Hal ini dilakukan karena data yang dikumpulkan dari tahap database, bisa saja  memiliki format yang berbeda-beda.

3. Cleaning, data yang formatnya telah sama,selanjutnya dilakukan pembersihan. Yang berarti dilakukan perbaikan terhadap data yang formatnya telah sama namun tidak memiliki nilai/ bersifat null atau memuat data yang tidak diperlukan. 

Yang kemudian setelah melalui ketiga proses tersebut, data di simpan di data warehouse. Dari tahap database -> Integration -> Cleaning -> Warehouse, tahapan tersebut disebut tahap Pre-Processing.

4. Selection, data yang berada di warehouse, selanjutnya di seleksi berdasarkan suatu atribut yang  memiliki rujukan atau berdasarkan hasil uji statistik. Hal tersebut biasanya disebut Task-Relevant. Perlu diketahui dalam tahapan ini, data yang ada bisa bertransformasi berdasarkan atribut yang  dibutuhkan dalam memproses data.

5. Data Mining, tahapan ini sudah menggunakan algoritma dalam mengolah data-data tersebut berdasarkan teknik yang dipilih (Klasifikasi,Klustering, Asosiasi)

6. Pattern Evaluation, setelah mengolah data tersebut, maka diperolehlah hasil berupa suatu pola untuk diamati statistik pola tersebut.

7. Knowledge, setelah mengamati pola hasil mengolah data maka di dapatkan suatu informasi atau pengetahuan

Tahapan diatas biasa disebut dengan KDD (Knowledge Discovery in Database). Hal terpenting yang dilakukan dalam data mining yaitu mengetahui data yang akan di mining atau yang akan diolah. Untuk mengetahui data yang akan diolah bisa dengan mengetahui objek data dan tipe atribut, deskripsi statistik dasar data, visualisasi data, dan mengukur kesamaan dan ketidaksamaan suatu data. Atribut, merepresentasikan karakter atau ciri-ciri dari objek data tersebut. Adapun beberapa tipe dari atribut yaitu :

1. Nominal, atribut yang digunakan untuk kategori, keadaan, status perkawinan, pekerjaan atau nama benda.

2. Binary, atribut nominal hanya dengan 2 keadaan yaitu 1 atau 0. Atribut binary terbagi menjadi 2 yaitu binary simetris yang berarti kedua nilai itu seimbang atau sejajar (salah satu nilai tidak lebih tinggi atau besar). Contohnya, gender. Kemudian ada binary asimetris yang berarti kedua nilai tidak sejajar atau kebalikan dari binary simetris. Contohnya, tes kesehatan positif/negatif.

3. Ordinal, atribut dimana nilai memiliki urutan atau peringkat tetapi besaran antar peringkat tidak diketahui. Contohnya, besar, sedang dan kecil.

4. Interval, atribut dimana nilai memiliki urutan dan diukur dengan suatu skala atau memiliki ukuran. Contohnya, suhu.

5. Ratio,  atribut yang berbicara tentang nilai sebagai urutan besarnya dibandingkan suatu hal yang menjadi pembandingnya. Contohnya, kalimat 'Saya berlari 3 kali lebih cepat dari kelinci'

Selain di atas, ada juga atribut diskrit dan atribut continuous. Atribut diskrit merupakan atribut yang memiliki batasan dan direpresentasikan dengan integer. Sedangkan, atribut continuous merupakan atribut yang berlanjut atau berubah-ubah direpresentasikan seperti variabel floating-point dan secara praktis hanya nilai real yang dapat diukur serta direpresentasikan dengan digit terbatas.

Selanjutnya, mengukur  tingkat kesamaan dan ketidaksamaan (Similarity and Dissimilarity) bisa menggunakan suatu konsep yaitu 0 dan 1 serta ukuran jarak. Jika diantara kedua benda (jaraknya) memiliki tingkat kesamaan yang sedikit artinya 0 sebagai titik minimum, dan jaraknya mendekati 0,maka kedua benda tersebut dapat dikatakan tidak memiliki kesamaan. Sedangkan, Jika diantara kedua benda (jaraknya)  memiliki tingkat kesamaan yang tinggi artinya 1 sebagai titik maksimum, dan jaraknya mendekati 1, maka kedua benda tersebut dapat dikatakan memiliki kesamaan.

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun