Hallo,, Teman-teman semuanya. Terima kasih karena sudah setia membaca dan mencari informasi dari jurnal saya ini.
Pada jurnal saya yang pertama menjelaskan tentang apa itu Data Mining serta pemanfaatannya dalam lingkungan sehari-hari. Nah, pada tulisan saya yang kedua ini, saya ingin mengajak kalian semua untuk lebih mengenali tentang macam-macam atribut yang ada dalam Data Mining, untuk lebih jelasnya mari kita simak sama-sama penjelasan singkat saya mengenai atribut yang ada dalam Data Mining.
Dalam sebuah data mining dapat digunakan untuk mengolah data dan untuk memperoleh sebuah keputusan dalam mengolah data, tentu perlu menggunakan mekanisme atau proses yang terjadi di dalamnya, yang biasa disebut dengan proses Knowledge Discovery in Database (KDD). KDD sendiri merupakan tahapan yang ada dalam data mining. Tahapannya antara lain:
- Database : Kumpulan data yang akan diolah.
- Data Integration : Tahapan penggabungan atau penyatuan database yang kemudian disimpan di tempat yang sama yaitu Data Warehouse.
- Data Cleaning : Tahapan yang berfungsi untuk memeriksa dan membersihkan data-data yang tidak sesuai dan kemudian dilakukan perbaikan.
- Data Transformation : Tahapan yang berfungsi mengubah data menjadi sebuah kategori. Misalkan dalam data hanya terdapat data tanggal lahir 12-03-2003, kemudian di trasnformasikan menjadi usia yaitu 19 Tahun.
- Data Selection : Tahapan yang berfungsi untuk seleksi data dan atribut apa saja yang akan digunakan nantinya.
- Data Mining : Tahapan untuk memasukkan algoritma apa yang akan digunakan apakah menggunakan Classfication, clustering atau association ).
- Pattern Evaluation : Tahapan untuk melakukan evaluasi terhadap pola yang digunakan.
- Knowledge : Tahapan akhir yang berfungsi untuk menampilkan hasil akhir dari proses pengolahan sebuah data sehingga dapat mudah dipahami.
Pengertian Atribut
Atribut dalam Data Mining merupakan data yang bisa mewakili suatu karakteristik ataupun fitur yang ada dalam suatu objek data. Sebagai contohnya, misalkan data suatu tabel Mahasiswa, berisi atribut-atribut, seperti Nama, NIM, Jurusan, Fakultas, dan lain-lain.
Jenis-Jenis Tipe Atribut
1. Nominal
Atribut tipe nominal adalah jenis atribut membedakan nilainya antara satu objek dengan objek yang lain. Biasanya memuat ketegori, status dan lain-lain. Contohnya :
warna_kulit : {putih,sawo matang, kuning langsat, hitam}.
warna_pelangi : {Merah, Jingga, Kuning, Hijau, Biru, Nila, Ungu} .
2. Binary
Atribut tipe Binary adalah jenis atribut yang menyediakan nilai berupa nilai boolean yang menyatakan dua kemungkinan yang mutlak dan kedua pilihan tersebut memiliki nilai yang sama penting atau berisi nilai benar atau salah.
contohnya :
Jenis_kelamin : {Laki-Laki, Perempuan}
3. Ordinal
Atribut tipe ordinal adalah jenis atribut yang nilainya menunjukkan adanya sebuah tingkatan atau urutan yang bermakna dalam hal ini termasuk peringkat .
contohnya :
ukuran_baju : {small, medium, large, extra large}
4. Numeric
Atribut tipe numeric adalah jenis atribut yang yang memiliki nilai bilangan bulat dan bilangan rill. Contohnya yaitu Usia.
Similarity dan Dissimilarity
Similarity dalam data mining merupakan ukuran numerik seberapa mirip kedua objek data tersebut . Sedangkan Dissimilarity merupakan ukuran numerik seberapa berbeda kedua data tersebut. konsepnya Similarity sama dengan Dissimilarity, kedua objek tersebut diukur menggunakan analogi jarak.
Nahh, itulah tadi penjelasan singkat saya mengenai KDD dan atribut dalam data mining, Terima kasih telah menyempatkan waktunya untuk berkunjung di artikel saya ;) ,,,,
SUMBER REFERENSI
Chapter 2 : https://hanj.cs.illinois.edu/bk3/bk3_slidesindex.htm
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H