Lihat ke Halaman Asli

KDD dan Atribute Dalam Data Mining

Diperbarui: 28 September 2022   11:05

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa digunakan dalam melakukan data mining. Knowlegde Discovery in Databases (KDD) adalah sekumpulan proses untuk menggali dan menganalisis sejumlah besar himpunan data dan mengekstrak informasi dan pengetahuan yang berguna. KDD meliputi keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat, dan dapat dimengerti

Tahapan proses KDD meliputi Data Cleaning, Data Integration, Data Selection, Data Transformation, Data Mining, Pattern Evaluation, Knowledge Presentation.

  • Data Cleaning                  :   mengecek dan membersihkan data yang tidak sesuai
  • Data Integration              :   menggabungkan berbagai macam sumber data.
  • Data Selection                 :   memilih data yang relevan (dari database) dengan "analysis task".
  • Data Transformation       :              transformasi atau konsolidasi data ke dalam bentuk yang lebih baik untuk mining, dengan mewujudkan operasi-operasi summary dan aggregation.
  • Data Mining                     :   mengekstrak patterns dari data dengan menerapkan "intelligent methods".
  • Pattern Evaluation          :   mengidentifikasi sejumlah pola yang sungguh-sungguh menarik dan bakal menjadi pengetahuan berdasarkan sejumlah pengukuran ketertarikan (interestingness measures) seperti rule support dan rule confidence untuk rule extraction.
  • Knowledge Presentation  :   penggunaan teknik-teknik visualisasi dan representasi untuk menyajikan pengetahuan yang telah diperoleh kepada user.

Itulah tahapan dalam Knowledge Discovery in Database Process (KDD), dalam melakukan pengolahan data/ Data mining kita harus mengetahui karakteristik dari objek data tersebut inilah yang dinamakan atribut. Atribut merupakan sifat/karakteristik dari suatu objek yang nilainya bias beragam, adapun macam macam atribut data sebagai berkikut :

Nominal

  • Nominal merupakan atribute yang memberikan nilai untuk membedakan antara satu objek dan objek lainnya, atribut ini berupa nama benda atau bias juga berupa simbol contohnya : nama orang, NIK , warna rambut.

Binary

  • Binary adalah jenis atribut yang hanya menyediakan nilai 0 dan 1 jadi hanya terdapat 2 kemungkinan mutlak yes/no dan true/false contohnya : gender/jenis kelamin. Dalam atribute binary terbagi menjadi dua jenis lagi yaitu simetris dan asimetris
    • Simetris artinya kedua nilai memiliki kedudukan yang sama contohnya gender (laki laki/ perempuan)
    • Asimetris artinya kedua nilai tidak memiliki kedudukan yang sama contohnya : Hasil (lulus dan gagal)

Ordinal

  • Ordinal merupakan atribut data yang nilai dari atributnya berupa  ranking yang bias dibandingkan dengan tingkatannya Contohnya : ukuran ( kecil, sedang, besar).

Numerik

  • Numerik merupakan jenis atribut data yang berisi bilangan bulat ataiu bilangan riil, atribut ini terbagi lagi menjadi dua jenis yaitu interval dan rasio :
    • Interval atribut ini tidak memiliki nilai referensi atau titik 0 contohnya : tanggal kalender, temperatur dalam celcius dan faranheit.
    • Rasio atribut ini memiliki nilai referensi atau titik 0 tetap. Jika pengukuran berdasarjan rasio kita dapat mengatakan tentang nilai sebagai urutan besarnya lebih besar dari unit pengukuran yang bias diperbandingkan (10 K dua kali lebih tinggi dari 5 K).

Itulah tadi penjelasan singkat mengenai Knowledge Discovery in Database Process  Dan Atribut Dalam Data Mining, Terimakasih telah membaca semoga bermanfaat  (-_-).




BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline