Lihat ke Halaman Asli

Kenali Data Anda Sebelum Melakukan Mining Data

Diperbarui: 28 September 2022   12:19

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Sosbud dan Agama. Sumber ilustrasi: PEXELS

Halo kawan – kawan bertemu lagi dengan artikel saya…di artikel kali ini saya akan menulis tentang Know Your Data! sebelum melakukan sebuah Mining Data. Ketika melakukan sebuah mining data ada baik nya terlebih dahulu kita mengetahui karaktekristik data kita itu seperti apa, atribut apa yang akan di pakai dalam melakukan mining data nantinya. Nah di artikel saya ini berisi penjelasan mengenai tipe data atau karakteristik data dan attribute yang sering digunakan dalam Data Mining. Enjoy it semoga bermanfaat kawanss…

Know Your Data berisi tentang bagaimana kita harus mengetahui dan juga mengenal terlebih dahulu mengenai data yang akan kita gunakan ketika kita ingin me-mining data. Adapaun tahapah – tahapan nya yaitu :

  • Data Object

Data objek terbentuk dari kumpulan data, sebuah objek data mewakili sebuah entitas. Contohnya, databases dalam suatu universitas yang mana yang menjadi sebuah entitas nya atau tablenya adalah mahasiswa, matakuliah dan dosen. Data objek dideskripsikan mempunyai sebuah atribut. Pada sebuah databases, table atau entitas  baris atau row disebut sebagai object data sedangkan kolom atau field disebut sebagai atribut.

  • Atributtes Type

Atribut adalah sekumpulan data yang mewakili ciri dari sebuah object data. Berikut ini adalah jenis-jenis dari atribut yaitu: 

-). Nominal 

Merupakan atribut berupa kategori yang digunakan untuk membandingkan objek satu dengan yang lain, misal warna rambut,pekerjaan,status perkawinan dll. 

-) Biner 

Merupakan atribut pada nominal yang hanya memiliki 2 status yaitu (0 dan 1) yang mana 0 di repesentasikan sebagai negative dan 1 sebagai positif. Atribut biner memiliki  yang namanya biner simteris dan biner asimetris. Contohnya digunakan untuk melakukan tes mediss seperti menentukan apakah seseorang telah terkena penyakit HIV apakah dia berstatus positif terjangkit hiv atau negative. 

-) Ordinal 

Merupakan atribut yang memiliki nilai urutan yang bermakna (peringkat) tetapi besarnya antara nilai yang berurutan tidak di ketahui. Misal, menentukan ukuran sebuah benda (besar,sedang,kecil). 

-) Numeric 

Merupakan atribut yang mempunyai nilai bilangan bulat atau riil. Atribut numeric terbagi menjadi 2yaitu rasio dan interval.

  • Characteristic of structured Data

Hal – hal penting yang perlu di perhatikan dalam dari karakter sturuktur data yaitu : 

-) Dimensionality 

-) Sparsity

-) Resoution

-) Distribution

  • Data Similarity dan Dissimilarity

Similarity atau kesamaan adalah ukuran numerik seberapa mirip dua sebuah object data. Nilai akan lebih tinggu ketika object lebih mirip di representasiakn dalam kisaran (0,1). Sedangkan dissimilarity atau ketidaksamaan adalah ukuran numerik tentang seberapa berbeda dua object data.


Mungkin begitu saja penjelasan mengenai dari hal-hal apa saja yang harus lebih di perhatikan ketika kita akan melakukan suatu mining data. Wait the next artikel...See youuu

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H




BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline