Halo kawan – kawan bertemu lagi dengan artikel saya…di artikel kali ini saya akan menulis tentang Know Your Data! sebelum melakukan sebuah Mining Data. Ketika melakukan sebuah mining data ada baik nya terlebih dahulu kita mengetahui karaktekristik data kita itu seperti apa, atribut apa yang akan di pakai dalam melakukan mining data nantinya. Nah di artikel saya ini berisi penjelasan mengenai tipe data atau karakteristik data dan attribute yang sering digunakan dalam Data Mining. Enjoy it semoga bermanfaat kawanss…
Know Your Data berisi tentang bagaimana kita harus mengetahui dan juga mengenal terlebih dahulu mengenai data yang akan kita gunakan ketika kita ingin me-mining data. Adapaun tahapah – tahapan nya yaitu :
- Data Object
Data objek terbentuk dari kumpulan data, sebuah objek data mewakili sebuah entitas. Contohnya, databases dalam suatu universitas yang mana yang menjadi sebuah entitas nya atau tablenya adalah mahasiswa, matakuliah dan dosen. Data objek dideskripsikan mempunyai sebuah atribut. Pada sebuah databases, table atau entitas baris atau row disebut sebagai object data sedangkan kolom atau field disebut sebagai atribut.
- Atributtes Type
Atribut adalah sekumpulan data yang mewakili ciri dari sebuah object data. Berikut ini adalah jenis-jenis dari atribut yaitu:
-). Nominal
Merupakan atribut berupa kategori yang digunakan untuk membandingkan objek satu dengan yang lain, misal warna rambut,pekerjaan,status perkawinan dll.
-) Biner
Merupakan atribut pada nominal yang hanya memiliki 2 status yaitu (0 dan 1) yang mana 0 di repesentasikan sebagai negative dan 1 sebagai positif. Atribut biner memiliki yang namanya biner simteris dan biner asimetris. Contohnya digunakan untuk melakukan tes mediss seperti menentukan apakah seseorang telah terkena penyakit HIV apakah dia berstatus positif terjangkit hiv atau negative.
-) Ordinal
Merupakan atribut yang memiliki nilai urutan yang bermakna (peringkat) tetapi besarnya antara nilai yang berurutan tidak di ketahui. Misal, menentukan ukuran sebuah benda (besar,sedang,kecil).
-) Numeric
Merupakan atribut yang mempunyai nilai bilangan bulat atau riil. Atribut numeric terbagi menjadi 2yaitu rasio dan interval.
- Characteristic of structured Data
Hal – hal penting yang perlu di perhatikan dalam dari karakter sturuktur data yaitu :
-) Dimensionality
-) Sparsity
-) Resoution
-) Distribution
- Data Similarity dan Dissimilarity
Similarity atau kesamaan adalah ukuran numerik seberapa mirip dua sebuah object data. Nilai akan lebih tinggu ketika object lebih mirip di representasiakn dalam kisaran (0,1). Sedangkan dissimilarity atau ketidaksamaan adalah ukuran numerik tentang seberapa berbeda dua object data.
Mungkin begitu saja penjelasan mengenai dari hal-hal apa saja yang harus lebih di perhatikan ketika kita akan melakukan suatu mining data. Wait the next artikel...See youuu
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H