Mohon tunggu...
Marsita Harim
Marsita Harim Mohon Tunggu... Mahasiswa - Mahasiswa Universitas Halu Oleo

Hobi saya membaca dan juga mendengarkan musik.

Selanjutnya

Tutup

Ilmu Alam & Tekno

Mengenal Data pada Data Mining

27 September 2022   08:06 Diperbarui: 11 Oktober 2022   13:28 545
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Suatu atribut terhitung tak hingga jika himpunan nilai yang mungkin tak terhingga tetapi nilainya dapat dimasukkan ke dalam korespodensi satu-satu dengan bilangan asli. 

Misalnya, ID pelanggan yang terhitung tak berbatas. Namun jumlah pelanggan tersebut kumpulan nilainya maish dapat dihitung. Jika suatu atribut tidak diskrit maka disebut atribut kontinu.

 Atribut kontinu dan atribut numerik sering kali digunakan secara bergantian dalam literatur. Atribut numerik berupa bilangan bulat sedangkan atribut kontinu berupa bilangan real.

2. Deskripsi Statistik Dasar Data

Pada proses data preprocessing penting untuk memiliki gambaran keseluruhan data agar proses ini berhasil. Deskripsi statistic dapat digunakan untuk mengidentifikasi properti data dan nilai data mana yang harus diperlakukan sebagai noise atau outlier. Adapun tiga bidang deksripsi statistic dasar, yaitu ukuran tendensi sentral, ukuran disperse data, dan tampilan grafisnya.

Pada ukuran tendensi sentral meliputi mean, median, dan modus. Kemudian ketika mengukur data disperse, ada yang namanya Quartiles, Inter-quartile range, five number summary, boxplot, outlier, variance, dan standard deviation. Untuk menampilkan tampilan grafis dari deskripsi statistic dasar, ada yang namanya quantile plot, quantile-quantile plots, histogram dan scatter plot.

3. Visualisasi Data

Bagaimana kita dapat menyampaikan data kepada pengguna secara efektif ? Untuk menjawab pertanyaan ini, kita dapat menggunakan visualisasi data. Dimana visualisasi data ini bertujuan untuk mengkomunikasikan data secara jelas dan efektif melalui representasi grafis. Visualisasi data ini telah sering digunakan di banyak aplikasi, misalnya ditempat kerja untuk pelaporan, pengelolaan operasi bisnis, dan kemajuan tugas. 

Selain itu teknik visualisasi ini juga popular untuk menemukan hubungan data yang tidak mudah diamati dengan hanya melihat data mentah. Teknik visualisasi data ada beberapa pendekatan secara representative, termasuk teknik piksel, teknik penilaian geometris, teknik berbasis ikon, dan teknik berbasis hierarki dan grafik.

4. Mengukur Persamaan dan Ketidaksamaan Data

Dalam pengaplikasian data mining, seperti clustering, analisis outlier, dan nearest-neighbor classification, kita memerlukan cara untuk menilai seberapa mirip atau tidaknya objek yang satu dengan yang lainnya. 

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun