Suatu atribut terhitung tak hingga jika himpunan nilai yang mungkin tak terhingga tetapi nilainya dapat dimasukkan ke dalam korespodensi satu-satu dengan bilangan asli.Â
Misalnya, ID pelanggan yang terhitung tak berbatas. Namun jumlah pelanggan tersebut kumpulan nilainya maish dapat dihitung. Jika suatu atribut tidak diskrit maka disebut atribut kontinu.
 Atribut kontinu dan atribut numerik sering kali digunakan secara bergantian dalam literatur. Atribut numerik berupa bilangan bulat sedangkan atribut kontinu berupa bilangan real.
2. Deskripsi Statistik Dasar Data
Pada proses data preprocessing penting untuk memiliki gambaran keseluruhan data agar proses ini berhasil. Deskripsi statistic dapat digunakan untuk mengidentifikasi properti data dan nilai data mana yang harus diperlakukan sebagai noise atau outlier. Adapun tiga bidang deksripsi statistic dasar, yaitu ukuran tendensi sentral, ukuran disperse data, dan tampilan grafisnya.
Pada ukuran tendensi sentral meliputi mean, median, dan modus. Kemudian ketika mengukur data disperse, ada yang namanya Quartiles, Inter-quartile range, five number summary, boxplot, outlier, variance, dan standard deviation. Untuk menampilkan tampilan grafis dari deskripsi statistic dasar, ada yang namanya quantile plot, quantile-quantile plots, histogram dan scatter plot.
3. Visualisasi Data
Bagaimana kita dapat menyampaikan data kepada pengguna secara efektif ? Untuk menjawab pertanyaan ini, kita dapat menggunakan visualisasi data. Dimana visualisasi data ini bertujuan untuk mengkomunikasikan data secara jelas dan efektif melalui representasi grafis. Visualisasi data ini telah sering digunakan di banyak aplikasi, misalnya ditempat kerja untuk pelaporan, pengelolaan operasi bisnis, dan kemajuan tugas.Â
Selain itu teknik visualisasi ini juga popular untuk menemukan hubungan data yang tidak mudah diamati dengan hanya melihat data mentah. Teknik visualisasi data ada beberapa pendekatan secara representative, termasuk teknik piksel, teknik penilaian geometris, teknik berbasis ikon, dan teknik berbasis hierarki dan grafik.
4. Mengukur Persamaan dan Ketidaksamaan Data
Dalam pengaplikasian data mining, seperti clustering, analisis outlier, dan nearest-neighbor classification, kita memerlukan cara untuk menilai seberapa mirip atau tidaknya objek yang satu dengan yang lainnya.Â