pada artikel sebelumnya telah dijelaskan apa itu data mining, metode dan tujuan data mining. Dari artikel tersebut dapat diketahui bahwa data mining juga dikenal dengan istilah knowledge discovery from data yaitu pencarian pengetahuan yang sebelumnya tidak diketahui dan berpotensi digunakan di kemudian hari.
nah pada artikel ini akan dibahas karakteristik data, atribut dan proses mengolah data dari database hingga menghasilkan informasi sesuai kebutuhan.
Karakteristik Data
Dimensionality : karakteristik dataset yang mengolah data multi dimensional sehingga menyebabkan data yang diolah memiliki dimensi yang besar dan usaha yang dilakukan juga semakin besar.
Sparsity : merupakan munculnya data yang kosong sehingga membuat titik-titik jarang pada pola.
Resolution : skala dan resolusi pada data
Distribution : sifat penyebaran data atau jarak dari data tersebut.
Atribut Data
Nominal :Â Nilai atribut berupa nominal pemberian nama.
Binary  : nilai atribut yang hanya berupa 2 niilai mutlak.Â
Numerik : nilai atribut yang memiliki nilai bilangan bulat atau bilangan riil.