Sumber data (contohnya python libraries) mungkin tidak hanya berguna untuk memiliki perhitungan yang canggih, tetapi juga dapat menyederhanakan baris kode (lines of code).
3. Memuat Dataset ke Phyton
Kegiatan ini bertujuan untuk mengunggah kumpulan data agar dapat dibaca oleh Phyton, sehingga data dapat dianalisis dan juga sebagai pemodelan pra-checking sebelum analisis data.
4. Pemeriksaan Awal Data Kasar: Kelengkapan Kolom
Kegiatan ini bertujuan untuk memastikan semua bidang yang dibutuhkan telah tersedia.
5. Pemeriksaan Data Kasar: Pemeriksaan Tipe Data
Kegiatan ini bertujuan untuk memastikan tipe data dari setiap kolom sudah benar. Contoh yang digunakan seperti INT atau FLOAT untuk angka dan STRING untuk teks.
6. Proses Pembersihan Data: Duplikat
Duplikat data dapat menyebabkan kelebihan data dibandingkan dengan yang sebenarnya.
7. Proses Pembersihan Data: Nulls - Query
Data nulls dapat menyebabkan data lebih rendah dibandingkan dengan yang sebenarnya.