Setelah memahami konteks tersebut, kita akan beralih ke analisis mendalam menggunakan data penjualan dokumen standar untuk periode tahun 2023. Dengan bantuan Python, kita akan menyelidiki dan menganalisis data ini untuk menghasilkan informasi yang menarik dan berharga. Ini akan menjadi fokus utama analisis kita.
Python adalah bahasa pemrograman yang digemari oleh para analis data dengan berbagai pustaka (library) yang tersedia, untuk menggali informasi dari data ini. Meski Python memiliki banyak pustaka, kali ini kita hanya akan fokus pada empat di antaranya, yaitu sqlite3, pandas, matplotlib, dan seaborn. Sementara itu, data penjualan dokumen standar tersimpan dalam bentuk dokumen (file) SQL.
PERSIAPAN AWAL
Impor Pustaka
Sebelum kita memulai analisis data ini, mari kita siapkan peralatan kita. Pertama, kita akan membuka aplikasi Jupyter Notebook, ini adalah buku catatan digital (code editor) tempat kita bisa menulis dan menjalankan kode Python. Kemudian, kita akan mengimpor empat pustaka Python yang akan kita gunakan: sqlite3, pandas, matplotlib, dan seaborn.
Berikut adalah penjelasan singkat dari empat pustaka Python yang kita gunakan.
sqlite3 : Â pustaka ini digunakan untuk berinteraksi dengan basis data SQLite. SQLite adalah sistem manajemen basis data relasional ringan yang disimpan dalam satu dokumen. Pustaka sqlite3 memungkinkan kita untuk membuat koneksi dengan basis data SQLite, menjalankan perintah SQL, dan mengambil hasil.
pandas : pandas adalah pustaka Python yang menyediakan struktur data dan alat analisis data yang kuat dan fleksibel. Pandas memungkinkan kita untuk memanipulasi dan menganalisis data dengan mudah. Dua struktur data utama di pandas adalah Series (array satu dimensi dengan label) dan DataFrame (tabel dua dimensi dengan label baris dan kolom).
matplotlib : matplotlib adalah pustaka visualisasi data Python yang digunakan untuk membuat plot dan grafik 2D dan 3D. Dengan matplotlib, kita dapat membuat berbagai jenis visualisasi, termasuk histogram, scatterplot, barplot, dan banyak lagi.
seaborn : seaborn adalah pustaka visualisasi data Python yang dibangun di atas matplotlib. Seaborn memudahkan pembuatan plot yang lebih menarik dan informatif, dan juga menyederhanakan banyak jenis visualisasi yang lebih kompleks.