Berkolaborasi dengan Tokopedia.
Pengantar Data Analytics
Data analytics merupakan topik yang sedang ramai diperbincangkan pada saat ini. Hal itu ditunjukkan oleh tren pertumbuhan minat data analytics yang mengesankan selama satu dekade terakhir. Tentunya tren tersebut sejalan dengan perkembangan pesat big data dan teknologi informasi, di mana banyak perusahaan menghasilkan dan mengumpulkan data dalam jumlah besar dalam aktivitas bisnisnya. Data analytics berguna untuk menganalisis data-data yang dikumpulkan oleh perusahaan-perusahaan tersebut.
Secara definisi, data analytics adalah proses memeriksa, membersihkan, memanipulasi, dan memodelkan data dengan tujuan mencari informasi yang berguna, menarik kesimpulan, dan membantu pengambilan keputusan. Terdapat 4 jenis data analytics yang utama, yakni descriptive, diagnostic, predictive, serta prescriptive. Urutan ini menggambarkan tingkat kompleksitasnya, di mana descriptive analytics merupakan jenis yang paling sederhana. Sementara itu, prescriptive analytics merupakan jenis analisis yang paling kompleks karena tingkat kesulitan dan nilai dari informasi yang diperoleh paling tinggi.
Saat ini, data analytics dilibatkan dalam hampir seluruh elemen bisnis, baik oleh institusi swasta maupun publik. Ada pun profesi yang berperan melakukan data analytics adalah business analyst, data analyst, dan data scientist. Ketiga profesi tersebut melakukan pekerjaan dan tanggung jawab yang berbeda, didasarkan pada kemampuan yang dikuasai. Sebagai contoh, analisis descriptive dan diagnostic hanya memerlukan profesi business analyst dan data analyst. Sementara itu, analisis predictive memerlukan peran data analyst dan data scientist. Kemudian, untuk analisis prescriptive, data scientist lah satu-satunya peran yang melakukan pekerjaan pada tahapan tersebut.
Data analytics dapat digunakan saat sebuah organisasi atau entitas memiliki data points yang cukup. Data points adalah fakta atau informasi yang menggambarkan satu unit pengamatan, pada titik waktu tertentu, dan pada tingkat pengumpulan data tertentu. Syarat umum data points yang baik adalah akurat dan tepat, dengan demikian, informasi yang diperoleh harus berasal dari tiga urutan waktu, yaitu past, present, dan future, sehingga informasi yang diperoleh cukup untuk mendukung data analytics.
Lalu, mengapa data analytics menjadi penting? Data analytics memiliki banyak keunggulan, di antaranya adalah pengambilan keputusan yang lebih baik, operasi bisnis yang lebih cepat, perbaikan yang cepat dalam masalah operasional, serta respons yang cepat terhadap tren pasar yang ada. Di bidang akuntansi dan keuangan, data analytics dapat digunakan dalam berbagai upaya. Pertama, stock price prediction. Data analytics dilakukan untuk memprediksi nilai masa depan dari saham perusahaan atau instrumen keuangan lainnya agar berguna dalam menyusun perencanaan dan menghasilkan keuntungan di masa depan. Contoh metode data analytics yang dapat digunakan adalah analisis regresi. Kedua, customer satisfaction prediction. Data analytics dapat memprediksi seberapa puas pelanggan dengan produk, layanan, atau pengalaman bertransaksi. Salah satu pendekatan yang dapat digunakan adalah logistic regression yang merupakan jenis analisis statistik yang sering digunakan data analyst untuk pemodelan prediktif. Logistic regression juga dapat digunakan dalam prediksi lain, misalnya classification of fraudulent and non-fraudulent transactions. Ketiga, credit risk assessment. Data analytics memperkirakan kemungkinan adanya kerugian akibat kegagalan peminjam untuk membayar kembali utang mereka. Credit risk assessment dapat menggunakan machine learning sebagai metode analisis data yang mengotomatiskan pembuatan model analitik.
Proses Pengumpulan dan Pengolahan Data Analitik
1. Ekstraksi Raw Data (Data Mentah)
Sebelum melakukan proses lebih lanjut, penting untuk memahami raw data terlebih dahulu. Sebagai contoh, pada detail transaksi cashless yang ditandai dengan status penipuan/fraud, hal yang penting untuk dipahami adalah persentase kebenaran dari status penipuan atau fraud tersebut. Terkadang status penipuan/fraud pada set data terjadi hanya karena sensitivitas teknologi.
2. Mengimpor Sumber Data yang Diperlukan