Berkolaborasi dengan Tokopedia.
Data analytics merupakan topik yang sedang ramai diperbincangkan pada saat ini. Hal itu ditunjukkan oleh tren pertumbuhan minat data analytics yang mengesankan selama satu dekade terakhir. Tentunya tren tersebut sejalan dengan perkembangan pesat big data dan teknologi informasi, di mana banyak perusahaan menghasilkan dan mengumpulkan data dalam jumlah besar dalam aktivitas bisnisnya. Data analytics berguna untuk menganalisis data-data yang dikumpulkan oleh perusahaan-perusahaan tersebut.
Secara definisi, data analytics adalah proses memeriksa, membersihkan, memanipulasi, dan memodelkan data dengan tujuan mencari informasi yang berguna, menarik kesimpulan, dan membantu pengambilan keputusan. Terdapat 4 jenis data analytics yang utama, yakni descriptive, diagnostic, predictive, serta prescriptive. Urutan ini menggambarkan tingkat kompleksitasnya, di mana descriptive analytics merupakan jenis yang paling sederhana. Sementara itu, prescriptive analytics merupakan jenis analisis yang paling kompleks karena tingkat kesulitan dan nilai dari informasi yang diperoleh paling tinggi.
Saat ini, data analytics dilibatkan dalam hampir seluruh elemen bisnis, baik oleh institusi swasta maupun publik. Ada pun profesi yang berperan melakukan data analytics adalah business analyst, data analyst, dan data scientist. Ketiga profesi tersebut melakukan pekerjaan dan tanggung jawab yang berbeda, didasarkan pada kemampuan yang dikuasai. Sebagai contoh, analisis descriptive dan diagnostic hanya memerlukan profesi business analyst dan data analyst. Sementara itu, analisis predictive memerlukan peran data analyst dan data scientist. Kemudian, untuk analisis prescriptive, data scientist lah satu-satunya peran yang melakukan pekerjaan pada tahapan tersebut.Â
Data analytics dapat digunakan saat sebuah organisasi atau entitas memiliki data points yang cukup. Data points adalah fakta atau informasi yang menggambarkan satu unit pengamatan, pada titik waktu tertentu, dan pada tingkat pengumpulan data tertentu. Â Syarat umum data points yang baik adalah akurat dan tepat, dengan demikian, informasi yang diperoleh harus berasal dari tiga urutan waktu, yaitu past, present, dan future, sehingga informasi yang diperoleh cukup untuk mendukung data analytics.
Lalu, mengapa data analytics menjadi penting? Data analytics memiliki banyak keunggulan, di antaranya adalah pengambilan keputusan yang lebih baik, operasi bisnis yang lebih cepat, perbaikan yang cepat dalam masalah operasional, serta respons yang cepat terhadap tren pasar yang ada. Di bidang akuntansi dan keuangan, data analytics dapat digunakan dalam berbagai upaya. Pertama, stock price prediction. Data analytics dilakukan untuk memprediksi nilai masa depan dari saham perusahaan atau instrumen keuangan lainnya agar berguna dalam menyusun perencanaan dan menghasilkan keuntungan di masa depan. Contoh metode data analytics yang dapat digunakan adalah analisis regresi. Kedua, customer satisfaction prediction. Data analytics dapat memprediksi seberapa puas pelanggan dengan produk, layanan, atau pengalaman bertransaksi. Salah satu pendekatan yang dapat digunakan adalah logistic regression yang merupakan jenis analisis statistik yang sering digunakan data analyst untuk pemodelan prediktif. Logistic regression juga dapat digunakan dalam prediksi lain, misalnya classification of fraudulent and non-fraudulent transactions. Ketiga, credit risk assessment. Data analytics memperkirakan kemungkinan adanya kerugian akibat kegagalan peminjam untuk membayar kembali utang mereka. Credit risk assessment dapat menggunakan machine learning sebagai metode analisis data yang mengotomatiskan pembuatan model analitik.
Proses Pengumpulan dan Pengolahan Data Analitik
1. Ekstraksi Raw Data (Data Mentah)
Sebelum melakukan proses lebih lanjut, penting untuk memahami raw data terlebih dahulu. Sebagai contoh, pada detail transaksi cashless yang ditandai dengan status penipuan/fraud, hal yang penting untuk dipahami adalah persentase kebenaran dari status penipuan atau fraud tersebut. Terkadang status penipuan/fraud pada set data terjadi hanya karena sensitivitas teknologi.
2. Mengimpor Sumber Data yang Diperlukan
Sumber data (contohnya python libraries) mungkin tidak hanya berguna untuk memiliki perhitungan yang canggih, tetapi juga dapat menyederhanakan baris kode (lines of code).
3. Memuat Dataset ke Phyton
Kegiatan ini bertujuan untuk mengunggah kumpulan data agar dapat dibaca oleh Phyton, sehingga data dapat dianalisis dan juga sebagai pemodelan pra-checking sebelum analisis data.
4. Pemeriksaan Awal Data Kasar: Kelengkapan Kolom
Kegiatan ini bertujuan untuk memastikan semua bidang yang dibutuhkan telah tersedia.
5. Pemeriksaan Data Kasar: Pemeriksaan Tipe Data
Kegiatan ini bertujuan untuk memastikan tipe data dari setiap kolom sudah benar. Contoh yang digunakan seperti INT atau FLOAT untuk angka dan STRING untuk teks.
6. Proses Pembersihan Data: Duplikat
Duplikat data dapat menyebabkan kelebihan data dibandingkan dengan yang sebenarnya.
7. Proses Pembersihan Data: Nulls - Query
Data nulls dapat menyebabkan data lebih rendah dibandingkan dengan yang sebenarnya.
8. Proses Pembersihan Data: Outliers - Percentile
Data outlier dipertimbangkan agar dapat dipahami jika data tersebut mungkin memiliki nilai yang terlalu jauh dari median.
9. Proses Pembersihan Data: Outliers - Skewness
Kemiringan (skewness) disebut sebagai kekurangan simetri. Suatu distribusi atau kumpulan data dapat dikatakan simetris jika terlihat sama pada bagian kiri dan kanan titik tengah.
10. Proses Pembersihan Data: Outliers - Kurtosis
Kurtosis adalah ukuran apakah data heavy-tailed atau light-tailed terhadap distribusi normal. Kumpulan data dengan kurtosis tinggi cenderung memiliki outlier.
11. Analisis Perilaku Data: Fitur - Korelasi (Pearson)
Fitur - Korelasi Pearson mengukur kekuatan hubungan linier antara dua variabel yang bernilai antara -1 sampai 1. Nilai -1 berarti korelasi linear negatif, 0 berarti tidak ada korelasi, dan +1 berarti korelasi linear positif.Â
Pemodelan Data dan Evaluasi Model
Pemodelan data dan evaluasi model menggunakan machine learning yang terdiri dari supervised learning dan unsupervised learning. Supervised learning dan unsupervised learning memiliki parameter masing-masing, diantaranya seperti process, input data, dan algorithms. Alur kerja machine learning dimulai dari pengumpulan data, pengolahan data, dan dilanjutkan dengan pemodelan data. Contoh pemodelan data adalah pemisahan dan uji data, pemilihan klasifikasi algoritma, dan pembuatan model dan prediksi. Pemodelan data dengan pemisahan dan uji data artinya memisahkan data menjadi data uji yang berguna untuk mengevaluasi kinerja machine learning dan mencegah overfitting. Pemodelan data dengan pemilihan klasifikasi algoritma dapat menggunakan Model Support Vector Machine (SVM). Setelah melakukan pemodelan data, hal yang akan dilakukan setelahnya adalah evaluasi model. Contoh evaluasi model seperti confusion matrix, evaluation metrics, dan result and select the best model. Evaluasi model dengan confusion matrix menggunakan tabel yang digunakan untuk mendefinisikan kinerja dari klasifikasi algoritma. Evaluasi model dengan evaluation metrics terdiri dari akurasi dan presisi yang memiliki definisi dan formulanya masing-masing. Sedangkan, evaluasi model dengan result and select the best model memilih model terbaik setelah masing-masing model dievaluasi berdasarkan kriteria yang dibutuhkan. Setelah proses evaluasi model selesai maka hal yang dilakukan selanjutnya adalah melakukan penyebaran (deployment).Â
Lulusan Akuntansi Harus Belajar Data Analitik?
Seorang lulusan jurusan akuntansi, baik dari universitas manapun, tentunya harus belajar data analytics. Namun, tidak semuanya mengenai data analytics harus dipelajari. Adapun beberapa yang harus dipelajari adalah tipe data dan metode analisis data. Secara umum, terdapat empat tipe data yang tersedia yaitu Nominal, Ordinal, Discrete, dan Continuous. Sedangkan, metode analisis data yang tersedia yaitu Descriptive, Diagnostic, Predictive, dan Prescriptive, seperti yang sudah dijelaskan sebelumnya. Kemudian, sebaiknya mempelajari peran dan tanggung jawab dari setiap profesi seperti Business Analyst, Data Analyst, Data Engineer, Data Scientist, Product Manager, Software Engineer, dan sebagainya. Selain itu, penting juga bagi seorang lulusan jurusan akuntansi untuk mempelajari kolaborasi antara tim data dan tim non-data, seperti Prioritization, Sprint Planning, dan Grooming.Â
DAFTAR PUSTAKA
Anand, A., & Bansal, G. (2016). Predicting Customer’s Satisfaction (Dissatisfaction) Using Logistic Regression. International Journal of Mathematical, Engineering and Management Sciences, 1(10.33889/IJMEMS.2016.1.2-009), 77-88.
Georgiev, G. (2020, June 8). Has Interest in Data Science Peaked Already? | by Georgi Georgiev. Towards Data Science. Retrieved July 31, 2022, from https://towardsdatascience.com/has-interest-in-data-science-peaked-already-437648d7f408
Gupta, A. (2022, January 18). Top Reasons Why Data Driven Analytics Interest Companies. Great Learning. Retrieved July 31, 2022, from https://www.mygreatlearning.com/blog/why-data-driven-analytics-interest-companies/
Hanna, K. T., & Wigmore, I. (2022, July). What is a data point? TechTarget. Retrieved August 1, 2022, from https://www.techtarget.com/whatis/definition/data-point
Ilafi, A. K., Jowanti, L., & Fadhilah, A. N. (2021, January 05). PEMANFAATAN BIG DATA DALAM MEMPREDIKSI HARGA SAHAM DI ERA NEW NORMAL. (Vol 2020 No 1 (2020): Seminar Nasional Official Statistics 2020). https://doi.org/10.34123/semnasoffstat.v2020i1.542
Nettleton, D. (2014). Pearson Correlation. Retrieved July 31, 2022, from https://www.sciencedirect.com/topics/computer-science/pearson-correlation
Rahmani, I. V. (2020, December 6). Membandingkan Empat Jenis Data Analytics. Laboratorium Analisis Data dan Rekaya Kualitas. Retrieved August 1, 2022, from https://lab_adrk.ub.ac.id/id/membandingkan-empat-jenis-data-analytics/
Sastrawan, G. M. A. (2008). ANALISIS MARKET SHARE INDEX TELKOMFlexi PADA KANDATEL MAKASSAR DI KOTA MAKASSAR. Thesis - S2, Universitas Hasanuddin.
Wang, J. J. (2021, July 23). The Importance of Data Analytics in Today's Business World. Australian National Institute of Management and Commerce. Retrieved August 1, 2022, from https://www.imc.edu.au/news-archive/the-importance-of-data-analytics-in-today-s-business-world
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H