Banyak orang berkata bahwa perkembangan zaman telah menghapus banyak lapangan pekerjaan. Namun sebaliknya, yang terjadi adalah perkembangan zaman malah memunculkan berbagai profesi baru. Salah satunya adalah profesi Data Scientist.
Data Scientist adalah sebuah profesi yang menggabungkan ilmu komputer atau pemrograman, statistika, dan matematika. Keempat ilmu tersebut nantinya diperlukan dalam pengumpulan hingga pengolahan data. Tujuan akhir dari pekerjaan seorang Data Scientist adalah menghasilkan sebuah keputusan atau strategi yang tepat.
Data yang diolah oleh seorang Data Scientist biasanya berukuran besar, variatif, dan memiliki kecepatan transfer yang tinggi. Inilah yang disebut Big Data. Big Data berisi informasi yang terstruktur maupun tidak terstruktur. Pengolahan Big Data inilah yang nantinya akan menghasilkan sebuah model yang bagus dan sesuai kebutuhan pengguna.
Sekarang kita akan membahas apa saja yang dilakukan oleh seorang Data Scientist agar dapat menghasilkan sebuah program yang sesuai dengan kebutuhan penggunanya. Jadi, di dalam data sains ada yang dinamakan siklus data. Siklus data terdiri dari beberapa tahapan yang akan dilakukan terus-menerus agar kita mendapatkan model yang terbaik. Pada umumnya Data Scientist akan melalui tahap discovery, data preprocessing, model planning, model building, communicate results, dan operationalize.
Pada tahap pertama yaitu discovery, seorang Data Scientist akan menemukan dan mengenali masalah yang ada. Setelah itu akan dilakukan pengumpulan data yang sesuai dengan kebutuhan. Model yang bagus dihasilkan dari data yang banyak, bervariatif, dan berkualitas. Selanjutnya kita akan masuk ke tahap data preprocessing, dimana data yang telah dikumpulkan akan dirapikan hingga menjadi data yang siap diolah. Setelah itu kita dapat masuk ke tahap model planning. Pada tahap ini kita harus merencanakan model seperti apa yang akan kita buat. Jika rencana sudah matang maka kita dapat masuk ke tahap model building. Di tahap ini kita akan mulai membuat pemodelan. Proses ini dapat diulang hingga kita mendapat model yang paling bagus dan sesuai untuk pengguna. Selanjutnya kita akan melakukan tahap communicate result dan operationalize, dimana model akan disampaikan ke pengguna lalu akan digunakan sesuai kebutuhan pengguna.
Setelah memahami siklus data, kita dapat menyimpulkan bahwa hal yang dilakukan oleh seorang Data Scientist adalah menemukan dan mengenali masalah yang ada, lalu mengumpulkan data dan mengolahnya menjadi model yang bagus. Setelah itu akan dilakukan pengujian pada model tersebut dan ketika model sudah dirasa cukup baik, model tersebut akan digunakan sesuai dengan keperluan pengguna.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H