Di dunia modern ini dibutuhkan banyak sekali hal-hal yang berhubungan dengan teknologi dan juga dengan pengolahan data. Menurut Arikunto (2002), data merupakan segala fakta dan angka yang dapat dijadikan bahan untuk menyusun suatu informasi, sedangkan informasi adalah hasil pengolahan data yang dipakai untuk suatu keperluan.
Menurut H. J. Sriyanto, data adalah suatu keterangan atau informasi tentang objek penelitian. Dalam dunia modern ini juga kita mengenal data science, data science adalah penggalian atau bisa juga disebut mengekstrak data agar dapat difilter serta didapatkan data yang benar untuk menghasilkan produk data yang sebenar-benarnya.
Menurut Chikio Hayashi dari Institut Statistika Matematika Sakuragaoka, pengertian data science adalah ilmu pengetahuan interdisiplin tentang metode komputasi untuk mendapatkan wawasan berharga yang dapat ditindaklanjuti dari kumpulan data yang mencakup tiga fase yaitu desain data, mengumpulkan data, dan analisis data. Data science atau ilmu data merupakan ilmu terapan baru yang perkembangannya dituntut oleh meningkatnya penggunaan teknologi secara signifikan.
Dengan semakin berkembang dan banyaknya data-data pada suatu platform atau aplikasi serta website membuat data tersebut semakin besar, maka era saat ini disebut juga era Big Data.
Big data adalah istilah yang menggambarkan volume besar data – baik terstruktur maupun tidak terstruktur – yang membanjiri bisnis sehari-hari. Namun bukan jumlah data yang penting. Apa yang dilakukan organisasi dengan data itulah yang penting.
Disebut sebagai big data karena konten yang diolah oleh seorang Data Scientist ini berukuran besar dan Pengolahan Big Data inilah yang nantinya akan menghasilkan sebuah model yang bagus dan sesuai kebutuhan pengguna.
Data scientist adalah pekerjaan dalam bentuk penggabungan ilmu komputer (pemrograman), statistik, dan matematika yang bertujuan untuk mengumpulkan, menafsirkan, dan menganalisis kumpulan data besar yang terstruktur dan tidak terstruktur. Seorang data scientist mempunyai sebuah tanggung jawab yang besar dalam pengolahan data-data tersebut.
Seorang data scientist bisa diibaratkan seperti koki yang mengelola bahan mentah (data), menjadi makanan (produk analisa data). Selain enak cita rasanya, di dalam makanan itu juga harus memiliki nutrisi yaitu (value informasi). Proses dalam data science bisa dikatakan sebagai proses memasak, seorang data analysis itu mencocokan mana yang sesuai.
Sebelum masak, si koki harus tahu dulu mau masak seperti apa. Apakah nasi goreng, soto ayam, rawon? Kalau sudah tahu mau masak apa, koki baru bisa menentukan bahan makanannya.
Mau masak nasi goreng, berarti harus nyiapin nasi, telor, ayam, kecap manis, kecap asin, dan lain-lain. Hal tersebutlah yang dilakukan oleh seorang data scientist dimana data scientist mereka harus tahu dulu, apa masalahnya pengolahan data tersebut, kalau sudah tahu dapat menggunakan telemetri atau data apa yang harus ada didalamnya.