Big data adalah sekumpulan penyimpanan data berskala besar yang bisa mendeteksi suatu aktivitas yang tidak wajar didalam bisnis dengan cepat dan tepat. Dari 2009 hingga 2011 jumlah data digital yang dibuat berlipat ganda, 90 persen dari data digital yang tersimpan di dunia saat ini telah dibuat dalam dua tahun terakhir saja (McKinsey, 2011). Setiap hari 294 miliar email dikirim, serta 1 miliar pencarian Google dan 230 juta tweet (Shilpa & Kaur, 2013). Hal ini menggambarkan pesatnya pertumbuhan volume data. Di sini data berarti seperangkat nilai variabel kualitatif atau kuantitatif, yang biasanya merupakan hasil pengukuran. Volume data mengacu pada jumlah tertentu yang dihasilkan.
Karakteristik data mencakup:
1. Analisis Bisnis
Data yang dihasilkan dari berbagai sumber dan datang dalam berbagai bentuk data. Bidang analisis data yang menganalisis data yang di mediasi proses disebut analisis data tradisional, juga disebut sebagai proses bisnis tradisional, yang pada gilirannya menghasilkan lebih banyak data yang di mediasi proses. Tiga kata sering digunakan untuk menggambarkan data besar. Ini adalah volume, variasi dan kecepatan.
a. Volume
Dengan munculnya data yang bersumber dari manusia dan yang dihasilkan oleh mesin, volume data meningkat dengan cepat, yang diukur oleh International Data Corporation.
b. Variasi
Selain peningkatan volume data, variasi sumber data dan format data juga meningkat. Pergeseran domain data yang di mediasi proses, dihasilkan mesin, dan bersumber dari manusia mengakibatkan pergeseran dari data terstruktur ke kombinasi data terstruktur, semi terstruktur, dan tidak terstruktur (McKinsey, 2011).
c. Kecepatan
Perkembangan teknologi teknologi instrumentasi menyebabkan peningkatan kecepatan di mana data dihasilkan dan menghasilkan aliran data yang konstan dan hampir real time (IBM, 2012).
2. Penciptaan Nilai