Banyak orang telah membuat pernyataan-pernyataan besar tentang kedahsyatan big data, namun mereka kekurangan bukti. Oleh karena itu, menghimpun data sebanyak-banyaknya tentang masalah dunia adalah langkah pertama untuk memperbaikinya.
Bagi Seth Stephens-Davidowitz, dunia terlalu pelik dan terlalu kaya untuk data yang sedikit. Pada era big data, seluruh dunia adalah laboratorium. Buku Everybody Lies, Big Data dan Apa yang Diungkapkan Internet tentang Siapa Kita Sesungguhnya, merupakan bukti betapa dahsyatnya apa yang diungkap big data tentang kehidupan sehari-hari kita.
Seth Davidowitz merupakan mantan ilmuwan data di Perusahaan Google. Kini Seth Davidowitz penulis opini di New York Times. Tiap hari selama empat tahun Seth Davidowitz menjadi detektif data, menghimpun dan menganalisis informasi yang kita klik di mesin Google. Mulai dari penyakit jiwa, seksualitas manusia, penganiayaan anak, aborsi, agama, kesehatan, alat pengecil perut, sampai siapa saja yang rajin membuka situs porno.
Seth Davidowitz kemudian menyimpulkan bahwa Google adalah himpunan data paling penting dan jujur yang pernah dikumpulkan tentang hidup manusia.
Data digital sekarang menunjukkan kepada kita ada banyak hal tentang masyarakat manusia daripada yang menurut kita telah kita ketahui, memungkinkn kita memperoleh wawasan yang penting, bahkan revolusioner (hlm. 16).
Hasil-hasil yang tampak oleh kita mungkin merupakan warisan kekurangan sempurnaan metode pengumpulan data. Dan kebenaran mungkin berbeda, dan terkadang jauh lebih kelam.
Seth Davidowitz berani memastikan bahwa kebohongan telah berperan dalam kegagalan lembaga survei meramalkan kemenangan Donald Trump pada pemilihan presiden Amerika Serikat pada 2016.
Survei untuk mendapatkan data terstruktur, bersih, dan sederhana sudah berlalu. Pada era ini jejak-jejak tak beraturan ketika menjalani hidup menjadi sumber data yang utama dan lebih presisi.
Mesin Google memiliki banyak informasi yang terlewatkan oleh jajak pendapat yang dapat berguna dalam memahami responden. Orang bohong menjawab jajak pendapat, mungkin karena tidak nyaman.
Orang bisa berbohong kepada teman, kekasih, dokter, survei, dan diri sendiri. Namun di Google mereka memberikan informasi yang memalukan. Kita cenderung membesar-membesarkan relevansi pengalaman kita sendiri. Laki-laki, contohnya, selalu melebih-lebihkan jika ditanya tentang aktivitas sex bersama pasangan. Melebih-lebihkan jumlah kondom yang dipakainya selama satu pekan.
Ada lagi contoh menarik lain. Mari kita simak kebenaran tentang isu benci dan prasangka (rasial) di Amerika Serikat. Sejumlah besar warga kulit hitam Amerika merasa menjadi korban prasangka buruk, dengan bukti tentang diskriminasi dalam razia polisi, wawancara kerja, dan keputusan pengadilan. Di pihak lain, sedikit sekali orang Amerika Serikat yang mengaku bersikap rasis. Jadi siapa yang bisa dipegang kata-katanya?