Baru-baru ini ada kehebohan, konon Google tidak netral di Pilkada DKI Jakarta. Sampai ada yang mau menyomasi Google segala. Karena kalau dicari di Google "sungai bersih karena Foke" ternyata muncul saran "Did you mean sungai bersih karena Ahok". Padahal Foke setidak-tidaknya terlibat pada perancangan sungai bersih.
Masalah ini akhirnya merembet ke mana-mana. Konon Google pun mengatakan "Pluto bersih karena Ahok". Ada pula yang menemukan "Papua bersih karena Ahok". Bahkan "Jatah makan saya bersih karena Ahok". Waduh.
Sebagai orang yang cukup lama berkecimpung di dunia IT, walaupun lebih banyak sebagai tukang kompor, saya hanya bisa senyum-senyum soal ini. Karena saya juga tidak bisa menjelaskan dengan baik dan benar, he he he. Saya hanya tahu kalau Google sudah sangat merasuk ke dalam sendi-sendi kehidupan kita. Buktinya kalau pompa air Anda rusak, ke mana pun Anda melangkah, Anda akan ditawari iklan pompa air. Di situs-situs iklan pompa air dari berbagai merek muncul. Kalau Anda berada di dekat toko pompa, ada SMS nawarin pompa. Bila Anda memikirkan bikini, hari itu juga semua situs akan kompak menyajikan iklan bikini baik yang masih kosong maupun isi.
Google seolah mengerti sebelum diberi tahu. Kalau bahasa paranormal "weruh sadurunge winarah". Kesaktiannya tak kalah dengan Mbah Mijan, Ki Kusumo, Permadi dan bahkan Kanjeng Taat Pribadi. Google bisa mengerti banyak hal karena memang bisnis Google adalah mengumpulkan informasi. Dari segala macam sumber. Lalu mengantarkannya kepada yang butuh. Yang butuh itu bisa Anda sebagai pengunjung mesin pencari, sampai perusahaan yang menjual pompa air dan bikini.
Dari pengamatan saya, paling tidak Google akan mengumpulkan informasi dari hal-hal berikut:
- Crawling. Perayapan. Google secara periodik mengunjungi situs-situs di internet, merekam dan membangun catatan (index) tentang situs itu. Ini dilakukan secara otomatis, maka alatnya disebut sebagai robot. Robot Google biasa disebut Google Bot. Robot ini berupa software ya bukan robot fisik macam transformer.
- Google Analytics. Situs yang Anda kunjungi biasanya dipasangi software Google Analytics yang akan melaporkan aktivitas kunjungan Anda langsung ke server Google. Ini digunakan untuk merekam statistik pengunjung, oleh pemilik situs. Tapi data jelas lari ke Google dulu.
- Mesin pencari google.com itu sendiri. Setiap Anda mencari di google.com, google.co.id dll tentu Google dapat merekam aktivitas Anda.
- Media sosial. Aplikasi Google Chat misalkan, jelas dapat diingat oleh Google. Bukan tidak mungkin penyedia aplikasi chat tertentu bekerja sama dengan Google untuk merangkum data tentang Anda.
- Perangkat Android. Mengingat Android itu google banget, Google seperti menanam agen rahasia di saku Anda apabila Anda membawa Android. Terutama soal lokasi. Pergerakan Anda dapat direkam oleh Google dari perangkat GPS Anda.
- Jaringan internet. Saya tidak mendalami jaringan internet, namun saya rasa sistem seperti Google dapat memperoleh informasi aktivitas di jaringan internet. Misal, menghitung jumlah kunjungan ke suatu situs.
- Dan lain-lain.
Informasi ini adalah makanan yang ditelan oleh Google. Dari lautan informasi ini Google akan "mencerna" dengan berbagai cara. Misalkan, salah satu algoritma yang diperbincangkan adalah bagaimana Google menempatkan situs-situs pada halaman satu. Karena kalau situs ada di halaman satu, pengunjung banyak dan jualan laku. Berhubung Google dipengaruhi informasi dari luar, ada cara-cara untuk mendongkrak suatu situs supaya mendapat peringkat tinggi di Google. Ilmu ini sering disebut sebagai SEO (Search Engine Optimization).
Mengenai algoritma pemeringkatan di Google sudah banyak penjelasan beredar. Bahkan Google sendiri merilis panduan-panduan bagaimana membuat "Google senang". Akan tetapi yang tahu persis tentu ya programmernya sendiri terutama yang masih aktif.
Orang-orang selalu berusaha menebak perilaku algoritma Google. Saya membayangkan programmer-nya ketawa sendirian ketika hasil codingan-nya dijadikan bahan tebakan. Entah karena canggihnya, atau karena ia sudah lupa persisnya algoritma itu, ditimpa pekerjaan baru yang menyita pikiran.
Yang jelas karena sudah diidentikan dengan "kecanggihan", apa pun yang muncul di Google selalu dianggap canggih. Saya hanya berspekulasi, bisa saja suatu fitur di Google sebetulnya tidak canggih-canggih amat ataupun masih rintisan (versi beta). Dalamnya Google siapa yang tahu.
Kembali ke soal pencarian "sungai bersih" tadi. Persoalan ini ada pada domain "koreksi ejaan" atau "koreksi kalimat". Di sini ada algoritma juga, yakni bagaimana Google menyarankan perbaikan suatu kalimat.
Google Translate
Koreksi ejaan ini dapat dilihat jelas pada "Google Translate", yang bisa diakses di translate.google.com. Dengan cara menerjemahkan dari Indonesia ke Indonesia.