Semua Orang Berbohong, Bisakah Big Data Dipercaya?

Orang-orang berbohong kepada temannya, kepada atasannya, kepada keluarganya, bahkan kepada dirinya sendiri. Orang-orang mungkin cuma jujur kepada mesin pencari.
 
Itulah premis pembuka Davidowitz dalam pembuka buku Everybody Lies. Itu ungkapan yang kuat karena: selain banyak benarnya, juga membuat saya tersindir malu.
 
Bukti bahwa setiap orang cenderung berbohong dia uraikan dengan panjang lebar. Dia misalnya, menunjukkan bahwa saat mengisi survei orang cenderung membuat jawaban yang membuatnya tampak baik.
 
Di Facebook, lebih gila lagi. Di media sosial ini orang cenderung menunjukkan bahwa hidupnya sempurna. Yang dipamerkan adalah keluarga dalam pose senyum sumringah, mobil baru, buku, majalah terpelajar, juga lokasi jalan-jalan yang aduhai.
 
Sementara, jarang orang yang punya keberanian memamerkan bacaan cabulnya, tagihan kartu kreditnya, atau stroke cicilan KPR-nya yang aduhai itu.
 
Lha, kalau setiap saat orang bohong, kapan dia bersikap jujur?
 
Sebagai ilmuwan data, Davidowitz percaya bahwa serum kebenaran ada di jejak mesin pencarian.
 
Ketika menggunakan mesin pencari di internet, orang merasa tidak diawasi dan tidak mendapat sanksi apa pun. Karena itulah, orang akan mencari sesuatu yang benar-benar diinginkannya.
 
Ketika menggunakan mesin pencari, orang cenderung jujur. Pria-pria sok alim tak ragu mencari gambar porno melalui gadget yang dipegangnya. Orang terpelajar mencari joke rasis. Para suami mencari cara membesarkan penis sebagaimana perempuan khawatir payudaranya terlalu kecil.
 
Aktivitas di internet itulah yang membuat data pencarian bisa mengungkap sifat asli masyarakat. Sementara survei tradisional cenderung tidak akurat karena bias dan datanya terlampau kecil, data pencarian unggul karena datanya mengalir terus setiap saat.
 
Data raksasa yang dihimpun memungkinkan peneliti mengungkap watak aslin masyarakat dengan cara yang benar-benar baru.
 
Davidowitz berpendapat, ada empat keunggulan yang membuat big data akan membuat masyarakat memandang dunia dengan cara yang berbeda.
 
Pertama, big data menawarkan jenis-jenis data yang baru. Misalnya, untuk menguji kebenaran teori Sigmun Freud tentang hasrat inses, tersedia data di situs-situs porno. Pencarian yang berkaitan dengan hubungan keluarga (inses) ternyata salah satu yang paling popular.
 
Kedua, menyediakan data yang jujur. Itu karena para penyumbang data adalah orang yang merasa dirinya tidak diawasi dan tidak mendapat intensif apa pun atas pencariannya di internet.
 
Ketiga, memungkinkan peneliti memfokuskan pada subhimpunan kecil data. Misalnya, dengan data yang cukup, peneliti bisa menemukan data mengenai orang yang pernah bermimpi makan mentimun. Dalam survey tradisional, data-data itu nyaris tidak dipikirkan untuk digali.
 
Keempat, memungkinkan peneliti melakukan eksperimen sebab-akibat. Dengan data realtime di tangan, seorang peneliti bisa langsung menggunakan data untuk uji coba.
 

Melimpah, Belum Tentu Bermakna

 
Dalam industri global, data sudah menjadi asset yang amat berharga. Perusahaans eperti Amazon.com menjadi perintis data mining.
 
Perusahaan besutan Jeff Bezos itu mampu menghimpun data pengunjungnya dengan sangat rapi dan akurat. Karena itulah, mesin cerdas yang mereka miliki bisa mengenali keinginan seseorang melebihi orang itu sendiri.
 
Perusahaan seperti Gojek dan Grab jelas memiliki data melimpah. Perusahaan itu punya data ke mana kita pergi, jam berapa, juga makanan yang paling sering kita pesan.
 
Namun raja diraja dari data digital yang sebenarnya adalah Google. Perusahaan itu memnghimpun aktivitas pencarian selama puluhan tahun. Dengan data itu, Google bahkan diramalkan akan segera menjadi “pemerintahan” paling efektif di dunia.
 
Pemerintah Amerika perlu dua minggu untuk menghumpun statistic pengangguran. Google bisa melakukannya dalam beberap hari. Kementerian Kesehatan perlu beberapa bulan untuk mengidentifikasi wabah flu.
 
Google cuma perlu beberapa jam. Polisi lalu lintas perlu puluhan personel untuk merekayas lalu lintas. Google Cuma perlu beberapa baris kode di aplikasi peta yang dimilikinya.
 
Data raksasa (big data) memiliki makna bukan hanya karena ukurannya, tapi juga sifatnya yang dinamis.
 
Tapi tidak setiap pihak yang punya data raksasa bisa mengambil manfaat darinya. Untuk membuatnya bermanfaat, orang perlu cara paling baik untuk membacanya. Itu yang paling penting.
 

Kaya Data, Kurang Konseptual

Latar belakang Davidowitz sebagai ilmuwan data yang pernah bekerja sama denganGoogle membuatnya memiliki data melimpah.
 
Di buku ini dia mengulas hal-hal besar dari pemilihan presiden Amerika, wabah penyakit, hingga hal-hal kecil: kencan pertama.
 
Dengan data yang ada, Davidowitz bisa menyimulkan kata-kata apa yang menjadi pertanda bagi pasangan yang nyaman pada kencan pertama dan menginginkan kencan kedua.
 
Meski bisa pamer data yang melimpah, Davidowitz cenderung tidak mengimbanginya dengan gagasan-gagasan yang konseptual. Di sebagian besar bab bukunya, dia menguraikan data yang dimiliki dan bagaimana mengintepretasinya.
 
Tapi dia tidak cukup mendalam mempersoalkan bagaimana data besar itu akan berdampak pada masyarakat. Wawasan sosiologis dan filosofisnya tampak tidak seimbang mengimbangi kekayaan data gigantiknya.
 
Rahmat Petuguran
Pemimpin Redaksi PORTALSEMARANG.COM
Dosen Bahasa Indonesia Universitas Negeri Semarang

 

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.