Setiap kali Anda mengklik “Identifikasi lampu lalu lintas” atau “Pilih semua zebra cross” di halaman web, Anda mungkin mengira bahwa Anda hanya membuktikan bahwa Anda bukan robot. Tetapi sebenarnya, Anda sedang memberi label data latihan secara gratis untuk sistem AI Google. Hal ini berlangsung selama lebih dari 15 tahun, melibatkan ratusan juta pengguna di seluruh dunia, dan akhirnya membangun kemampuan pengenalan visual Google Maps serta perusahaan mobil otonom Waymo yang kini bernilai hingga 45 miliar dolar AS. Sepanjang proses ini, tidak ada yang meminta izin Anda, tidak ada yang memberi tahu kebenarannya, dan tidak ada yang membayar Anda satu pun.
@sharbel
Dikompilasi oleh: Big Clamp | PANews Lobster
500.000 jam kerja manusia gratis. Setiap hari. Dari mereka yang mengira bahwa mereka hanya login ke rekening bank.
reCAPTCHA adalah aksi pengambilan data tersembunyi paling sukses dalam sejarah internet. Pada masa puncaknya, 200 juta orang menyelesaikan verifikasi ini setiap hari. Hampir tidak ada yang tahu apa sebenarnya yang mereka bangun.
Waymo—perusahaan mobil otonom di bawah Google—sekarang bernilai 45 miliar dolar AS. Sebagian besar data pelatihan penting berasal dari Anda. Gratis. Dari setiap situs web yang pernah Anda kunjungi.
Berikut adalah kisah lengkapnya.
Tahun 2000, robot spam sedang menghancurkan seluruh internet. Forum-forum dipenuhi spam, kotak masuk penuh sesak. Situs web sangat membutuhkan cara untuk membedakan manusia dan mesin.
Profesor dari Carnegie Mellon University, Luis von Ahn, memecahkan masalah ini. Ia menciptakan CAPTCHA: sebuah teks yang terdistorsi yang hanya bisa dibaca oleh manusia. Robot tidak bisa melewati, manusia bisa.
Namun, von Ahn melihat lebih banyak kemungkinan. Jutaan orang menghabiskan energi kognitif mereka untuk verifikasi ini. Bagaimana jika energi itu bisa digunakan untuk dua hal sekaligus?
Pada tahun 2007, ia meluncurkan reCAPTCHA. Keunggulannya: bukan menampilkan karakter acak yang tidak terbaca, melainkan dua kata. Salah satunya sudah diketahui sistem, yang lainnya berasal dari buku yang dipindai secara nyata dan belum bisa dikenali komputer. Jawaban Anda membantu proses digitalisasi.
Buku-buku ini berasal dari arsip The New York Times dan Google Books—meliputi hingga 130 juta judul buku.
Anda mengira sedang login, padahal sebenarnya Anda sedang melakukan OCR (Optical Character Recognition) untuk perpustakaan digital terbesar di dunia.
Pada tahun 2009, Google mengakuisisi reCAPTCHA.

Era teks terdistorsi berakhir sekitar tahun 2012.
Google menghadapi masalah baru. Mobil pengambil gambar Street View sedang merekam setiap jalan di bumi, tetapi foto-foto itu hanyalah data mentah. Agar AI benar-benar berguna, ia harus memahami apa yang “dilihat” oleh kamera: rambu lalu lintas, zebra cross, lampu lalu lintas, papan nama toko.
Maka Google merancang ulang reCAPTCHA v2. Verifikasi berubah dari teks terdistorsi menjadi grid gambar: “Klik semua kotak yang berisi lampu lalu lintas.” “Pilih semua zebra cross.” “Identifikasi papan nama toko.”
Gambar-gambar ini langsung diambil dari Street View Google.
Setiap klik Anda adalah anotasi. Setiap pilihan memberi tahu model visi komputer Google: bagian piksel ini adalah lampu lalu lintas, bentuk ini adalah zebra cross.
Anda bukan sedang diuji, Anda sedang membangun dataset.

Pada masa puncaknya, 200 juta reCAPTCHA diselesaikan setiap hari.
Setiap verifikasi membutuhkan sekitar 10 detik, berarti ada 2 miliar detik kerja manusia setiap hari—setara dengan 500.000 jam kerja gratis setiap hari.
Harga pasar untuk anotasi data profesional berkisar antara 10 hingga 50 dolar AS per jam. Dengan harga terendah, itu berarti: nilai kerja yang diekstraksi secara gratis setiap hari mencapai hingga 5 juta dolar AS.
Dan reCAPTCHA tidak hanya ada di satu aplikasi. Ia tersebar di setiap bank, portal pemerintah, platform e-commerce, dan halaman login di seluruh internet. Anda tidak punya pilihan. Ingin mengakses akun Anda? Harus memberi label dataset terlebih dahulu.
Google tidak pernah menanyakan pendapat Anda, tidak pernah membayar Anda, bahkan tidak pernah memberi tahu Anda tentang hal ini.

Data ini langsung dikirim ke dua produk.
Google Maps. Alat navigasi paling banyak digunakan di dunia. Kemampuannya membaca rambu lalu lintas, menandai lokasi bisnis, memahami geografi kota, sebagian besar dibangun dari miliaran anotasi manual yang dilakukan oleh orang yang mencoba login ke situs.
Dan Waymo.
Waymo adalah proyek mobil otonom Google, yang menjadi anak perusahaan independen pada 2016. Untuk navigasi aman, mobil otonom harus mengenali ribuan pola visual dengan tingkat akurasi mendekati sempurna: lampu lalu lintas, zebra cross, pejalan kaki, rambu parkir.
Data pelatihan nyata yang dibutuhkan untuk pengenalan ini? Dikumpulkan dari jutaan orang yang menyelesaikan reCAPTCHA—tanpa mereka tahu.
Pada tahun 2024, Waymo telah menyelesaikan lebih dari 4 juta perjalanan berbayar, beroperasi di San Francisco, Los Angeles, dan Phoenix, dan terus berkembang. Valuasinya mencapai 45 miliar dolar AS.
Fondasi gedung ini dibangun oleh pengguna internet gratis yang hanya ingin mengirim email.
Biaya anotasi data sangat tinggi. Perusahaan seperti Scale AI, Appen, Labelbox, satu-satunya tujuan mereka adalah mengatasi masalah ini. Mereka mempekerjakan ratusan ribu pekerja untuk memberi label gambar, kadang dengan bayaran kurang dari satu dolar per jam.
Google menyelesaikan masalah ini dengan cara yang berbeda: mereka menjadikan anotasi sebagai keharusan. Tanpa bayaran, tanpa persetujuan, sebagai “biaya masuk” ke setiap situs web.
Hasilnya: puluhan miliar gambar yang sudah diberi label, tersebar di seluruh dunia, dalam berbagai kondisi cuaca, waktu, dan kota di seluruh bumi.
Tidak ada perusahaan anotasi lain yang mampu melakukan ini. Internet sendiri adalah pabriknya, dan setiap orang di dalamnya adalah pekerja yang tidak pernah menandatangani kontrak.

Pada 2018, Google meluncurkan reCAPTCHA v3 yang sama sekali tidak menampilkan tantangan verifikasi apa pun. Ia memantau cara Anda menggerakkan mouse, cara Anda menggulir halaman, durasi hover. Sidik jari perilaku Anda memberi tahu apakah Anda manusia.
Data perilaku ini juga dikirim kembali ke sistem AI Google.
Anda tidak pernah secara aktif memilih untuk bergabung, tidak ada kotak centang yang harus Anda tandai. Saat ini, di sebagian besar situs yang Anda kunjungi, Anda tetap melakukan hal ini.
Ide awal Luis von Ahn adalah langkah jenius: mengalihkan energi kognitif manusia yang selama ini digunakan untuk menyaring spam ke sesuatu yang bernilai—mendigitalisasi buku-buku dunia dan menyelesaikan masalah nyata.
Namun, penggunaan Google terhadap ide ini adalah hal yang berbeda.
Mereka mengambil mekanisme keamanan yang tidak memberi pilihan lain kepada pengguna, menempatkannya di seluruh internet, dan menuai hasilnya—membangun produk bisnis bernilai ratusan miliar dolar.
Pengguna tidak mendapatkan apa-apa, bahkan hak untuk tahu pun tidak.
Ironi terdalam adalah: Anda menghabiskan bertahun-tahun membuktikan bahwa Anda manusia—dengan melakukan pekerjaan pengenalan visual yang saat itu bahkan AI belum mampu lakukan. Tetapi begitu AI mampu, anotasi visual manusia menjadi tidak diperlukan lagi.
Anda membuktikan diri sebagai manusia, dengan cara membuat diri Anda dapat digantikan.
Sumber: Carnegie Mellon University, blog Google (2009), WebProNews, MakeUseOf, MIT Technology Review, dokumen terbuka Waymo.