Cada vez que haces clic en “Reconocer semáforo” o “Seleccionar todos los pasos peatonales” en una página web, piensas que solo estás demostrando que no eres un robot. Pero en realidad, estás etiquetando datos de entrenamiento para el sistema de IA de Google de forma gratuita. Esto ha durado más de 15 años, involucrando a cientos de millones de usuarios en todo el mundo, y ha permitido construir la capacidad de reconocimiento visual de Google Maps y la empresa de conducción autónoma Waymo, valorada en 45 mil millones de dólares. En todo este proceso, nadie te pidió permiso, nadie te contó la verdad, y nadie te pagó un centavo.
原文:@sharbel
编译:大钳子 | PANews 龙虾 50万小时 de trabajo manual gratuito. Todos los días. Contribuido por aquellos que creen que solo están ingresando a su cuenta bancaria.
reCAPTCHA es la acción de recolección de datos encubierta más exitosa en la historia de Internet. En su apogeo, 200 millones de personas la completaban cada día. Casi nadie sabe realmente qué están construyendo.
Waymo, la compañía de autos autónomos de Google, ahora valorada en 45 mil millones de dólares, obtiene una parte significativa de sus datos de entrenamiento de ti. Gratis. De cada sitio web que visitas.
Aquí está toda la historia.
En 2000, los bots de spam estaban destruyendo Internet. Los foros estaban saturados de spam, los buzones de correo colapsando. Los sitios web necesitaban urgentemente una forma de distinguir a humanos de máquinas.
El profesor de Carnegie Mellon, Luis von Ahn, resolvió este problema. Inventó CAPTCHA: un texto distorsionado que solo los humanos pueden leer. Los robots no podían pasar, los humanos sí.
Pero von Ahn vio más posibilidades. Millones de personas estaban gastando su energía cognitiva en estas verificaciones. ¿Y si esa energía pudiera usarse para hacer dos cosas a la vez?
En 2007, lanzó reCAPTCHA. La clave estaba en que no mostraba caracteres aleatorios, sino dos palabras: una conocida por el sistema, y otra proveniente de libros escaneados que la computadora aún no podía reconocer. Tu respuesta ayudaba a digitalizar esos libros.
Esos libros provenían del archivo del New York Times y de Google Books, que abarcaban hasta 130 millones de volúmenes.
Pensabas que solo ingresabas, pero en realidad estabas ayudando a Google a hacer OCR (Reconocimiento Óptico de Caracteres) para la mayor biblioteca digital del mundo.
En 2009, Google adquirió reCAPTCHA.

El era de los textos distorsionados terminó alrededor de 2012.
Google enfrentó un nuevo desafío. Los coches de Street View estaban capturando cada calle del planeta, pero las fotos eran solo datos en bruto. Para que la IA fuera realmente útil, necesitaba entender lo que “veía”: señales de tráfico, pasos peatonales, semáforos, carteles.
Así, Google rediseñó reCAPTCHA v2. La verificación dejó de ser texto distorsionado y pasó a ser una cuadrícula de imágenes: “Haz clic en todas las casillas que contienen semáforos.” “Selecciona todos los pasos peatonales.” “Reconoce los carteles.”
Estas imágenes provenían directamente de Street View.
Y cada clic que hacías era una etiqueta. Cada selección le decía al modelo de visión por computadora de Google: esta casilla es un semáforo, esta forma es un paso peatonal.
No estabas haciendo una prueba, estabas construyendo un conjunto de datos.

En su apogeo, 200 millones de reCAPTCHA se completaban cada día.
Cada verificación tomaba unos 10 segundos, lo que equivale a 2 mil millones de segundos de trabajo humano diario — ¡unas 500,000 horas diarias!
El mercado de la anotación de datos profesionales cobra entre 10 y 50 dólares por hora. Con el precio mínimo, eso significa que el trabajo gratuito extraído cada día equivale a hasta 5 millones de dólares.
Y reCAPTCHA no solo está en una aplicación, sino en cada banco, cada portal gubernamental, cada plataforma de comercio electrónico, cada página de inicio de sesión en Internet. No tienes opción. ¿Quieres acceder a tu cuenta? Primero, etiqueta datos.
Google nunca te consultó, nunca te pagó, ni siquiera te contó la verdad.

Estos datos se alimentan directamente a dos productos.
Google Maps. La herramienta de navegación más utilizada en todo el mundo. Su capacidad para leer señales, localizar negocios y entender la geografía urbana, en parte, se basa en miles de millones de anotaciones hechas por personas que solo querían ingresar a un sitio web.
Y también Waymo.
Waymo, el proyecto de autos autónomos de Google, se convirtió en una filial en 2016. Para navegar con seguridad, los autos necesitan reconocer casi a la perfección miles de patrones visuales: semáforos, pasos peatonales, peatones, señales de estacionamiento.
¿Y los datos de entrenamiento reales necesarios para esas capacidades? Son proporcionados por millones de personas que completan reCAPTCHA, sin saberlo.
En 2024, Waymo ha realizado más de 4 millones de viajes pagos, operando en San Francisco, Los Ángeles y Phoenix, y sigue expandiéndose. Su valoración actual es de 45 mil millones de dólares.
Y la base de todo esto la construyeron esos usuarios de Internet que solo querían enviar correos electrónicos, sin saberlo.
El costo de la anotación de datos es alto. Empresas como Scale AI, Appen, Labelbox existen precisamente para resolver este problema. Contratan a decenas de miles de trabajadores para anotar imágenes, a veces por menos de un dólar la hora.
Google resolvió esto de una forma radical: convirtió la anotación en algo obligatorio. Sin pagar, sin pedir permiso, solo como una “tarifa de entrada” para acceder a cada sitio web.
El resultado: billones de imágenes anotadas, en todo el mundo, en diferentes condiciones climáticas, en diferentes momentos del día, en cada ciudad del planeta.
Ninguna empresa de anotación puede hacer esto. Internet en sí mismo es esa fábrica, y cada persona en ella, un empleado sin contrato.

reCAPTCHA v3, lanzado en 2018, no muestra ningún desafío de verificación. Solo observa cómo mueves el ratón, cómo haces scroll, cuánto tiempo permaneces en una misma sección. Tu patrón de comportamiento le dice si eres humano.
Estos datos de comportamiento también se retroalimentan en el sistema de IA de Google.
Nunca elegiste participar, nunca hubo una casilla para marcar. Y en la mayoría de los sitios que visitas, sigues haciendo esto.
La idea original de von Ahn fue un acto de genialidad: redirigir la energía cognitiva que los humanos ya gastan en filtrar spam hacia algo valioso — digitalizar libros del mundo y resolver un problema real.
Pero la forma en que Google ha utilizado esa idea es otra historia.
Tomaron un mecanismo de seguridad que los usuarios no tenían opción de evitar, lo desplegaron en toda la web y cosecharon los resultados, creando productos comerciales valorados en cientos de miles de millones.
Los usuarios no obtuvieron nada, ni siquiera el derecho a saberlo.
La ironía más profunda es que: pasaste años demostrando que eres humano — haciendo trabajos de reconocimiento visual que la IA aún no podía hacer. Pero una vez que la IA aprendió esa tarea, la anotación visual humana se volvió innecesaria.
Demostraste que eres humano, de la forma en que te vuelves reemplazable.
Fuente: Carnegie Mellon University, blog de Google (2009), WebProNews, MakeUseOf, MIT Technology Review, documentos públicos de Waymo.