Has pasado 15 años entrenando gratis inteligencia artificial para Google, solo que siempre te han tenido engañado.

robot
Generación de resúmenes en curso

Has estado entrenando la IA de Google durante 15 años. No tenías idea.

Autor: Sharbel

Fuente:

Reproducción: Mars Finance

Cada día, aproximadamente 500,000 horas de trabajo humano son aprovechadas gratuitamente por Google. Y quienes contribuyen, solo quieren acceder a su banca en línea.

reCAPTCHA es la operación de datos invisibles más exitosa en la historia de Internet. En su pico, 200 millones de personas completaban verificaciones diarias. Pero casi nadie se da cuenta de lo que realmente significa cada clic.

La compañía de autos autónomos de Google, Waymo, ahora vale 45 mil millones de dólares. Y la mayor parte de sus datos de entrenamiento clave son proporcionados gratuitamente por ti cuando visitas diferentes sitios web.

Aquí está toda la historia:

Origen: una idea inteligente

En 2000, los robots de spam estaban destruyendo Internet. Los foros se llenaban de spam, las bandejas de entrada se colapsaban, y los sitios web necesitaban una forma de distinguir humanos de máquinas.

El profesor Luis von Ahn de la Universidad Carnegie Mellon resolvió este problema. Inventó el CAPTCHA: un texto distorsionado que solo los humanos pueden leer, pero que los robots no pueden pasar.

Pero von Ahn vio más allá. Millones de personas gastaban energía en estos desafíos. ¿Y si esa energía pudiera hacer dos cosas a la vez?

En 2007, lanzó reCAPTCHA. La clave estaba en que ya no mostraba caracteres aleatorios, sino dos palabras: una conocida por el sistema y otra que aún no podía ser reconocida por la computadora, proveniente de libros escaneados reales. Tu respuesta ayudaba a digitalizar estos libros.

Estos libros provienen del archivo del New York Times y de Google Books, con hasta 130 millones de volúmenes.

Pensabas que solo ingresabas a un sitio web normal, pero en realidad estabas contribuyendo a la digitalización de la mayor biblioteca del mundo mediante OCR (Reconocimiento Óptico de Caracteres).

En 2009, Google adquirió oficialmente reCAPTCHA.

Luego, Google cambió la estrategia

La era de los “textos distorsionados” terminó alrededor de 2012.

Google enfrentó un nuevo desafío: las cámaras de Street View capturaron cada calle del mundo, pero las fotos eran solo datos en bruto. Para que la IA funcione, necesita entender lo que ve: señales de tránsito, pasos de cebra, semáforos, fachadas de tiendas.

Por eso, Google rediseñó reCAPTCHA v2. En lugar de texto distorsionado, ahora muestra una cuadrícula de fotos. “Haz clic en todas las casillas con semáforos.” “Selecciona cada paso de cebra.” “Reconoce las fachadas.”

Estas imágenes provienen directamente de Street View. Tus clics son etiquetas.

Cada selección le dice al modelo de visión por computadora de Google: este grupo de píxeles es un semáforo, esa forma es un paso de cebra. No estás haciendo una prueba, estás construyendo un conjunto de datos.

Escala inimaginable

En su pico, 200 millones de reCAPTCHA se resolvían cada día. Cada desafío tomaba 10 segundos, lo que significa 2 mil millones de segundos de trabajo humano diario, es decir, 500,000 horas.

El costo de la anotación de datos remunerada es de aproximadamente 10 a 50 dólares por hora. Con la tarifa mínima, el valor del trabajo gratuito extraído cada día alcanza los 50 millones de dólares.

Y reCAPTCHA no solo está en una app. Está en todos los bancos, portales gubernamentales y sitios de comercio electrónico. No tienes opción: ¿quieres acceder a tu cuenta? Primero, etiqueta datos. Google nunca te preguntó, no te pagó ni un centavo, ni siquiera te informó de esto.

¿Y qué ha logrado todo esto?

Estos datos alimentan directamente dos productos:

  • Google Maps: la herramienta de navegación más utilizada en el mundo. Su capacidad para reconocer señales, tiendas y geografía urbana, en parte, proviene de miles de millones de etiquetas humanas en sitios web.

  • Waymo: el proyecto de autos sin conductor de Google. Para navegar con seguridad, los vehículos necesitan reconocer casi perfectamente miles de patrones visuales.

Los datos de entrenamiento de valor real para estos reconocimientos son etiquetados por millones de personas sin saberlo, a través de reCAPTCHA. En 2024, Waymo completó más de 4 millones de viajes pagos, valorados en 45 mil millones de dólares. La base de todo esto son los “ciudadanos digitales” que solo querían consultar un correo.

¿Por qué nadie puede copiar este modelo?

La anotación de datos es extremadamente costosa. Empresas como Scale AI, Appen y Labelbox existen para resolver este problema, contratando a decenas de miles de trabajadores, a veces con salarios inferiores a 1 dólar por hora.

La solución de Google fue diferente: convirtieron la anotación en algo obligatorio. Sin pagar, sin pedir permiso, solo como una “entrada” para acceder a cada rincón de Internet. El resultado: miles de millones de imágenes etiquetadas, cobertura global, en todo tipo de clima y en cada ciudad del mundo. Ninguna otra empresa de anotación puede hacer esto. Internet mismo es una fábrica, y cada usuario es un empleado sin contrato.

Todavía participas

En 2018, reCAPTCHA v3 dejó de mostrar desafíos. Observa tu comportamiento: cómo mueves el ratón, la velocidad de desplazamiento, el tiempo de permanencia. Tu “huella digital” indica si eres humano. Estos datos también alimentan el sistema de IA de Google.

Nunca elegiste participar activamente. No hay una casilla para marcar. Pero en la mayoría de los sitios que visitas, sigues haciendo esto.

Una ironía inquietante

El propósito original de Luis von Ahn era genial: convertir el esfuerzo desperdiciado de los humanos en producción útil. Pero lo que Google ha hecho con esa visión es otra historia. Han aprovechado los mecanismos de seguridad que los usuarios deben usar, desplegándolos en toda la web, para recolectar datos y construir productos que valen miles de millones. Los usuarios no obtienen nada, ni siquiera saben.

La ironía más profunda es que dedicas años a demostrar que eres humano, completando tareas de reconocimiento visual que la IA aún no podía hacer. Pero una vez que la IA aprende esas tareas, la anotación visual humana deja de ser necesaria.

Has demostrado que eres humano, pero eso solo te hace más susceptible a ser reemplazado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado