Впродовж 15 років ви тренували штучний інтелект для Google — тільки ви про це ніколи не знали

PANews

2026-03-18 07:05:02

Кожного разу, коли ви натискаєте на веб-сторінці “Розпізнати світлофори” або “Обрати всі пішохідні переходи”, ви думаєте, що просто доводите, що не є роботом. Насправді ж ви безкоштовно маркуєте навчальні дані для систем штучного інтелекту Google. Це триває вже понад 15 років і залучає сотні мільйонів користувачів по всьому світу, що в кінцевому підсумку сформувало здатність Google Maps до візуального розпізнавання та нинішню оцінку компанії Waymo у 45 мільярдів доларів. Усього цього ніхто не питав вашої згоди, ніхто не розповідав вам правду і навіть не платив вам ні копійки.

оригінал: @sharbel

переклад: Великий клешня | PANews Лобстер Півмільйона годин безкоштовної людської праці. Щодня. Зусилля тих, хто вважає, що просто входить у банківський акаунт.

reCAPTCHA — найуспішніша прихована кампанія збору даних в історії Інтернету. У пікові часи щодня її проходили 200 мільйонів користувачів. Майже ніхто не знає, що саме вони створюють.

Waymo — автопілот компанії Google — сьогодні оцінюється у 45 мільярдів доларів. Значна частина її ключових навчальних даних походить саме від вас. Безкоштовно. З кожного сайту, який ви відвідали.

Ось повна історія.

Початок: геніальна ідея

У 2000 році спам-боти руйнували весь Інтернет. Форумі заповнювали спамом, поштові скриньки не витримували навантаження. Веб-сайти терміново потребували способу відрізнити людину від машини.

Проблему вирішив професор Карнегі-Меллонського університету Луїс фон Ан. Він винайшов CAPTCHA — іскривлений текст, який може розпізнати лише людина. Боти не могли його пройти, люди — могли.

Але фон Ан побачив ще більше можливостей. Мільйони людей витрачають когнітивні зусилля на ці перевірки. А що, якщо ці зусилля можна використовувати одночасно для двох речей?

У 2007 році він запустив reCAPTCHA. Відмінність у тому, що вона показує не випадковий набір символів, а два слова. Одне відомо системі, інше — з реальних книг, які ще не розпізнані комп’ютером. Ваша відповідь допомагає оцифрувати ці книги.

Ці книги — з архіву The New York Times і Google Books — понад 130 мільйонів томів.

Ви думаєте, що просто входите у сайт, а насправді допомагаєте Google з OCR (оптичним розпізнаванням символів).

У 2009 році Google купила reCAPTCHA.

Google змінила правила гри

Епоха іскривленого тексту закінчилася приблизно у 2012 році.

Google зіткнулася з новою проблемою. Автопробіги Street View знімають кожну дорогу на планеті, але фото — це лише сирі дані. Щоб зробити AI корисним, потрібно, щоб він розумів, що бачить: дорожні знаки, пішохідні переходи, світлофори, вивіски.

Тому Google переробила reCAPTCHA v2. Перевірка стала зображеннями: “Клікніть усі квадрати з світлофорами”, “Обрати всі пішохідні переходи”, “Розпізнати вивіски”.

Ці зображення — безпосередньо з Google Street View.

А кожен ваш клік — це маркування. Кожен вибір — сигнал для комп’ютерної моделі Google: цей піксель — світлофор, ця форма — пішохідний перехід.

Ви не проходите тест, ви створюєте датасет.

Масштаб, про який ніхто не говорить

У пікові часи щодня виконувалося 200 мільйонів reCAPTCHA.

Кожна перевірка займала близько 10 секунд, тобто щодня людська праця нараховувала 2 мільярди секунд — або півмільйона годин.

Ринок професійної маркування даних коштує від 10 до 50 доларів за годину. За мінімальною ставкою це означає, що щодня безкоштовно витягується праця на суму до 5 мільйонів доларів.

І reCAPTCHA не обмежується одним застосунком — вона скрізь: у банках, урядових порталах, інтернет-магазинах, будь-яких логін-сторінках.

Ви не маєте вибору. Хочете отримати доступ до свого акаунту? Спершу маркуйте дані.

Google ніколи не питала вашої згоди, не платили вам і навіть не казали правду.

Що все це створює

Ці дані йдуть безпосередньо у дві ключові продукти.

Google Maps. Найпопулярніший у світі навігаційний сервіс. Його здатність розпізнавати дорожні знаки, знаходити магазини, розуміти міську географію — частково побудована на мільярдах людських маркувань, створених під час входу на сайти.

І ще Waymo.

Waymo — проект автономних автомобілів Google, з 2016 року незалежна компанія. Щоб безпечно їздити, автопілотам потрібно майже ідеальне розпізнавання тисяч візуальних моделей: світлофорів, пішохідних переходів, пішоходів, дорожніх знаків.

Ці дані — реальні тренувальні набори — створені мільйонами людей через reCAPTCHA, і вони навіть не підозрюють про це.

У 2024 році Waymo виконала понад 4 мільйони платних поїздок, працює у Сан-Франциско, Лос-Анджелесі та Фініксі, і продовжує розширюватися. Її оцінка — 450 мільярдів доларів.

А фундамент цієї будівлі — це праця тих, хто просто хоче відправити листа або зайти у сайт.

Чому ніхто не може повторити це

Вартість маркування даних дуже висока. Компанії Scale AI, Appen, Labelbox — існують саме для того, щоб цю проблему вирішити. Вони наймають сотні тисяч працівників для маркування зображень, іноді платять менше долара за годину.

Google вирішила цю проблему інакше: зробила маркування обов’язковим. Без оплати, без згоди — як “вхідний внесок” для доступу до будь-якого сайту.

Результат: мільярди маркованих зображень по всьому світу, у будь-яку погоду, у будь-який час доби, у кожному місті.

Жодна компанія з маркування не здатна таке зробити. Інтернет — це фабрика, а кожен його користувач — неофіційний працівник.

Те, що ви робите сьогодні

У 2018 році з’явилася reCAPTCHA v3, яка не показує вам жодних викликів для перевірки. Вона слідкує за тим, як ви рухаєте мишею, прокручуєте сторінку, тримаєте курсор. Ваш поведінковий профіль — ідентифікатор, що визначає, чи ви людина.

Ці дані також надходять до систем штучного інтелекту Google.

Ви ніколи не обирали це самі, ніколи не ставили галочку. Зараз, на більшості сайтів, ви робите те саме.

Гірка іронія, що має змусити задуматися

Перший задум Луїса фон Ан був геніальним: перенаправити когнітивні зусилля, які люди витрачають на фільтрацію спаму, на щось корисне — оцифрувати книги світу, вирішити реальну проблему.

Але застосування Google цього задуму — зовсім інше.

Вони взяли механізм безпеки, яким користувачі не мають вибору, і розгорнули його по всьому Інтернету, збираючи результати, що створюють багатомільярдний бізнес.

Користувачі нічого не отримали, навіть право знати.

Найглибша іронія — у тому, що ви довели собі, що людина, — зробивши те, що тоді ще не могла зробити штучна інтелектуальна система. А коли ця система навчився бачити, людські візуальні маркування стали зайвими.

Ви довели собі, що ви — людина, — шляхом створення замінної себе.

Джерело: Карнегі-Меллонський університет, блог Google (2009), WebProNews, MakeUseOf, MIT Technology Review, публічні документи Waymo.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Прокоментувати

0/400

Немає коментарів