Google публично нацелилась на сеть сверхбольших дата-центров «Vergo» для «агентного ИИ»…… усиление возможностей по снижению задержек и устранению сбоев

robot
Генерация тезисов в процессе

Google объявила о создании сверхбольшой сети дата-центров и межоблачной инфраструктуры для эпохи «агентного искусственного интеллекта (Agentic AI)». По мере распространения среды, в которой искусственный интеллект вызывает внешние инструменты за миллисекунды, конкуренция за инфраструктуру, снижающую задержки и стабильно обрабатывающую масштабные вычисления, активно развивается.

24-го числа Google выпустила свою новую систему сети AI-инфраструктуры «Virgo Network». Эта система предназначена для повышения скорости общей коммуникации внутри кластеров ускорителей, а также между памятью, вычислительными и хранилищными ресурсами дата-центров.

Ключевым является «плоская» структура сети. Этот подход снижает узкие места за счет уменьшения количества уровней, через которые проходят данные. По словам Google, Virgo Network может подключить до 134 000 чипов, включая восьмое поколение TPU 8t для обучения. Его двунаправленная пропускная способность достигает до 47 петабит в секунду (Pbps). Компания заявила, что по сравнению с предыдущим поколением пропускная способность каждого ускорителя увеличилась более чем в 4 раза.

Особенность этого релиза — не только скорость, но и акцент на «устойчивость». В сверхмасштабных AI-кластерах сбои, задержки и снижение скорости отдельных устройств практически неизбежны. Google заявил, что для решения этой проблемы они внедрили функцию «видимости», которая позволяет тонко наблюдать за состоянием сети, а также автоматические обходы и восстановление с помощью программного обеспечения. Также используется отдельная коммутационная плоскость, чтобы обеспечить стабильную пропускную способность даже при задержках или сбоях в сети.

Google описывает Virgo Network как не просто расширение существующих дата-центров, а как отдельный продукт инфраструктуры, созданный по концепции «проекта всей зоны как одного суперкомпьютера». Компания утверждает, что мониторинг состояния системы с интервалом менее 1 миллисекунды позволяет оптимизировать управление мгновенными перегрузками и буферами как на аппаратном, так и на программном уровне. Это особенно важно в средах, где агентный AI одновременно вызывает инструменты, осуществляет выводы и использует расширенное восстановление (RAG).

Одновременно анонсированы слои соединения и безопасности, преодолевающие границы облаков

Помимо сети дата-центров, Google представила слой соединения и безопасности для задач агентного AI. Обновление сводится к четырем столпам: «эластичные вычисления», «безопасное межоблачное соединение», «единый слой данных» и «цифровой суверенитет».

Во-первых, «эластичные вычисления» — архитектура, предназначенная для более эффективной обработки колебаний требований агентных AI. В условиях внезапных пиков запросов Google объясняет, что повышая доступность CPU, они позволяют быстрее и экономичнее реагировать на такие ситуации. В частности, система оптимизирована для задач вывода, оркестрации агентов и расширенного поиска, дополняя графические процессоры (GPU).

Для этого Google использует CPU C4N и M4N на виртуальных машинах (VM), основанных на Google Compute Engine и Google Kubernetes Service. Компания заявила, что эта система способна обрабатывать до 95 миллионов пакетов данных в секунду, что на 40% быстрее ведущих облачных провайдеров.

В области безопасных межоблачных соединений «агентский шлюз» занимает центральное место. Этот контроллер следит за доступом AI-агентов и управляет протоколами, такими как модельный контекстный протокол (MCP) и протоколы взаимодействия между агентами (A2A). В документации указано, что шлюз обеспечивает видимость и защиту передаваемых данных в мультиоблачной среде.

«Идея — перемещать данные туда, где они есть, а не переносить их»

Единый слой данных фокусируется на том, чтобы AI мог напрямую понимать и использовать данные, разбросанные по различным хранилищам предприятий. Google говорит, что «умное хранение» добавляет метаданные к объектам данных, превращая традиционные «статические данные» в знания, доступные AI.

Эта архитектура позволяет применять семантический поиск по различным форматам информации — таблицам, документам, PDF, изображениям — и автоматически добавлять комментарии и извлекать инсайты. Такой подход помогает избавиться от «островов» данных, запертых в отдельных хранилищах, и ускоряет доступ AI к нужной информации.

Объявленный вместе «каталог знаний» связывает внутренние знания компании в графическую структуру, помогая AI лучше понимать бизнес-процессы и контекст. Google подчеркивает, что такой подход позволяет оптимизировать обучение и ответы AI без необходимости перемещения данных. Иными словами, модель AI входит в «частную среду» данных, не перемещая их.

Этот релиз показывает, что фокус конкуренции в AI быстро смещается с модели и её производительности на сеть, безопасность и инфраструктуру данных, поддерживающие работу моделей. Особенно с учетом внедрения агентного AI в бизнес-процессы, низкая задержка, высокая устойчивость и мультиоблачное управление могут стать ключевыми конкурентными преимуществами. Действия Google интерпретируются как сигнал о все более ожесточенной борьбе крупных технологических компаний за лидерство в инфраструктуре AI.

TP AI注意事项 本文使用基于TokenPost.ai的语言模型进行摘要。正文主要内容可能被遗漏或与事实不符。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить