2026-03-06 02:29:19

Выпуск GPT-5.4 ясно определил направление будущих итераций ИИ. В настоящее время область ИИ уже движется от диалоговых окон к развитию системных интеллектуальных агентов: человек отвечает за эстетику, ИИ — за выполнение задач, формируя рабочий поток совместной работы человека и машины.

➤ Основные обновления GPT-5.4
1. Объединил универсальные логические способности GPT-5.2 с передовыми программными возможностями GPT-5.3-Codex
2. Поддержка окна на 1 миллион токенов (примерно 5000 страниц документов), что решает проблему забывания длинных текстов
3. Встроенная работа с компьютером: модель может напрямую видеть экран, мышь и клавиатуру как человек. В тестах в OSWorld уровень успеха достиг 75,0%, превзойдя средний уровень человека
4. Внедрение функции прерывания в процессе. Диалог больше не является жестким поэтапным обменом, пользователь может в любой момент вставить новые требования во время размышлений или ответов модели
5. Оптимизация эффективности и затрат за счет внедрения механизма Tool Search. Модель больше не нуждается в предварительной загрузке всех определений инструментов, а ищет их по мере необходимости, что сокращает расход токенов на 47%.
➤ Почему так происходит?
В настоящее время ведущие мировые лаборатории ИИ сталкиваются с «стеной данных». К 2026 году весь высококачественный текст, код и книги, созданные человечеством, могут быть собраны крупными моделями в массовом масштабе. Обучение на текстах достигло своего предела: такие системы, как Claude code, Codex и OpenClaw, глубоко интегрированы с текущими операционными системами, заменяя часть операций вызовами системных инструментов и обладая автономным сознанием для выполнения задач.
Многие не знают, что модели серии Codex обучаются одновременно с фреймворком Codex, то есть модели и фреймворк являются нативными друг для друга, что позволяет моделям автоматически вызывать все разработанные инструменты внутри Codex.
➤ Глубокий анализ будущего развития ИИ
1. Переход от API-склеивания к нативной интеграции на уровне операционной системы
Возможности Computer Use, продемонстрированные GPT-5.4, выводят модель за рамки диалогового окна и делают её частью всей операционной системы.
Ранее модель писала код в ограниченной песочнице (Sandbox), а после обновления она сможет физически взаимодействовать с окружающей средой: понимать логику кода, а также визуальные отклики при кликах, перетаскивании и ошибках в терминале.
Новый уровень фреймворка будет не просто набором предустановленных функций, а глубоко осознавать ОС. Модель уже обучена наблюдать за экраном и реагировать на него, что позволяет ей, как опытному инженеру, одновременно редактировать код и просматривать изменения UI в браузере, реализуя автоматическую циклическую разработку от конца до конца, что уже реализовано в Codex.
2. Контекст на миллион токенов + архитектура для долгосрочных задач + система памяти = универсальный архитектор
В трехуровневой архитектуре Codex модель обеспечивает структурированное логическое мышление. Контекст на 1 миллион токенов, предоставляемый GPT-5.4, по сути, расширяет возможности этого мышления.
Система памяти OpenAI остается лидером: с выпуском безпотерьной и бесконечной памяти модель может мгновенно искать всю кодовую базу (миллион токенов и более), а фреймворк — точно применять изменения в десятках связанных файлов.
Теперь в Codex уже возможна полная переработка архитектуры и точное понимание смысла кода.
3. Поиск и динамическое расширение инструментов
Механизм Tool Search, введенный в GPT-5.4, позволяет фреймворку понять модель и её выходные данные, а сама модель — получать больше контекста для точных операций.
Будущее — не предзагружать тысячи и миллионы библиотек инструментов (чтобы избежать траты токенов), а в реальном времени при необходимости искать и загружать нужные компоненты через Tool Search. Это означает, что текущие навыки могут стать промежуточным этапом, а в будущем инструменты будут встроены прямо в модель, которая сама выберет нужный.
Преимущество — высокая эффективность использования токенов. Это решает парадокс, при котором больше инструментов делает модель медленнее, и позволяет расширять «дерево навыков» агента без ограничений, автоматически оптимизируя и находя лучший путь для обучения следующего поколения моделей.
4. Реальное взаимодействие: от поэтапных диалогов к мгновенным прерываниям и изменениям
Введение функции прерывания в GPT-5.4 разрушает «черный ящик» генерации ИИ, позволяя своевременно корректировать неправильные идеи.
На уровне сотрудничества больше привлекается человеческое решение, а не полное автономное управление ИИ, что делает взаимодействие прозрачным: человек отвечает за эстетику, определение требований и выбор решений, а ИИ — за выполнение.
Благодаря функции реального вмешательства ИИ превращается из «слепого» однократного выполнения задачи в партнера, с которым можно в любой момент изменить требования.
Проще говоря, новая нативная модель ИИ (Codex + GPT-5.4) — это создание F1-автомобиля с нуля, где двигатель, шасси и шины спроектированы с самого начала для максимальной скорости и работают в синергии.
В будущем, возможно, нам уже не потребуется искать более мощные модели, а — системы, глубже интегрированные с средой разработки.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .