То, что не удалось Gemini, удалось 千问

Аннотация:

Gemini называет это Uber, а 千问 напрямую вызывает такси — две функции, которые на первый взгляд выглядят одинаково, на самом деле совершенно разные. Первая — чтобы ИИ управлял приложением, а вторая — чтобы ИИ по-настоящему обладал глубокими возможностями рассуждения, чтобы он глубоко включался в процесс исполнения заказа.

Phoenix Finance Technology представляет

Автор|Dale

Редактор|董雨晴

В китайской экосистеме ИИ есть две компании, которых никогда не несёт на волне хайпа. Одна — DeepSeek. Другая — 千问. Первая, движимая непоколебимой верой в AGI без отвлечений, сосредоточенно исследует технологические изменения. Вторая, благодаря мощным барьерам экосистемы, всегда обеспечивает революции “с запозданием”, пробивая верхний предел возможностей ИИ на текущем этапе.

В конце марта, когда весь отраслевой сектор тащило вперёд хайпом OpenClaw, 千问 тихо вывел на сцену прорывную функцию — AI-такси. Это также ещё одна серьёзная инвестиция в “ИИ-дела” после того, как 千问 поддержал точечные сервисы вроде доставки еды, бронирования отелей и авиабилетов, а также билетов в места и на мероприятия.

В глобальном масштабе ИИ, который способен дойти до этого шага, можно пересчитать по пальцам.

Появились настоящие AI-агенты

Чтобы прояснить скачок в функциональности AI-такси 千问, нужно сначала вернуться к логике технологий на базовом уровне.

На протяжении довольно долгого времени роль ИИ сводилась к “пульту дистанционного управления”, просто вместо более раннего взаимодействия это была более продвинутая графическая пользовательская среда. Будь то ранний формат умного диалога или чат-боты, логика там проста: единичная команда, единичное выполнение. Пользователь отправляет конкретную команду, модель вызывает функцию и выполняет задачу — это механическое действие, которому не нужны интеллектуальные решения. Это “расширение конечностей”, а не “расширение воли”.

Но роль агента принципиально иная. Сначала у него появляется способность к выполнению — точнее, модель получает возможность разлагать подцели и выполнять динамическое планирование в сложной среде.

Следуя этой логике, мы увидим, что AI-такси и AI-доставка еды, а также AI-покупка билетов в кино в плане технической глубины и уровня внедрения — вообще не одного порядка сложности.

Будь то заказ доставки еды или покупка билетов в кино, процесс происходит внутри высоко структурированного “контейнера” с информацией. Инструменты, которые вызываются, например базы меню, купоны и платёжные системы, всё это уже онлайн-форматы. Даже если запросы становятся очень сложными — например, планировать заказы в разных сценариях — всё равно они выполняются в рамках ограниченных баз данных.

Даже если доставка еды сделана “не туда” и можно заменить на другую, а билет в кино куплен “не так” и можно поменять на другой сеанс — это сценарии с высокой терпимостью к ошибкам. Но такси заменять “легко” нельзя. Такси — это типичный сценарий с высокой частотой, низкой терпимостью к ошибкам и жёстким обязательством по исполнению: вы должны отвечать за реальный результат — причём отвечать в реальном времени.

Это означает, что в AI-сервисе такси ИИ должен вести реальное интерактивное взаимодействие и игру с физическим миром, водителями и другими участниками дорожного движения.

Вот где и заключается прорыв, который показало обновление 千问: ИИ участвует в реальном исполнении обязательств.

Во время внутреннего тестирования Phoenix Finance Technology обнаружила, что система способна по расплывчатым потребностям пользователя подобрать подходящий тип автомобиля и маршрут. Например, как я изначально указал только точку отправления и точку назначения — она спланировала маршрут “один”. Но после того как я подсказал, что у меня укачивание, она заново перепланировала маршрут “два”. По сравнению с маршрутом “один”, маршрут “два” длиннее по скоростным участкам и меньше по пробкам.

То есть, когда пользователь отдаёт 千问 команду, это не просто помощь “нажать пару кнопок”, а реальное понимание ваших сложных требований. За этим стоят целые последовательности действий реального мира при исполнении обязательств — включая планирование маршрута, оперативную диспетчеризацию, расчёт стоимости и многое другое.

Когда вы спрашиваете “поехать на такси в залив Тайцзывань посмотреть на тюльпаны”, ИИ должен понять, что такое “Тайцзывань”, что “тюльпаны” связаны с особым сезоном, и далее определить, во сколько вам нужно выехать и через какой вход проще всего зайти.

Именно так выглядит настоящее “ведение дел” — с этого момента ИИ уже не пульт дистанционного управления, а агент по задачам в рамках бизнеса.

Phoenix Finance Technology после многократных попыток обнаружила, что 千问 уже обладает способностью выполнять интеграцию нескольких задач. В идеальном состоянии он может завершать длинную цепочку исполнения обязательств. Например: сначала помочь пользователю заказать билеты в кино, затем вызвать такси до кинотеатра, а после — забронировать обратную поездку после 10:30. Это типичная цепочка сценариев из повседневной жизни, но она включает полностью разные системы исполнения: предзаказ билетов в кино, немедленное вызов такси и бронирование такси на время. В традиционном режиме вам нужно переключаться между как минимум тремя приложениями. А ИИ одним диалогом может выполнить все операции.

Это означает, что в будущем ИИ сможет дальше развиваться: от замены отдельной задачи — к настоящему помощнику по жизни.

То, что не смог Gemini, смог 千问

За AI-ведение дел стоит соперничество уровня экосистемы.

В глобальном масштабе Gemini и OpenAI не то чтобы не хотели делать настоящее AI-ведение дел, но на данный момент они не могут, а в долгосрочной перспективе OpenAI тоже будет крайне сложно это сделать.

Функция, которую Gemini недавно особенно продвигает, — через голосовую команду “помоги вызвать Uber в аэропорт” — заставляет Gemini автоматически открыть приложение Uber, выполнить операции в виртуальном окне и сейчас также поддерживает Lyft. Как и говорилось выше, это всё ещё роль “пульта”: в безопасном виртуальном окне симулируются клики пользователя и операции с приложением, но ИИ не подключается напрямую к серверной системе. Обычно перед окончательным подтверждением заказа пользователь должен вручную сделать последний шаг.

Это также связано с крайне ключевым моментом: AI-ведение дел требует трёх базовых способностей — понимать сложные запросы, подключать системы исполнения и отвечать за результат. Первые две способности частично решаются алгоритмами, но третья — ответственность за результат — требует реального коммерческого замкнутого цикла.

Такси — это сфера, где задействованы целые наборы сложных коммерческих систем: правила тарификации, диспетчеризация водителей, планирование маршрутов, расчёт и окончательные платежи, обработка жалоб и т.д. ИИ может помочь вам “вызвать машину”, но если машина не приехала, маршрут оказался неверным или цена неправильная — кто будет отвечать?

Уверенность 千问 опирается на сильные способности исполнения и сильную интеграцию из экосистемы Alibaba: система доставки еды 淘宝闪购, туристические и билетные сервисы 飞猪, кино и развлечения 淘票票 — это не просто “подключение”, а глубокая системная интеграция.

Когда пользователь говорит: “в пределах 30, в машине не должно быть запаха”, ИИ должен в реальном времени рассчитать стоимость, отфильтровать типы автомобилей, согласовать предпочтения водителей. Всё это невозможно выполнить простым “вызовом приложения”: нужно глубоко входить в системы исполнения, опираясь на мощную поддержку данных в пространственно-временном измерении.

Снова пробить верхний предел возможностей ИИ

Если соревнование ИИ за последние два года было сосредоточено на возможностях диалога — кто покажет слог, кто покажет художественное выражение — то с сегодняшнего дня конкуренция переходит во вторую половину: спор пойдёт про способность “делать дела”.

Разрыв в диалоговых возможностях можно оценивать несколькими процентными пунктами по оценочным баллам — это привычные для всех рейтинги тестов. А разрыв в способности “делать дела”, по крайней мере на данный момент, — это пропасть между “может” и “не может”.

Запущенный 千问 skill “такси” как раз является знаковым продуктом на этой границе. Он не только понимает “я хочу доехать до офиса”, но и точно раскладывает такие сложные намерения, как “6 человек нужно подобрать бизнес-автомобиль” и “чтобы забрать человека, надо добавить маршрутную точку”.

За этим стоит полная перестройка системы — от распознавания намерений до замыкания цикла исполнения обязательств. Это не просто появление входа “такси”: это полная перестройка всей парадигмы взаимодействия сервисов поездок, а также фундаментальное разрушение традиционных такси-приложений.

В традиционном режиме пользователю нужно шаг за шагом выполнять операции по логике меню в приложении такси: выбрать точку отправления, ввести точку назначения, подобрать тип автомобиля, посмотреть ориентировочную цену… Весь процесс предполагает “что человек должен подстраиваться под инструмент”. Такая конструкция естественно исключает размытые формулировки — например, если вы скажете: “я хочу попасть в место в центре города, которое сейчас очень популярно, где можно посмотреть тюльпаны”, система не сможет ответить; и также естественно исключает пользователей “не коренных цифровых” — многие пожилые люди не умеют работать с графическим интерфейсом, и потому надолго оказываются вытесненными из сервисов поездок.

И ещё важнее: как только ключевые сценарии поездок берёт на себя AI-помощник, ценность традиционного такси-приложения столкнётся с структурными вызовами. Когда пользователю больше не нужно самим открывать традиционное ПО, а достаточно одной фразы “помоги вызвать такси до Тайцзывань”, частота открытий одиночного инструмента и “липкость” пользователей неизбежно получат фундаментальный удар. Недавний случай: после того как Claude запустил навыки в дизайне, акции специализированных дизайн-программ — Adobe, Figma и подобных — резко упали. Это стало яркой иллюстрацией тенденции: когда универсальные агенты смогут выполнять профессиональные задачи, защитные рвы вертикальных инструментов быстро испаряются.

Более того, внутри AI-помощника Skills и Agents могут также реализовывать кросс-доменные скоординированные действия.

На данный момент 千问 уже последовательно подключил услуги из повседневной жизни — доставку еды, поездки, путешествия и билетные сервисы. После запуска skill по такси эти возможности смогут бесшовно связываться. Например: в одной операции завершить “забронируй отель у озера Сиху”, “вызови такси, чтобы отвезти меня в этот отель”, “а затем порекомендуй неподалёку самые местные блюда ханчжоу”. Это типичная цепочка многошаговых задач: включает три системы — бронирование, диспетчеризацию и рекомендации. Раньше нужно было переключаться как минимум между тремя приложениями, а теперь достаточно одного диалога.

По сути, это и есть ключевой скачок ИИ от инструмента производительности к помощнику по жизни.

(Редактор:郭健东 )

     【Отказ от ответственности】Эта статья отражает только личные взгляды автора и не связана с Hexun. Сайт Hexun сохраняет нейтральность по отношению к изложенным в тексте утверждениям и оценкам взглядов; он не даёт никаких явных или подразумеваемых гарантий относительно точности, надёжности или полноты содержащихся материалов. Пожалуйста, читатели используйте эту информацию только для справки и берите на себя всю ответственность самостоятельно. Email: news_center@staff.hexun.com

举报

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить