План кодирования Volcano Engine был раскрыт как двойной счет: заявлено по количеству раз, на самом деле также учитывается расход токенов для списания количества

BlockBeatNews

Согласно мониторингу 1M AI News, пользователи обнаружили, что способ тарификации для Coding Plan от платформы Volcano Engine (Volcano Engine) содержит скрытый механизм, который не был достаточно раскрыт. Один из разработчиков на V2EX сообщил, что скорость расходования квоты значительно выше, чем у аналогичных тарифов на других платформах; после обращения в службу поддержки он получил ответ: «Если токены, потребляемые при одном вызове модели, намного превышают средние токены, потребляемые при обычных вызовах, то оценка количества возможных вызовов в течение периода будет намного меньше 6,000 раз».

В качестве примера возьмем тариф Pro (200 юаней/мес). Указано, что квота составляет 6,000 запросов каждые 5 часов, 45,000 запросов в неделю и 90,000 запросов в месяц. Однако фактическое списание не происходит по принципу «один вызов — одно списание». Вместо этого оно рассчитывается путем пересчета потребления токенов за один вызов в списание за несколько раз. Формула пересчета, рассчитанная пользователем, выглядит так: usage = max(round(use_token/token_limit), 1). У разных моделей скрытый множитель различается: DeepSeek-V3.2 — примерно 2 раза, Doubao-Seed-2.0-Code — примерно 4 раза, Doubao-Seed-2.0-Pro — примерно 6 раз. То есть один вызов с использованием Doubao-Seed-2.0-Pro может учитываться как расход 6 единиц квоты.

Как утверждает этот пользователь, один его вызов потребляет 510,000 токенов; на других платформах, например на Alibaba Bai Lian, это считается как один раз, тогда как на Volcano Engine это может пересчитываться примерно в 20 раз. При выполнении сложных задач агентами для ИИ-программирования потребление десятков и даже сотен тысяч токенов за один вызов является нормой; при такой системе тарификации квота тарифного плана быстро исчерпывается.

В Китае тарифы Coding Plan в целом сейчас тарифицируются по числу вызовов; такие платформы, как Alibaba Bai Lian и Xiaomi MiMo, списывают за один вызов один раз и не выполняют пересчет по токенам. Такая «двухуровневая» тарификация, где количество раз указывается по числу, а списание выполняется по токенам, для отрасли встречается относительно редко, и при этом она не указана на заметном месте на странице тарифа. Пользователи узнают об этом механизме только после того, как после аномального фактического расхода обращаются в службу поддержки. Также в последнее время пользователи сообщали, что инструмент для ИИ-программирования Trae, принадлежащий ByteDance, перешел с тарификации только по числу вызовов на схожий механизм пересчета токенов в количество раз.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев