Token fábrica de economia, está a reestruturar toda a indústria de IA

Autor: Haishan

Desde a guerra de preços “barata” do Token em 2024 até ao aumento de preços coletivo da Alibaba Cloud, Tencent Cloud e Baidu Intelligent Cloud em 2026.

A indústria de Token, em apenas dois anos, completou uma transformação surpreendente, passando de uma competição de gastar dinheiro e excesso de capacidade para uma situação de oferta insuficiente, com aumento simultâneo de quantidade e preço.

Desde 2026, o setor de capacidade de computação de IA no mercado de ações A subiu mais de 55% no acumulado, empresas líderes de grandes modelos como Moonshot AI e Zhitu AI tiveram receitas mensais superiores a 1 bilhão de yuans, e algumas empresas superaram a receita de todo o ano de 2025 em apenas 20 dias.

Esta revolução industrial, definida por Huang Renxun como “economia de fábricas de Token”, já ultrapassou a simples especulação tecnológica, tornando-se uma tendência de certeza impulsionada por uma explosão de demanda real, desequilíbrios na oferta e procura, e competição global por energia e capacidade de computação. A reestruturação da lógica subjacente está a remodelar as regras do jogo de toda a indústria de IA e a subverter a lógica fundamental de funcionamento do mundo.

01 “Petróleo” da Nova Era

A essência deste ponto de inflexão na indústria é a mudança do “corrida armamentista de modelos” para a “corrida de capacidade de produção de Token”.

Antes de 2024, a narrativa central do setor era “quem tem o maior parâmetro de modelo, quem é mais inteligente”, com grandes empresas gastando loucamente para treinar grandes modelos, oferecendo Token grátis ou vendendo a preços baixos para conquistar mercado, chegando até a uma situação anormal de “vender Token é pior do que vender água mineral”.

No entanto, em fevereiro de 2026, o sucesso explosivo do agente inteligente OpenClaw (popularmente conhecido como “Lagosta”) destruiu completamente essa lógica.

Grandes modelos tradicionais são “pessoas procurando IA”, com interações de uma única rodada consumindo apenas 1000-3000 Token. Já os agentes usam uma arquitetura de ciclo de “planeamento-ação-observação-reflexão”, onde a execução de uma tarefa complexa requer dezenas ou centenas de chamadas ao modelo, consumindo cerca de 100 mil Token para tarefas médias e até milhões para tarefas complexas, sendo chamados de “triturador de Token” na indústria.

Dados do Escritório Nacional de Estatísticas confirmam essa explosão: o volume diário de chamadas de Token na China subiu de 100 bilhões no início de 2024 para 140 trilhões em março de 2026, um aumento de mais de 1000 vezes em dois anos, com um crescimento de 40% apenas no primeiro trimestre de 2026 em relação ao final de 2025.

A narrativa do setor mudou completamente: não mais competir pelo “limite de inteligência” dos modelos, mas quem consegue produzir uma quantidade massiva de Token a custos mais baixos e com maior estabilidade, assumindo o controle da oferta inteligente.

Diante de uma demanda massiva, a rigidez do desequilíbrio entre oferta e procura é o principal suporte para a contínua alta do mercado de Token, e esse desequilíbrio não é uma flutuação de curto prazo, mas uma contradição estrutural determinada por um ciclo longo da cadeia de produção.

Existem três gargalos insuperáveis na oferta: primeiro, a capacidade de hardware central é monopolizada e o ciclo de expansão é longo.

A memória de alta largura de banda HBM é o “coração” dos servidores de IA, com Samsung, SK Hynix e Micron dominando mais de 95% da capacidade global. Seu ciclo de expansão dura de 24 a 36 meses, levando a uma escassez de mais de 40% em 2026.

Como consequência, a memória DDR5 comum aumentou de preço em 300% em seis meses, com o preço de uma única memória de 256G ultrapassando 40 mil yuans, e o ciclo de entrega de servidores de IA passou de 3 para 12 meses.

Segundo, energia e eletricidade tornaram-se os maiores gargalos ocultos. Os racks de centros de computação inteligente consomem de 10 a 20 vezes mais energia do que centros de dados tradicionais, com custos de eletricidade representando mais de 60% do custo de produção de Token. Além disso, a construção de infraestrutura elétrica para grandes centros de dados leva de 3 a 5 anos, e no leste da China já há uma escassez de capacidade de computação.

Terceiro, a infraestrutura e a capacidade de operação e manutenção não acompanham a explosão de demanda. A penetração de data centers de resfriamento líquido aumentou de 15% em 2024 para 45% em 2026, mas a falta de talentos técnicos e capacidade de construção impede que muitos clusters de computação operem na sua plena capacidade.

A capacidade na oferta é insuficiente, enquanto a demanda apresenta uma explosão em “três estágios”, com forte continuidade de crescimento.

O primeiro estágio é a popularização de agentes pessoais, que passam de simples entretenimento de chat para assistentes de IA que gerenciam emails, escrevem códigos e fazem planos, com consumo diário de Token de dezenas para milhares, com potencial de ultrapassar dezenas de milhares no futuro.

O segundo estágio é a implementação completa de aplicações de produção para empresas, que deixam de ver a IA como um complemento e passam a incorporar Token como elemento central de produção. Empresas como Kunlun Wanwei e 58.com consomem mais de 1 trilhão de Token por mês, e a transformação de setores como manufatura, finanças e saúde está gerando uma demanda de trilhões de Token.

O terceiro estágio é a explosão de demanda global por exportação, com modelos domésticos de grande porte com preços de Token apenas 1/5 a 1/3 dos Claude e GPT estrangeiros, conquistando rapidamente mercados no Sudeste Asiático, Oriente Médio e América Latina. No primeiro trimestre de 2026, a receita de Token de fornecedores chineses de nuvem no exterior cresceu 320% em relação ao ano anterior, tornando-se uma nova força de crescimento.

Em um nível mais profundo, Token está se tornando a principal mercadoria na era da IA, reestruturando o sistema de valor da economia digital. Assim como a eletricidade foi a energia central na era industrial e o fluxo de dados a ativo principal na era da internet, Token é o principal meio de produção na era inteligente, possuindo atributos de mensurabilidade, precificação e negociabilidade, atuando como uma âncora de valor universal que conecta oferta de capacidade computacional e demanda inteligente.

Essa mudança traz uma revolução completa nos modelos de negócio: o setor abandona a antiga estratégia de “gastar dinheiro para crescer” do setor de internet e entra numa nova fase de “faturamento por uso e lucro”.

Grandes empresas adotam estratégias de “subsidiar usuários finais para criar hábito” e “ampliar escala com clientes corporativos”, oferecendo Token gratuitamente por tempo limitado a usuários individuais e cobrando precisamente por consumo de empresas. No primeiro trimestre de 2026, a margem bruta dos principais provedores de nuvem de IA atingiu mais de 35%, alcançando lucro em escala pela primeira vez.

Para a China, essa revolução na indústria de Token representa uma oportunidade histórica de ultrapassagem. O país possui o menor custo de eletricidade verde do mundo, a infraestrutura de capacidade de computação mais avançada (com mais de 60% da capacidade global de servidores), os cenários de aplicação mais amplos e os modelos de maior custo-benefício, tendo todas as condições para se tornar a “fábrica mundial de Token”.

Assim como a China se tornou a “fábrica do mundo” graças à sua vantagem de custos, hoje ela lidera a produção e oferta globais de Token graças às suas vantagens em energia, capacidade de computação e cenários de aplicação.

No curto prazo, a desconexão entre oferta e procura deve persistir até o final de 2027, mantendo os preços de Token elevados, enquanto a concentração do setor aumenta rapidamente.

No longo prazo, com a liberação da capacidade de chips e a otimização da eficiência dos modelos, espera-se que o mercado de Token entre na era do “preço acessível”, penetrando em todos os setores da economia e se tornando o motor principal do crescimento econômico digital.

02 Como estão as subdivisões da indústria?

Com a mudança do Token de uma fase de “competição de preços baixos” para “escassez de oferta”, as subdivisões do setor já apresentam uma diferenciação estrutural.

Há uma diferenciação clara entre as fases de controle de preços na parte superior, geração de lucros na intermediária e monetização na parte inferior, com barreiras, ciclos de prosperidade e lógica de distribuição de valor distintas em cada segmento.

Primeiro, hardware de capacidade de computação na parte superior, que é a capacidade central das fábricas de Token, sob forte monopólio.

Inclui chips de IA, servidores de capacidade, resfriamento líquido e operação de centros de computação inteligente, com uma estrutura de oligopólio.

Os chips de IA são o motor principal da produção de Token, com a Nvidia dominando mais de 90% do mercado de GPUs de alta ponta globalmente.

No mercado doméstico, empresas chinesas como Cambrian e Hygon estão acelerando sua entrada: a chip Syu Yuan 590 da Cambrian já está em produção em larga escala, adequada para inferência e treinamento de grandes modelos, com receita de chips de IA crescendo 320% no primeiro trimestre de 2026.

A Hygon, com seu produto DCU, já tem uma penetração superior a 30% em centros de computação inteligentes domésticos, colaborando com empresas líderes como Sugon e Inspur. A série JM9 da Jingjia Micro foi implementada em cenários governamentais e financeiros, tornando-se fornecedora de GPU doméstica de uso geral.

Servidores de capacidade são o suporte da produção de Token, com empresas chinesas dominando grande parte do mercado global.

Inspur mantém a liderança na participação de mercado de servidores de IA, com crescimento de 180% no primeiro trimestre de 2026. Sugon lidera o mercado doméstico de servidores de resfriamento líquido, atendendo a mais de 80% dos centros de computação inteligentes nacionais.

Resfriamento líquido é uma necessidade para centros de computação de alta potência, com penetração crescendo de 15% em 2024 para 45% em 2026.

A InnoVek é líder absoluta no setor de resfriamento líquido, com clientes como Nvidia, Inspur e Huawei, com crescimento de pedidos de 210% em 2026.

A Shenling Environment fornece soluções de resfriamento líquido para vários centros de computação inteligentes nacionais, com crescimento de pedidos superior a 150%.

Na operação de centros de computação inteligente, empresas como Baoxin Software, Halo New Network e Runze Zhishuang, graças à sua localização estratégica e recursos de energia verde, tornaram-se os maiores operadores independentes de centros de computação na China, com crescimento de receita de mais de 100% no primeiro trimestre de 2026.

Depois, na parte intermediária de Token, a mudança de guerra de preços para guerra de valor.

O setor intermediário de Token é responsável por gerenciamento de capacidade, serviços de modelos e padronização de Token, com principais players sendo fabricantes de grandes modelos e provedores de serviços em nuvem.

Empresas líderes de grandes modelos na China, como Kunlun Wanwei, já têm uma trajetória clara de comercialização de Token.

Por exemplo, o modelo TianGong da Kunlun tem uma média diária de mais de 1,2 trilhão de chamadas de Token, com mais de 120 mil clientes corporativos, e seu serviço de Token para empresas é apenas um quarto do preço de modelos estrangeiros, com receita de IA crescendo 450% no primeiro trimestre de 2026.

A iFlytek foca em setores verticais como educação, saúde e escritórios, com 70% do consumo de Token vindo de aplicações de produção B2B.

Provedores de serviços em nuvem como Alibaba Cloud, Tencent Cloud e Volcengine, embora não listados na A股, beneficiam-se de empresas do ecossistema: UFIDA e Kingdee (HK) usam Alibaba Cloud para criar aplicações corporativas de IA, sendo canais importantes de consumo de Token.

Por fim, na parte de aplicações finais, que representam a saída última de valor do Token, há uma penetração crescente em consumidores finais e necessidades empresariais.

As aplicações finais podem ser divididas em três categorias: uso pessoal, serviços empresariais e digitalização de setores verticais, com diferenças marcantes no volume de consumo de Token e ritmo de comercialização.

Para consumidores finais, o foco é acessibilidade, com assistentes pessoais de IA, geração de conteúdo e design criativo.

Na China, empresas como Wanshing Technology, líder em aplicações de IA para exportação, têm mais de 5,5 milhões de usuários pagos em softwares de criatividade, como edição de vídeos e pintura por IA. Após a implementação de funções de IA, o desejo de pagamento e o tempo de uso aumentaram significativamente, com consumo de Token crescendo 320% no primeiro trimestre de 2026.

A CaiXun também oferece serviços de email inteligente e assistentes de escritório, com mais de 300 milhões de usuários e consumo diário de Token superior a 50 bilhões.

No setor empresarial, o consumo de Token é a principal força, representando mais de 65% do total.

Por exemplo, o serviço de consultoria de IA da Tonghuashun cobre mais de 100 milhões de investidores, com mais de 80 bilhões de chamadas de Token por dia, e receita de IA crescendo 190% no primeiro trimestre de 2026.

A Zhongkong Technology fornece plataformas de IA industrial para setores como química e energia, com consumo anual de Token por fábrica superior a 5 milhões.

A Runze Medical implementa seu sistema de diagnóstico assistido por IA em mais de 3.000 hospitais, com consumo diário de mais de 20 bilhões de tokens de textos médicos.

De modo geral, os setores verticais de B2B representam o maior potencial de crescimento de longo prazo para o Token, com a transformação de setores como condução autônoma, manufatura inteligente e tecnologia financeira gerando uma demanda de trilhões de Token.

03 Quais ações estão em alta?

Segundo as regras da indústria, o setor de Token evoluiu de uma “competição de modelos” para uma “competição de capacidade e monetização”, com a desconexão entre oferta e procura e a rápida liberação de valor comercial, seis empresas líderes na A股 já consolidaram posições em hardware de capacidade, modelos intermediários e aplicações finais, tornando-se os principais alvos de potencial de trilhões de yuan na economia de Token.

Primeiro, Inspur, líder absoluto em servidores de IA, atua como o “lastro” de capacidade de Token, sendo a maior participante do mercado global de servidores de IA, sustentando a operação de fábricas de Token em todo o mundo. A empresa tem forte vínculo com Nvidia, garantindo prioridade na alocação de GPUs de alta ponta, com uma cadeia de suprimentos e barreiras de escala insubstituíveis.

No primeiro trimestre de 2026, as entregas de servidores de IA aumentaram mais de 150% em relação ao ano anterior, com participação de mercado global superior a 25%, e pedidos não entregues próximos a 40 bilhões de yuans, com previsão de entrega até o final de 2027, sendo uma das ações mais confiáveis na cadeia de valor.

Segundo, a líder em resfriamento líquido, InnoVek, cuja tecnologia de resfriamento é essencial para a produção em larga escala de Token, com a densidade de potência dos centros de computação inteligente crescendo rapidamente. A penetração de resfriamento líquido passou de 15% em 2024 para 45% em 2026, com crescimento de pedidos de mais de 210% no primeiro trimestre de 2026, previsão de continuidade até 2027, sendo uma das ações com maior potencial de desempenho na parte superior da cadeia.

A Kunlun Wanwei, pioneira na comercialização de grandes modelos, é a maior fabricante de modelos de grande escala na China, com uma trajetória de lucratividade de Token em larga escala. Seus serviços de Token para empresas custam apenas um terço a um quarto do preço de modelos estrangeiros, conquistando rapidamente o mercado de pequenas e médias empresas.

No primeiro trimestre de 2026, o volume diário de chamadas de Token ultrapassou 1,2 trilhão, com mais de 120 mil clientes corporativos, e receita de IA cresceu mais de 450%, mantendo uma margem de lucro superior a 42%, sendo uma das ações mais puras de monetização de Token na China.

A iFlytek, líder em grandes modelos verticais, concentra-se em educação, saúde e setores industriais, com mais de 70% do consumo de Token vindo de aplicações de produção B2B, com forte demanda rígida.

Com anos de experiência em cenários e dados, a empresa tem uma rápida expansão de pedidos de serviços de Token personalizados para o setor público e empresas, com receita de IA prevista para ultrapassar 60% em 2026. À medida que a penetração de IA em setores verticais aumenta, a empresa se beneficiará do crescimento de longo prazo impulsionado pela digitalização industrial.

Por fim, Wanshing Technology, líder em aplicações de IA para consumidores finais no exterior, é uma das principais fabricantes globais de ferramentas criativas de IA, com mais de 5,5 milhões de usuários pagos em edição de vídeos e pintura por IA. Após a implementação de funções de IA, a disposição dos usuários a pagar e o tempo de uso aumentaram significativamente, com consumo de Token crescendo 320% no primeiro trimestre de 2026.

De modo geral, o ciclo de alta do Token é uma oportunidade de crescimento de longo prazo impulsionada pela demanda. No curto prazo, recomenda-se focar em líderes de hardware como Inspur e InnoVek, no médio prazo, em empresas de modelos comerciais como Kunlun Wanwei, e, no longo prazo, em líderes de cenários verticais como iFlytek, com empresas de alta qualidade esperando uma dupla melhora de desempenho e avaliação nesta fase de crescimento acelerado.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar