Escassez de poder de processamento de GPU se repete: grandes empresas como OpenAI, Anthropic e outras consomem a oferta, novas startups de IA terão que esperar até o final do ano

Microsoft, Amazon e outros grandes provedores de nuvem estão concentrando o poder de computação das GPUs NVIDIA em suas equipes internas e clientes de alto nível como OpenAI, Anthropic, entre outros, enquanto startups de IA de pequeno e médio porte enfrentam uma tríplice pressão: aumento de 32% no aluguel, filas até o final do ano e limites contratuais que saltaram para dezenas de milhões de dólares. Algumas venture capital já começaram a planejar pools de compartilhamento de capacidade de computação para negociar em conjunto, enquanto novas startups optam por comprar GPUs com recursos próprios para evitar filas.
(Previa: A ação da NVIDIA atingiu uma nova máxima histórica, com valor de mercado ultrapassando 5 trilhões de dólares: investiu 5 bilhões na Intel e, em menos de um ano, dobrou de valor, com lucro de 12,7 bilhões de dólares)
(Complemento de contexto: Transcrição completa do discurso de Jensen Huang na GTC2026: demanda por IA atingindo trilhões de dólares, capacidade de computação crescendo 350 vezes, OpenClaw transformando cada empresa em AaaS)

Índice deste artigo

Alternar

  • Meio ano atrás, US$ 2,80, renovação passou para US$ 3,70
  • O sistema de classificação da Microsoft
  • Venture capital já começou a buscar soluções próprias

40 mil GPUs estão online, enquanto há uma demanda de 400 mil na fila. Segundo a reportagem do The Information, o fornecedor de nuvem de GPUs Lightning AI, CEO Will Falcon, forneceu um número que descreve com precisão a relação de oferta e demanda do mercado de capacidade de IA em 2026 como 1 para 10. Em sua plataforma, cerca de 40 clientes estão aguardando, e os preços de aluguel aumentaram mais de 25% nos últimos seis meses.

Meio ano atrás, US$ 2,80, renovação passou para US$ 3,70

A startup de geração de imagens Krea (com financiamento total de US$ 83 milhões, incluindo investidores como Andreessen Horowitz e Bain Capital Ventures) alugou centenas de chips NVIDIA Blackwell por US$ 2,80 por hora por cartão, por seis meses. Na renovação, várias provedores de nuvem simplesmente não atenderam às ligações.

No final, o valor foi fechado em US$ 3,70, um aumento de 32%, e o contrato foi estendido para um ano. O CEO da Krea, Victor Perez, afirmou que alguns fornecedores só aceitam contratos de três anos, enquanto outros simplesmente não respondem.

Este não é um caso isolado; o Índice de Preços de Computação Ornn mostra que o aluguel por hora do Blackwell disparou para US$ 4,08, um aumento de 48% em dois meses.

O preço de um contrato de um ano para H100 também saltou de US$ 1,70 em outubro de 2025 para US$ 2,35 em março de 2026, quase 40% de aumento.

O sistema de classificação da Microsoft

A Microsoft implementa uma gestão por níveis de acesso às GPUs, priorizando cerca de 1.000 maiores clientes (Tier 1) na alocação de capacidade; clientes menores que desejam alugar Blackwell precisam comprometer-se com pelo menos 1.000 unidades por pelo menos um ano, com contratos começando em dezenas de milhões de dólares.

Clientes que pagam conforme o uso (pay-as-you-go) podem ter seu acesso revogado se deixarem as GPUs ociosas por algumas horas. Startups participantes do plano gratuito “Microsoft for Startups” também foram informadas de que, se não utilizarem adequadamente, suas permissões de GPU podem ser retiradas. A equipe de vendas do Azure recentemente informou aos funcionários que o tempo de espera por GPUs na nuvem deve continuar até o final de 2026.

Atualmente, a Microsoft concentra a oferta de capacidade de computação para grandes clientes como OpenAI e Anthropic, enquanto startups de IA de pequeno e médio porte ficam na fila.

Venture capital já começou a buscar soluções próprias

O sócio da General Catalyst, Hemant Taneja, enviou questionários às empresas investidas para investigar os gargalos de capacidade, enquanto a organização planeja pools de compartilhamento de capacidade ou empresas de investimento coletivo para negociação em grupo.

Um caso mais extremo é a startup de IA do setor petrolífero, Collide, que planeja gastar cerca de US$ 500 mil para comprar GPUs NVIDIA diretamente, alugando espaço em data centers para rodar suas operações, a fim de evitar filas e a incerteza de preços. Quando uma startup de IA do setor petrolífero decide voltar a comprar hardware e alugar servidores, todos sabem que a cadeira na nuvem já está muito concorrida.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar