Na era da Revolução Industrial, quanto mais barato o carvão, mais as pessoas queimavam. Agora, na era da IA, o Token é assim mesmo


Quando o Token fica barato, os produtos de IA podem queimar mais
Antes, você perguntava uma coisa, o modelo respondia, e acabava ali
Agora, você clica, o Agente desmembra tarefas, pesquisa informações, ajusta ferramentas, escreve código, corrige erros, faz resumos, executa um conjunto completo de processos
Por isso, o Token individual ficou barato, mas uma única tarefa consome muitos Tokens
Essa é a razão de as contas ainda estarem crescendo
Depois que a máquina a vapor ficou mais eficiente no uso de carvão, o Reino Unido não deixou de queimar carvão. Porque o carvão se tornou mais vantajoso, mais máquinas, fábricas e ferrovias começaram a queimar carvão
O Token segue essa lógica também
Depois de ficar barato, Agentes, Pesquisa Profunda, Programação de IA, contextos longos, automação empresarial realmente começaram a decolar
Por isso, o centro de custos da IA está mudando do treinamento para a inferência
Treinar consome por um tempo, inferir é algo contínuo. Quando o usuário está online, está consumindo. Quando o Agente está operando, está consumindo. Quanto maior o contexto, maior o cache, e a memória, largura de banda, energia e dissipação de calor também ficam mais pressionados
Essa é também a razão pela qual a cadeia de valor da IA não pode se limitar apenas a GPUs
HBM, DRAM, SSD, empacotamento avançado, módulos ópticos, chips de troca, CPU, chips de inferência, todos serão reprecificados por essa demanda de inferência
As empresas de aplicações de IA também serão forçadas a se dividir em camadas
Aquelas que oferecem apenas uma interface, baseadas inteiramente em APIs fechadas, quanto mais usuários tiverem, maior a conta, menor a margem de lucro
As verdadeiras barreiras vão se aprofundar: roteadores, quantização, cache, processamento em lote, corte de contexto, substituição de grandes modelos por pequenos
Hmm, Token é como carvão
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar