Relatório de visita de um acadêmico ocidental ao laboratório de IA na China: humildade, abertura, sem discutir filosofia, apenas querendo treinar modelos melhores

robot
Geração de resumo em curso

Autor: Florian Brand

Tradução: Deep潮 TechFlow

Deep潮 Introdução: O contexto deste artigo é que a SAIL (uma aliança de mídia que reúne os principais escritores de IA no Substack, incluindo Nathan Lambert, Sebastian Raschka, ChinaTalk, entre outros) organizou uma visita a laboratórios de IA na China. O autor Florian acompanhou o grupo e visitou empresas como Moonlit Dark Side, Xiaomi, MiniMax, Zhipu, Meituan, Alibaba, Ant, Modao, Zero One Wanwu, Yushu, entre mais de uma dúzia, escrevendo suas impressões.

Florian Brand é estudante de doutoramento na Universidade de Trier, na Alemanha, e no Centro Alemão de Pesquisa em Inteligência Artificial (DFKI). Sua pesquisa foca na aplicação e avaliação de grandes modelos de linguagem.

Não é exatamente uma figura “muito famosa”, mas tem certa visibilidade na comunidade de IA de código aberto. Ver a ecologia de IA na China do ponto de vista de um profissional estrangeiro também é bastante interessante.

Corpo do texto:

Nos últimos aproximadamente 10 dias, tive a sorte de visitar laboratórios de IA na China junto com os colegas da SAIL. Como alguém que visitou a China e os EUA pela primeira vez em seis meses, percebi que as diferenças entre os dois lugares são fascinantes, mas o que mais me impressionou foram as semelhanças.

O que mais me marcou foi que todos os pesquisadores de IA que conheci eram extremamente humildes.

Eles avaliavam altamente outros laboratórios e colegas. O DeepSeek foi mencionado com frequência, talvez porque, poucos dias antes da nossa visita, eles haviam lançado um modelo, e as pessoas falavam sobre os artigos do DeepSeek com verdadeira admiração.

Muitos pesquisadores eram amigos próximos, vindos da mesma universidade ou compartilhando a mesma cidade natal. Discutiam abertamente seu trabalho, e os resultados de suas pesquisas eram publicados em poucos meses.

Essa é uma das maiores diferenças em relação ao círculo de IA ocidental. Nos EUA, o ambiente costuma ser mais como um jogo de soma zero. Os laboratórios são cautelosos quanto à sua posição. Os pesquisadores pensam em competição, alguns têm uma autoavaliação muito alta. Líderes se insultam e atacam em memorandos vazados. Essa diferença pode ser explicada por fatos: os principais laboratórios nos EUA são fechados, enquanto muitos laboratórios chineses são de código aberto. Os laboratórios chineses têm certa cautela com o Doubao do ByteDance, que é o chatbot mais utilizado e é de código fechado, o que lhes confere uma vantagem significativa.

Ao mesmo tempo, o ambiente geral é surpreendentemente semelhante ao de São Francisco. Os pesquisadores estão extremamente conectados online, leem bastante no Twitter e no Xiaohongshu, que está se tornando cada vez mais popular. Todos usam Claude Code ou sua própria CLI para construir o próximo modelo. Alguns monitoram o treinamento durante nossas reuniões, observando a curva de recompensa subir. Pensam em escalar ainda mais, reclamando da falta de poder computacional. Estão frustrados com o estado atual dos benchmarks.

Seu foco principal é treinar modelos melhores. Diferente de São Francisco, onde os pesquisadores pensam sobre os impactos políticos ou filosóficos da IA, eles não consideram grandes desempregos, uma classe baixa permanente, ou se seus modelos têm consciência. Eles querem apenas treinar modelos excelentes.

Quando ouvem que você usou seus modelos, seus olhos brilham. Eles desejam corrigir todas as falhas dos modelos atuais na próxima geração. Trabalham a noite toda para lançar modelos e ainda aparecem no escritório no dia seguinte.

A maioria dos pesquisadores que conheci é bastante jovem, muitos com pouco mais de 20 ou cerca de 25 anos. Alguns são estudantes de graduação, mas é mais comum que estejam fazendo doutorado enquanto trabalham na indústria. Eles concordam que, atualmente, a indústria é mais interessante do que a academia, uma opinião com a qual concordo totalmente, pois já fiz exatamente isso. Os laboratórios valorizam muito a contratação desse tipo de talento, recrutando estagiários e estudantes de pós-graduação ativamente; algo que laboratórios ocidentais geralmente não fazem.

O otimismo dos pesquisadores também se estende ao público em geral, que parece mais esperançoso quanto à tecnologia, IA e robôs. Durante a viagem, alguém contou histórias de seus pais e avós usando o Doubao e o DeepSeek para várias tarefas, incluindo discutir teoremas matemáticos. Isso é bastante diferente do Ocidente, onde o público comum geralmente tem aversão à IA.

No geral, essa viagem me deu uma pequena compreensão desse ecossistema. É impossível entender uma civilização tão vasta em apenas alguns dias. Como um firme apoiador de ecossistemas de IA abertos e pesquisa aberta, estou muito otimista quanto ao futuro de ambos, esperando que haja muitas colaborações internacionais no horizonte.

Agradeço às pessoas incríveis que encontrei na Moonlit Dark Side, Xiaomi, MiniMax, Zhipu, Meituan, Alibaba, Ant Lingxi, Modao, Zero One Wanwu, Yushu e outros locais. Obrigado pelo tempo e pela calorosa recepção. Também agradeço à organização da SAIL por esta viagem, e a todos os escritores e jornalistas envolvidos. Sou muito grato por ter conhecido tantas pessoas brilhantes e ambiciosas em tão pouco tempo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar