OpenAI lança GPT-5.2: pode criar pequenos jogos e cartões comemorativos, economizando 10 horas de trabalho semanalmente para clientes empresariais

ChainNewsAbmedia

OpenAI em 12/12 lançou o GPT-5.2, posicionando-o como a série de modelos de IA mais adequada atualmente para “trabalhos de conhecimento especializado”. A empresa afirmou que o GPT-5.2 consegue produzir diretamente resultados práticos como apresentações, planilhas, códigos e análises de documentos longos, além de suportar tarefas de múltiplas etapas e ferramentas cruzadas, podendo também criar pequenos jogos web front-end e cartões comemorativos. Segundo feedbacks, usuários empresariais do ChatGPT economizam em média entre 40 a 60 minutos de trabalho por dia, enquanto utilizadores altamente engajados economizam mais de 10 horas por semana. O GPT-5.2 é visto como uma versão chave para ampliar ainda mais a produtividade.

Três versões simultâneas lançadas, atendendo diferentes cenários profissionais

OpenAI afirmou que, desta vez, o GPT-5.2 é lançado simultaneamente nas versões Instant, Thinking e Pro, cada uma focada em eficiência diária, raciocínio profundo e resolução de problemas de alta complexidade. Na aplicação do ChatGPT, o GPT-5.2 será disponibilizado inicialmente para usuários de planos pagos. Na plataforma API, já está totalmente acessível aos desenvolvedores.

Avanço significativo na capacidade de trabalho profissional, atingindo nível de especialistas humanos pela primeira vez em GDPval

A OpenAI destacou que o GPT-5.2 Thinking apresentou uma inovação crucial na avaliação GDPval de trabalhos de conhecimento especializado. Essa avaliação cobre 44 profissões e 9 grandes setores, exigindo que o modelo produza entregáveis diretos, como apresentações, planilhas, cronogramas e documentos comerciais.

Os resultados mostraram que, para 70,9% das tarefas, o GPT-5.2 Thinking superou ou empatou com o desempenho de especialistas do setor, produzindo resultados 11 vezes mais rápido que humanos e com custos inferiores a 1%. É a primeira vez que a OpenAI atinge e até supera o nível de expertise profissional humano com um modelo.

Capacidades práticas totalmente aprimoradas, reforço na produção de projetos e desenvolvimento de códigos simultaneamente

Na prática, as apresentações e estruturas de planilhas do GPT-5.2 Thinking são mais completas e logicamente próximas às de consultores e analistas profissionais, podendo lidar com planejamento de recursos humanos, estruturas acionárias e gerenciamento de projetos, entre tarefas complexas. Em tarefas de planilhas de nível de bancos de investimento, o desempenho melhorou cerca de 9% em relação à geração anterior.

No desenvolvimento de software, o GPT-5.2 Thinking alcançou uma precisão de 56% no teste real de manutenção de códigos SWE-Bench Pro, podendo ler repositórios de código, entender problemas técnicos e gerar patches utilizáveis.

(Nota: SWE-Bench Pro é um teste que simula “trabalhos reais de engenharia de software”, exigindo que a IA corrija diretamente problemas de código em projetos reais, não apenas responda questões teóricas. )

Melhoria na confiabilidade e integração, arquivos longos, imagens e colaboração com ferramentas mais maduras

A OpenAI afirmou que a taxa de erro nas respostas do GPT-5.2 Thinking caiu aproximadamente 30% em relação à geração anterior. Nos testes MRCRv2, mesmo com documentos extremamente longos de dezenas de milhares de palavras, consegue manter uma precisão próxima do máximo, sendo útil para análise de contratos, relatórios financeiros e transcrições.

Na compreensão de imagens, o GPT-5.2 apresentou uma redução significativa na taxa de erro na interpretação de gráficos e interfaces de software. Quanto à capacidade de uso de ferramentas, no teste Tau2-bench, sua precisão atingiu 98,7%, podendo completar de forma estável tarefas completas envolvendo múltiplos sistemas e etapas.

GPT-5.2 também pode criar pequenos jogos web e front-end.

(Nota: MRCRv2 é um teste especializado para verificar se a IA consegue identificar corretamente informações-chave em conteúdos extensos e manter o contexto ao longo de múltiplas inferências. Tau2-bench é uma avaliação que simula processos reais de atendimento ao cliente e negócios para testar se a IA consegue chamar ferramentas corretamente, integrar informações e completar tarefas em múltiplas rodadas de interação. )

Este artigo “OpenAI lança GPT-5.2: pode fazer pequenos jogos e cartões comemorativos, economizando 10 horas semanais para empresas” foi publicado originalmente na ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário