Gate News notícia, a 25 de março, a Cursor lançou o relatório técnico do Composer 2, revelando pela primeira vez o plano completo de treino. O modelo base Kimi K2.5 utiliza arquitetura MoE, com um total de 1,04 triliões de parâmetros e 32 bilhões de parâmetros ativados. O treino divide-se em duas fases: primeiro, pré-treinamento contínuo em dados de código para reforçar o conhecimento de codificação, seguido de aprendizagem por reforço em larga escala para melhorar a capacidade de codificação de ponta a ponta. O ambiente de RL simula completamente cenários reais de uso da Cursor, incluindo edição de ficheiros, operações de terminal, pesquisa de código e chamadas de ferramentas, permitindo que o modelo aprenda em condições próximas ao ambiente de produção. O relatório também divulga a construção do benchmark próprio CursorBench: recolhendo tarefas a partir de sessões reais de codificação da equipa de engenharia, em vez de construí-las manualmente. O Kimi K2.5 obteve uma pontuação de 36,0 neste benchmark, e após as duas fases de treino, o Composer 2 atingiu 61,3 pontos, um aumento de 70%. A Cursor afirma que o custo de inferência é significativamente inferior ao de uma API de um grande modelo de ponta, alcançando um equilíbrio ótimo entre precisão e custo.