RL de ajuste fino hace que el modelo 4B supere en preguntas financieras al de 235B: entorno de entrenamiento FinQA de código abierto de Snorkel AI

CoinNetwork

Noticias de CoinWorlsNet: según el monitoreo de 1M AI News, Snorkel AI lanzó FinQA, un entorno de entrenamiento de aprendizaje por refuerzo construido a partir de documentos financieros reales SEC 10-K. Ya se ha publicado como código abierto en la plataforma OpenEnv, mantenida conjuntamente por Meta PyTorch y Hugging Face. FinQA cubre 290 preguntas y respuestas financieras con anotación experta de 22 empresas cotizadas (incluyendo Alphabet, Amazon, Apple, Bank of America, Boeing). El entorno proporciona a los agentes 4 herramientas de MCP: listar tablas financieras disponibles, obtener la estructura de una tabla, ejecutar consultas SQL y enviar respuestas. Las consultas SQL exigen que se apliquen condiciones de filtrado y prohíben SELECT *, lo que obliga al agente a tomar solo los datos necesarios en lugar de volcar toda la tabla. Snorkel AI colabora con el equipo de rLLM de la Universidad de California, Berkeley, y realiza un ajuste fino de aprendizaje por refuerzo de Qwen3-4B usando FinQA. Como resultado, en el benchmark de preguntas y respuestas financieras SnorkelFinance obtiene una puntuación de 59.7%, superando a Qwen3-235B del mismo tipo (51.37%). El número de parámetros es aproximadamente 1/60 del de este último y el costo de inferencia se reduce en aproximadamente 90%. Hallazgos clave: los modelos grandes pueden razonar, pero generan nombres de columnas alucinados y desatienden las restricciones de SQL; en cambio, los modelos pequeños después del entrenamiento por RL pueden llamar las herramientas con precisión. La “disciplina de herramientas” y no la escala es el verdadero cuello de botella. FinQA es el primer entorno de código abierto publicado por Snorkel AI en OpenEnv; posteriormente se presentarán entornos empresariales de múltiples rondas que cubran industrias como salud, seguros, derecho, entre otras.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios