RL de ajuste fino hace que el modelo 4B supere en preguntas financieras al de 235B: entorno de entrenamiento FinQA de código abierto de Snorkel AI

BlockBeatNews

Según el monitoreo de 1M AI News, Snorkel AI lanzó FinQA, un entorno de entrenamiento de aprendizaje por refuerzo construido sobre documentos financieros reales SEC 10-K, que ya fue liberado como código abierto en la plataforma OpenEnv, mantenida conjuntamente por Meta PyTorch y Hugging Face. FinQA abarca 290 preguntas y respuestas financieras anotadas por expertos de 22 empresas cotizadas (incluyendo Alphabet, Amazon, Apple, Bank of America y Boeing), y proporciona a los Agents 4 herramientas MCP: listar las tablas financieras disponibles, obtener la estructura de las tablas, ejecutar consultas SQL y enviar respuestas. Las consultas SQL exigen obligatoriamente condiciones de filtrado y prohíben SELECT *, lo que obliga al Agent a tomar solo los datos necesarios, en lugar de volcar toda la tabla.

Snorkel AI colabora con el equipo rLLM de la Universidad de California en Berkeley para hacer fine-tuning por aprendizaje por refuerzo de Qwen3-4B con FinQA; el resultado alcanza 59.7% de puntuación en el benchmark de preguntas y respuestas financieras SnorkelFinance, superando a Qwen3-235B de la misma familia (51.37%). El tamaño de parámetros es de aproximadamente 1/60 del segundo, y el costo de inferencia se reduce en alrededor de 90%. Hallazgos clave: los modelos grandes pueden razonar, pero generan nombres de columnas alucinados y hacen caso omiso a las restricciones SQL; en cambio, los modelos pequeños después del entrenamiento RL pueden llamar con precisión a las herramientas. El cuello de botella no es el tamaño, sino la “disciplina de herramientas”.

FinQA es el primer entorno de código abierto que Snorkel AI publica en OpenEnv; posteriormente se lanzarán entornos empresariales multinivel que cubran industrias como salud, seguros y derecho.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios