RL de ajuste fino hace que el modelo 4B supere en preguntas financieras al de 235B: entorno de entrenamiento FinQA de código abierto de Snorkel AI

BlockBeatNews

2026-03-31 05:35:43

Según el monitoreo de 1M AI News, Snorkel AI lanzó FinQA, un entorno de entrenamiento de aprendizaje por refuerzo construido sobre documentos financieros reales SEC 10-K, que ya fue liberado como código abierto en la plataforma OpenEnv, mantenida conjuntamente por Meta PyTorch y Hugging Face. FinQA abarca 290 preguntas y respuestas financieras anotadas por expertos de 22 empresas cotizadas (incluyendo Alphabet, Amazon, Apple, Bank of America y Boeing), y proporciona a los Agents 4 herramientas MCP: listar las tablas financieras disponibles, obtener la estructura de las tablas, ejecutar consultas SQL y enviar respuestas. Las consultas SQL exigen obligatoriamente condiciones de filtrado y prohíben SELECT *, lo que obliga al Agent a tomar solo los datos necesarios, en lugar de volcar toda la tabla.

Snorkel AI colabora con el equipo rLLM de la Universidad de California en Berkeley para hacer fine-tuning por aprendizaje por refuerzo de Qwen3-4B con FinQA; el resultado alcanza 59.7% de puntuación en el benchmark de preguntas y respuestas financieras SnorkelFinance, superando a Qwen3-235B de la misma familia (51.37%). El tamaño de parámetros es de aproximadamente 1/60 del segundo, y el costo de inferencia se reduce en alrededor de 90%. Hallazgos clave: los modelos grandes pueden razonar, pero generan nombres de columnas alucinados y hacen caso omiso a las restricciones SQL; en cambio, los modelos pequeños después del entrenamiento RL pueden llamar con precisión a las herramientas. El cuello de botella no es el tamaño, sino la “disciplina de herramientas”.

FinQA es el primer entorno de código abierto que Snorkel AI publica en OpenEnv; posteriormente se lanzarán entornos empresariales multinivel que cubran industrias como salud, seguros y derecho.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Comentar

0/400

Sin comentarios