Según el monitoreo de 1M AI News, Snorkel AI lanzó FinQA, un entorno de entrenamiento de aprendizaje por refuerzo construido sobre documentos financieros reales SEC 10-K, que ya fue liberado como código abierto en la plataforma OpenEnv, mantenida conjuntamente por Meta PyTorch y Hugging Face. FinQA abarca 290 preguntas y respuestas financieras anotadas por expertos de 22 empresas cotizadas (incluyendo Alphabet, Amazon, Apple, Bank of America y Boeing), y proporciona a los Agents 4 herramientas MCP: listar las tablas financieras disponibles, obtener la estructura de las tablas, ejecutar consultas SQL y enviar respuestas. Las consultas SQL exigen obligatoriamente condiciones de filtrado y prohíben SELECT *, lo que obliga al Agent a tomar solo los datos necesarios, en lugar de volcar toda la tabla.
Snorkel AI colabora con el equipo rLLM de la Universidad de California en Berkeley para hacer fine-tuning por aprendizaje por refuerzo de Qwen3-4B con FinQA; el resultado alcanza 59.7% de puntuación en el benchmark de preguntas y respuestas financieras SnorkelFinance, superando a Qwen3-235B de la misma familia (51.37%). El tamaño de parámetros es de aproximadamente 1/60 del segundo, y el costo de inferencia se reduce en alrededor de 90%. Hallazgos clave: los modelos grandes pueden razonar, pero generan nombres de columnas alucinados y hacen caso omiso a las restricciones SQL; en cambio, los modelos pequeños después del entrenamiento RL pueden llamar con precisión a las herramientas. El cuello de botella no es el tamaño, sino la “disciplina de herramientas”.
FinQA es el primer entorno de código abierto que Snorkel AI publica en OpenEnv; posteriormente se lanzarán entornos empresariales multinivel que cubran industrias como salud, seguros y derecho.