1M AI Newsのモニタリングによると、Snorkel AIは、実在するSEC 10-Kの財務書類をベースに構築した強化学習トレーニング環境「FinQA」をリリースしました。これは、MetaのPyTorchとHugging Faceが共同で運営するOpenEnvプラットフォームで、すでにオープンソース化されています。FinQAは、22社の上場企業(Alphabet、アマゾン、アップル、米国銀行、ボーイングなど)を対象に、専門家が注釈を付けた290件の財務に関する質問応答をカバーし、Agentに対して4つのMCPツールを提供します。利用可能な財務テーブルの一覧、テーブル構造の取得、SQLクエリの実行、回答の提出です。SQLではフィルタ条件の指定が必須で、かつSELECT *は禁止されており、Agentに必要なデータだけを取得させることで、テーブル全体をそのまま投棄するのではなく、必要な情報を取りに行かせます。
Snorkel AIは、カリフォルニア大学バークレー校のrLLMチームと協力して、FinQAを用いてQwen3-4Bに強化学習による微調整を実施しました。その結果、金融に関する質問応答ベンチマークであるSnorkelFinanceで59.7%を獲得し、同系統のQwen3-235B(51.37%)を上回りました。パラメータ量は後者の約1/60で、推論コストは約90%低下しました。重要な発見として、大規模モデルは推論できる一方で、幻覚の列名を生成したり、SQLの制約を無視したりします。RLトレーニング後の小型モデルは、逆にツールを正確に呼び出せます。「規模」ではなく「ツールの規律」がボトルネックなのです。
FinQAは、Snorkel AIがOpenEnvで公開した最初のオープンソース環境であり、今後は医療、保険、法律などの業界を対象にした多段(多ラウンド)の企業環境を展開していく予定です。