RL微調により、4Bモデルの金融質問応答が235Bを超える:Snorkel AIによるオープンソースのFinQAトレーニング環境

BlockBeatNews

1M AI Newsのモニタリングによると、Snorkel AIは、実在するSEC 10-Kの財務書類をベースに構築した強化学習トレーニング環境「FinQA」をリリースしました。これは、MetaのPyTorchとHugging Faceが共同で運営するOpenEnvプラットフォームで、すでにオープンソース化されています。FinQAは、22社の上場企業(Alphabet、アマゾン、アップル、米国銀行、ボーイングなど)を対象に、専門家が注釈を付けた290件の財務に関する質問応答をカバーし、Agentに対して4つのMCPツールを提供します。利用可能な財務テーブルの一覧、テーブル構造の取得、SQLクエリの実行、回答の提出です。SQLではフィルタ条件の指定が必須で、かつSELECT *は禁止されており、Agentに必要なデータだけを取得させることで、テーブル全体をそのまま投棄するのではなく、必要な情報を取りに行かせます。

Snorkel AIは、カリフォルニア大学バークレー校のrLLMチームと協力して、FinQAを用いてQwen3-4Bに強化学習による微調整を実施しました。その結果、金融に関する質問応答ベンチマークであるSnorkelFinanceで59.7%を獲得し、同系統のQwen3-235B(51.37%)を上回りました。パラメータ量は後者の約1/60で、推論コストは約90%低下しました。重要な発見として、大規模モデルは推論できる一方で、幻覚の列名を生成したり、SQLの制約を無視したりします。RLトレーニング後の小型モデルは、逆にツールを正確に呼び出せます。「規模」ではなく「ツールの規律」がボトルネックなのです。

FinQAは、Snorkel AIがOpenEnvで公開した最初のオープンソース環境であり、今後は医療、保険、法律などの業界を対象にした多段(多ラウンド)の企業環境を展開していく予定です。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし