وفقًا لمتابعة 1M AI News، أطلقت Snorkel AI FinQA، وهو بيئة تدريب للتعلّم المعزّز تُبنى اعتمادًا على مستندات SEC 10-K المالية الحقيقية، وقد تم إتاحتها مفتوحة المصدر الآن على منصة OpenEnv التي تُدار بالتعاون بين Meta وPyTorch وHugging Face. تغطي FinQA 290 سؤالًا وأجوبة مالية مُعلَّمة من خبراء عبر 22 شركة مدرجة في البورصة (بما في ذلك Alphabet وAmazon وApple وBank of America وBoeing)، وتزوّد الـ Agent بـ 4 أدوات من نوع MCP: عرض الجداول المالية المتاحة، الحصول على بنية الجدول، تنفيذ استعلامات SQL، وتقديم الإجابات. تفرض SQL اشتراطات التصفية وتمنع SELECT *، ما يجبر الـ Agent على استخراج البيانات المطلوبة فقط بدلًا من تفريغ الجدول كاملًا.
تعاونت Snorkel AI مع فريق rLLM من جامعة كاليفورنيا بيركلي، حيث أجروا ضبطًا دقيقًا بالتعلّم المعزّز على Qwen3-4B باستخدام FinQA. وتُظهر النتائج تسجيل 59.7% على معيار الأسئلة والأجوبة المالية SnorkelFinance، متجاوزةً Qwen3-235B من نفس السلسلة (51.37%)، وبحجم معلمات يقارب 1/60 من الأخير، مع خفض تكاليف الاستدلال بنحو 90%. اكتشافات محورية: يمكن للنماذج الكبيرة إجراء الاستدلال، لكنها قد تولّد أسماء أعمدة هلوسية وتتجاهل قيود SQL؛ أما النموذج الأصغر بعد تدريب RL فيتمكن بدلًا من ذلك من استدعاء الأدوات بدقة، و«انضباط الأدوات» وليس الحجم هو ما يشكّل عنق الزجاجة.
FinQA هو أول بيئة مفتوحة المصدر تُنشر من Snorkel AI على OpenEnv، وستصدر لاحقًا بيئات مؤسسية متعددة الجولات تغطي قطاعات مثل الرعاية الصحية والتأمين والقانون وغيرها.