تعديل RL الدقيق يتجاوز نموذج 4B في الأسئلة المالية على نموذج 235B: Snorkel AI تفتح بيئة تدريب FinQA كمصدر مفتوح

BlockBeatNews

وفقًا لمتابعة 1M AI News، أطلقت Snorkel AI FinQA، وهو بيئة تدريب للتعلّم المعزّز تُبنى اعتمادًا على مستندات SEC 10-K المالية الحقيقية، وقد تم إتاحتها مفتوحة المصدر الآن على منصة OpenEnv التي تُدار بالتعاون بين Meta وPyTorch وHugging Face. تغطي FinQA 290 سؤالًا وأجوبة مالية مُعلَّمة من خبراء عبر 22 شركة مدرجة في البورصة (بما في ذلك Alphabet وAmazon وApple وBank of America وBoeing)، وتزوّد الـ Agent بـ 4 أدوات من نوع MCP: عرض الجداول المالية المتاحة، الحصول على بنية الجدول، تنفيذ استعلامات SQL، وتقديم الإجابات. تفرض SQL اشتراطات التصفية وتمنع SELECT *، ما يجبر الـ Agent على استخراج البيانات المطلوبة فقط بدلًا من تفريغ الجدول كاملًا.

تعاونت Snorkel AI مع فريق rLLM من جامعة كاليفورنيا بيركلي، حيث أجروا ضبطًا دقيقًا بالتعلّم المعزّز على Qwen3-4B باستخدام FinQA. وتُظهر النتائج تسجيل 59.7% على معيار الأسئلة والأجوبة المالية SnorkelFinance، متجاوزةً Qwen3-235B من نفس السلسلة (51.37%)، وبحجم معلمات يقارب 1/60 من الأخير، مع خفض تكاليف الاستدلال بنحو 90%. اكتشافات محورية: يمكن للنماذج الكبيرة إجراء الاستدلال، لكنها قد تولّد أسماء أعمدة هلوسية وتتجاهل قيود SQL؛ أما النموذج الأصغر بعد تدريب RL فيتمكن بدلًا من ذلك من استدعاء الأدوات بدقة، و«انضباط الأدوات» وليس الحجم هو ما يشكّل عنق الزجاجة.

FinQA هو أول بيئة مفتوحة المصدر تُنشر من Snorkel AI على OpenEnv، وستصدر لاحقًا بيئات مؤسسية متعددة الجولات تغطي قطاعات مثل الرعاية الصحية والتأمين والقانون وغيرها.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات