تعديل RL الدقيق يتجاوز نموذج 4B في الأسئلة المالية على نموذج 235B: Snorkel AI تفتح بيئة تدريب FinQA كمصدر مفتوح

CoinNetwork

تقرير من موقع CoinJie Network: وفقًا لمراقبة 1M AI News، قامت Snorkel AI بإطلاق FinQA، وهو بيئة تدريب للتعلم المعزز مبنية على وثائق مالية حقيقية من SEC 10-K، وقد تم إتاحتها كمصدر مفتوح على منصة OpenEnv التي يديرها ويصونها كلٌّ من Meta وPyTorch وHugging Face. يغطي FinQA 290 سؤالًا وجوابًا ماليًا معنونة بخبراء لـ 22 شركة مدرجة في البورصة (بما في ذلك Alphabet وAmazon وApple وBank of America وBoeing)، ويزوّد الـ Agent بـ 4 أدوات من MCP: سرد جداول البيانات المالية المتاحة، جلب بنية الجدول، تنفيذ استعلامات SQL، وتقديم الإجابة. تفرض SQL شرط التصفية وتمنع SELECT *، ما يجبر الـ Agent على أخذ البيانات المطلوبة فقط بدلًا من تفريغ الجدول كاملًا. تعاونت Snorkel AI مع فريق rLLM التابع لجامعة كاليفورنيا بيركلي، وقاموا باستخدام FinQA لإجراء ضبط دقيق للتعلم المعزز على Qwen3-4B؛ ونتيجة لذلك، سجل النموذج 59.7% على معيار الأسئلة والأجوبة المالية SnorkelFinance، متجاوزًا Qwen3-235B من نفس السلسلة (51.37%)، بينما كانت كمية المعلمات تقريبًا 1/60 من الأخير، وانخفضت تكلفة الاستدلال بنحو 90%. النتائج الأساسية: يمكن للنماذج الكبيرة أن تستدل، لكنها تنتج أسماء أعمدة وهمية وتتجاهل قيود SQL؛ أما النموذج الصغير بعد تدريب RL فيمكنه بدلًا من ذلك استدعاء الأدوات بدقة، وأن «انضباط الأدوات» وليس الحجم هو ما يشكّل عنق الزجاجة. يُعد FinQA أول بيئة مفتوحة المصدر تطلقها Snorkel AI على OpenEnv، ومن المتوقع لاحقًا إصدار بيئات شركات متعددة الجولات تغطي صناعات مثل الرعاية الصحية والتأمين والقانون وغيرها.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات