Pantera与Franklin Templeton加入Sentient Arena,共同测试企业级AI代理性能

PANews 2月27日消息,据Cointelegraph报道,开源AI实验室Sentient宣布推出Arena,这是一个用于评估AI代理在企业级工作流程中表现的生产级测试环境。Pantera Capital和Franklin Templeton的数字资产部门已加入Arena的首批测试队列。 Sentient表示,Arena并非静态模型测试,而是通过模拟包含长文档、不完整信息和冲突来源的企业条件,对AI代理进行标准化任务测试。平台会跟踪幻觉、证据缺失、引用错误和推理漏洞等失败类别,帮助开发者诊断问题。Arena计划通过公开排行榜发布对比性能指标,并发布总结常见失败模式和修复方案的测试报告。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

USDH 发行方 Native Markets 推出代币化保证金产品 pmUSDH

3月15日,Hyperliquid原生稳定币USDH的发行方Native Markets推出了代币化保证金产品pmUSDH,用户可将存入的USDH转化为ERC-20格式的pmUSDH。该代币不仅可获取借款利息,还能在多个DeFi协议中使用。

GateNews10 分钟前

Aave 就「将年回购预算从 5000 万美元下调至 3000 万美元」进行投票,当前支持率 99.37%

Aave DAO 正在对将年度回购预算从 5000 万美元下调至 3000 万美元的提案进行投票,当前支持率为 99.37%。提案因收入下降和预算赤字而提出,若通过将进入正式投票阶段。

GateNews44 分钟前

Vitalik 解读以太坊基金会新使命:将加倍投入并推动其成为"技术避风港"

Vitalik Buterin在X平台解读以太坊基金会的新使命宣言,强调以太坊作为“技术避风港”的独特角色,致力于维护技术自我主权,防止绝对控制,并推进CROPS原则,关注去中心化与用户体验,以推动以太坊生态发展。

GateNews46 分钟前

Aave 将推出 Aave Shield 功能,默认阻止价格影响超 25% 的 Swap

Aave 发布了 Swap 事件复盘,称一用户在流动性低的市场执行超大订单,导致价格影响约99.9%。Aave 将推出 Aave Shield 功能,默认阻止价格影响超过25%的交易。

GateNews1小时前

微软内部测试 OpenClaw,下周将推出路线图

Gate News 消息,3 月 15 日,OpenClaw for Microsoft Teams 将迎来重大改进,下周将推出一份路线图。目前,OpenClaw 团队已与十几位微软员工进行交流,并组建了一个六人团队,微软正在内部测试 OpenClaw。预计 Microsoft Teams 以及其他扩展程序和插件将得到更好的改进。

GateNews1小时前

Circle Introduces AI Skills for USDC, EURC Blockchain Tools

Circle Skills lets AI agents perform payments, wallet tasks, and smart contract actions using USDC and EURC. Tool integrates with AI platforms like Cursor, Claude Code, and Codex to build stablecoin apps faster. Circle tested AI agents with a $30K USDC hackathon that produced 204

CryptoFrontNews5小时前
评论
0/400
暂无评论