最近 @SentientAGI 团队在 NeurIPS 2025 的 Lock-LLMs 工作坊上又交了一份硬核答卷——论文《OML: Cryptographic Primitives for Verifiable Control in Open-Weight LLMs》提出了一套开源大模型可验证控制的新方法:OML(Open Model License / Ownership Marking Layer)。



核心亮点很直观:把控制逻辑嵌入模型推理管线,实现开源模型也能安全、可验证地运行。它的三层设计让人印象深刻:
1️⃣ 可验证性:零知识证明保证每次调用合法;
2️⃣ 强制性:TEE(可信执行环境)防止绕过;
3️⃣ 货币化:区块链与 NFT 结合,实现模型收益溯源。

与传统水印不同,OML 能在白盒下仍然保持控制能力,实验显示在模型蒸馏与参数窃取检测中准确率超过 97%,性能损失低于 2%。可以说,这是开放模型安全治理的一个关键拐点。

有趣的是,OML 将模型拆分为控制平面和数据平面两大角色:
控制平面像严格的监管者,管理谁能调用模型、遵守哪些政策、记录每次操作,并生成带签名的运行清单与不可篡改的审计日志;

数据平面则专注“干活”,处理 tokens,不掺杂其他事务。

这种分工让模型即便在本地运行,也无需依赖中心化 API,同时保证授权、溯源、审计全程可控。Sentient 在 Llama-3.1-8B 微调版本中嵌入了 24,576 个密钥-响应对,保持性能稳定,微调、蒸馏或混合后依然有效,真正让 AI 模型拥有“签名”和版权保护。

与此同时,Sentient 的 LiveCodeBench Pro 则把 AI 编程能力拉回真实战场:
高难度编程题目 AI 通过率几乎为零;从阅读题面、设计方案、生成代码到编译执行,每个环节都严格遵循算法竞赛标准;覆盖 Codeforces、ICPC、IOI 等权威竞赛题目,采用 Elo 动态难度评级系统;本地复现、隐藏测试与完整日志生成,让模型能力可验证、可追踪。

在生成式 AI 追求高分与提示技巧的当下,LiveCodeBench Pro 是一面清晰镜子,展示模型在算法理解、长程逻辑和复杂度控制上的真实边界,让“模型会写代码”不再只是虚名。

@SentientAGI 正在用 OML 和 LiveCodeBench Pro,重塑 AI 的安全、可控与能力标准。开放模型有了版权保护,AI 编程有了真实考场,这是社区驱动开源 AGI 的重要里程碑。

#KaitoYap @KaitoAI #Yap #Sentient
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)