最近 @SentientAGI 團隊在 NeurIPS 2025 的 Lock-LLMs 工作坊上又交了一份硬核答卷——論文《OML: Cryptographic Primitives for Verifiable Control in Open-Weight LLMs》提出了一套開源大模型可驗證控制的新方法:OML(Open Model License / Ownership Marking Layer)。



核心亮點很直觀:把控制邏輯嵌入模型推理管線,實現開源模型也能安全、可驗證地運行。它的三層設計讓人印象深刻:
1️⃣ 可驗證性:零知識證明保證每次調用合法;
2️⃣ 強制性:TEE(可信執行環境)防止繞過;
3️⃣ 貨幣化:區塊鏈與 NFT 結合,實現模型收益溯源。

與傳統水印不同,OML 能在白盒下仍然保持控制能力,實驗顯示在模型蒸餾與參數竊取檢測中準確率超過 97%,性能損失低於 2%。可以說,這是開放模型安全治理的一個關鍵拐點。

有趣的是,OML 將模型拆分爲控制平面和數據平面兩大角色:
控制平面像嚴格的監管者,管理誰能調用模型、遵守哪些政策、記錄每次操作,並生成帶籤名的運行清單與不可篡改的審計日志;

數據平面則專注“幹活”,處理 tokens,不摻雜其他事務。

這種分工讓模型即便在本地運行,也無需依賴中心化 API,同時保證授權、溯源、審計全程可控。Sentient 在 Llama-3.1-8B 微調版本中嵌入了 24,576 個密鑰-響應對,保持性能穩定,微調、蒸餾或混合後依然有效,真正讓 AI 模型擁有“籤名”和版權保護。

與此同時,Sentient 的 LiveCodeBench Pro 則把 AI 編程能力拉回真實戰場:
高難度編程題目 AI 通過率幾乎爲零;從閱讀題面、設計方案、生成代碼到編譯執行,每個環節都嚴格遵循算法競賽標準;覆蓋 Codeforces、ICPC、IOI 等權威競賽題目,採用 Elo 動態難度評級系統;本地復現、隱藏測試與完整日志生成,讓模型能力可驗證、可追蹤。

在生成式 AI 追求高分與提示技巧的當下,LiveCodeBench Pro 是一面清晰鏡子,展示模型在算法理解、長程邏輯和復雜度控制上的真實邊界,讓“模型會寫代碼”不再只是虛名。

@SentientAGI 正在用 OML 和 LiveCodeBench Pro,重塑 AI 的安全、可控與能力標準。開放模型有了版權保護,AI 編程有了真實考場,這是社區驅動開源 AGI 的重要裏程碑。

#KaitoYap @KaitoAI #Yap #Sentient
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)