最近、@SentientAGIチームは、NeurIPS 2025のLock-LLMsワークショップで、別のハードコアな解答用紙を提出しました - 論文「OML:Open-Weight LLMsにおける検証可能な制御のための暗号化プリミティブ」は、オープンソースの大規模モデル検証可能な制御方法の新しいセットを提案しました:OML(Open Model License、/ 所有権マーキング レイヤー)。



コアのハイライトは非常に直感的です:コントロールロジックをモデル推論パイプラインに組み込み、オープンソースモデルでも安全かつ検証可能に動作させることができます。その三層設計は印象的です:
1️⃣ 検証可能性:ゼロ知識証明は毎回の呼び出しが合法であることを保証します;
2️⃣ 強制的:TEE(信頼できる実行環境)がバイパスを防止する;
3️⃣ マネタイズ:ブロックチェーンと NFT の組み合わせにより、モデルの収益の出所を追跡する。

従来のウォーターマークとは異なり、OMLはホワイトボックス下でも制御能力を維持することができ、実験ではモデル蒸留とパラメータ窃盗検出において97%以上の精度を示し、性能損失は2%未満です。これはオープンモデルの安全ガバナンスにおける重要な転換点であると言えます。

興味深いことに、OMLはモデルをコントロールプレーンとデータプレーンの2つの役割に分割します:
コントロールプレーンは厳格な規制当局のように、誰がモデルを呼び出すことができるか、どのポリシーに従うかを管理し、各操作を記録し、署名された実行リストと改ざん不可能な監査ログを生成します;

データプレーンは「作業」に集中し、トークンを処理し、他の業務を混ぜません。

このような分業により、モデルはローカルで実行される場合でも、中央集権的なAPIに依存することなく、同時に認可、トレーサビリティ、監査を全て制御できます。SentientはLlama-3.1-8B微調整バージョンに24,576のキー-レスポンスペアを埋め込み、パフォーマンスを安定させ、微調整、蒸留、または混合後も依然として有効で、AIモデルに「署名」と著作権保護を実現します。

一方で、Sentient の LiveCodeBench Pro は AI プログラミング能力をリアルな戦場に引き戻します:
難易度の高いプログラミング問題に対するAIの合格率はほぼゼロです。問題文の読み取り、設計、コード生成、コンパイル実行の各ステップは、アルゴリズムコンペティションの基準に厳密に従っています。Codeforces、ICPC、IOIなどの権威ある競技問題をカバーし、Elo動的難易度評価システムを採用しています。ローカル再現、隠れテスト、完全なログ生成により、モデルの能力は検証可能で追跡可能です。

生成型AIが高得点とプロンプト技術を追求する中、LiveCodeBench Proは、アルゴリズムの理解、長期的な論理、複雑さの制御におけるモデルの真の限界を示す明確な鏡です。「モデルがコードを書く」というのはもはや単なる虚名ではありません。

@SentientAGI は OML と LiveCodeBench Pro を使用して、AI の安全性、制御性、能力基準を再構築しています。オープンモデルには著作権保護が施され、AI プログラミングには実際の試験環境が整いました。これはコミュニティ主導のオープンソース AGI の重要なマイルストーンです。

#KaitoYap @KaitoAI #Yap #Sentient
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)