AI代理はすでにネットワークトラフィックの過半を占めているが、信頼性は急落している。発見、身元確認、評判の三大課題が規模拡大の障壁となっている。

動區BlockTempo
ETH-2.46%
EIGEN-2.84%

AIエージェントのトラフィックは人間を超え、全ネット活動の51%を占めている。しかし、完全自律型エージェントへの信頼度は43%から22%に低下している。エージェント経済を本格的に動かすには、発見性、本人確認、評判システムの三層の基盤インフラが不可欠である。この記事はVaidik Mandloiによる論文『Know your Agent』を元に、動区編集・翻訳されたものである。
(前提情報:ロシアは「ステーブルコイン専法案」の施行を今年7月にも予定しており、ステーブルコインの越境決済の潜在力に期待が高まっている)
(補足背景:アメリカFBIがJohn Daghitaを逮捕!政府の4,600万ドル相当の暗号資産を盗み出した後、派手に富を見せびらかし、露見した)

AIエージェントはインターネットの構造を変える約束を徐々に現実にしている。彼らはもはやチャットウィンドウ内の実験的ツールを超え、私たちの日常運営に欠かせない存在となっている。メールボックスの整理、会議のスケジューリング、サポートチケットへの返信など、彼らは静かに生産性を向上させており、その変化はしばしば見過ごされている。

しかし、この成長は単なる噂ではない。

2025年までに、自動化されたトラフィックは人間のトラフィックを超え、ネット全体の活動の51%を占める見込みだ。米国の小売サイトだけでも、AI駆動のトラフィックは前年比4700%増となっている。AIエージェントは今やシステムを横断して動作し、多くのエージェントはデータにアクセスし、ワークフローをトリガーし、取引を開始できる。

しかし、完全自律型エージェントへの信頼度は1年で43%から22%に低下しており、これは安全性に関する事件の増加に大きく起因している。半数近くの企業は依然として共有APIキーを用いてエージェントの本人確認を行っているが、この方法は自主システムが価値を移転したり独立して行動したりすることを想定して設計されていない。

問題は、エージェントの拡張速度が、それらを管理するためのインフラの速度を超えていることである。

これに対し、新たなプロトコル層が次々と登場している。ステーブルコインやカードネットワークの統合、x402のようなエージェントネイティブの標準規格は、機械発起の取引を実現しつつある。同時に、エージェントが構造化された環境内で自己認識し操作できるように、新たな本人確認・認証層も開発中だ。

しかし、支払いを実現することは経済を実現することと同じではない。エージェントが価値を移転できるようになったとき、より根本的な問題が浮上する。それは、「どうやって機械が適切なサービスを発見するのか」「どうやって本人確認と認可を行うのか」「どうやって彼らの行った操作が確かに行われたことを検証するのか」という問いである。

本稿では、エージェント駆動の経済が大規模に実行されるために必要なインフラを検討し、これらの層が機械速度での持続的・自主的な参加者を支えるのに十分成熟しているかどうかを評価する。

エージェントは見えないものを買えない

エージェントがサービスに支払いを行う前に、そのサービスを見つけなければならない。これは一見簡単に思えるが、実は最も摩擦の多い部分だ。

インターネットは人間がページを読むために構築されたものである。人間がコンテンツを検索すると、検索エンジンはランキング付きのリンクを返す。これらのページは説得力を最大化するよう最適化されている。レイアウト、トラッカー、広告、ナビゲーションバー、スタイル要素に満ちており、人間にとっては意味があるが、機械にとっては「ノイズ」に過ぎない。

エージェントが同じページをリクエストすると、受け取るのは生のHTMLだ。典型的なブログ記事や商品ページは、この形式で約16,000トークン必要となることもある。これをクリーンなMarkdownファイルに変換すると、トークン数は約3,000に減少する。つまり、モデルが処理すべき内容は80%削減されるわけだ。単一のリクエストではこの差はあまり問題にならないかもしれないが、エージェントが複数のサービスにわたって何千回もこのようなリクエストを送ると、過剰な処理は遅延やコスト、推論の複雑さの増大につながる。

@Cloudflare

エージェントは最終的に、インターフェースの要素を剥ぎ取り、行動に必要なコア情報にアクセスするために大量の計算リソースを費やす。この努力は出力の質を向上させるものではなく、むしろ彼らのために設計されていなかったネットワークの補償に過ぎない。

エージェント駆動のトラフィックが増加するにつれ、この非効率性はより顕著になる。小売やソフトウェアサイトのAIクローリングは過去1年で大幅に増加し、現在ではネット全体の活動の大部分を占めている。

同時に、主要なニュースやコンテンツサイトの約79%は少なくとも1つのAIクローラーをブロックしている。彼らの視点からは理解できる反応だ。エージェントがコンテンツを抽出する際、広告やサブスクリプション、従来のコンバージョンファネルとインタラクションしないため、収益保護のためにブロックしているのである。

問題は、ネットワークに悪意のあるクローラーと正当なエージェントを区別する信頼できる方法が存在しないことだ。両者とも自動トラフィックとして振る舞い、クラウドインフラから発信されている。システムにとっては、見た目は全く同じだ。

より深い問題は、エージェントは「ページを消費」しようとしているのではなく、「行動の可能性」を発見しようとしている点だ。

人間が「500ドル以下の航空券」を検索すると、ランキングリンクのリストで十分だ。人は選択肢を比較し、決定を下すことができる。一方、エージェントが同じ命令を受け取った場合、必要なのは全く異なる情報だ。どのサービスが予約リクエストを受け付けているのか、どの入力フォーマットが必要か、価格はどう計算されるのか、支払いはプログラム的に完結できるのか。これらの情報を明確に公開しているサービスはごく少数だ。

@TowardsAI

これが、検索エンジン最適化(SEO)からエージェント指向の発見性(Agent-Oriented Discoverability)、通称AEOへの移行が進む理由だ。もしエンドユーザーがエージェントであれば、検索ページのランキングはそれほど重要ではなくなる。重要なのは、サービスがエージェントが解読できる方法でその能力を記述できるかどうかだ。できなければ、そのサービスは拡大する経済活動の中で「見えない」存在になり得る。

エージェントには本人確認が必要

@Hackernoon

エージェントがサービスを発見し、取引を開始できるようになったら、次に重要な問題は、相手側のシステムに「誰とやり取りしているのか」を知らせることだ。つまり:本人確認である。

現在の金融システムでは、機械の本人確認は人間のそれよりもはるかに多い。金融分野では、非人間の本人確認と人間のそれの比率は約96対1だ。APIやサービスアカウント、自動化スクリプト、内部エージェントが金融インフラを支配している。これらの多くは資本の裁量権を持つように設計されていない。あらかじめ定義された命令を実行し、交渉やサプライヤーの選択、オープンネットワーク上での支払いを開始することはできない。

この境界線は、自己主導型エージェントによって変わりつつある。もしエージェントが、手動の確認なしに直接ステーブルコインを移動したり、決済フローをトリガーできるなら、核心的な問いは「支払えるかどうか」から「誰が支払いを許可しているのか」に変わる。

これが本人確認の重要性が高まる理由であり、「あなたのエージェントを知る」(Know Your Agent)という概念が生まれた背景だ。

金融機関が顧客の取引前に身元確認を行うのと同様に、自律エージェントとやり取りするサービスも、資本アクセスや敏感な操作を許可する前に、次の3つを検証しなければならない。

  • 暗号の真実性:このエージェントは本当にその鍵を制御しているのか?
  • 委任の許可:誰がこのエージェントに許可を与え、その制限は何か?
  • 実世界との関連:このエージェントは法的責任を持つ実体に結びついているのか?

これらの検証は、次のような「本人確認のスタック」を構成する。

  • 最下層は暗号鍵の生成と署名だ。ERC-8004のような標準は、エージェントが検証可能なブロックチェーン上のプロフィールにどのように錨(いかり)を打つかを正式化しようとしている。
  • 中間層はアイデンティティ・プロバイダー層だ。これにより、鍵は登録された法人、金融機関、検証済みの個人などの実体に結びつく。これがなければ、署名は制御権を証明するだけで、責任追及にはつながらない。
  • 最上層は検証インフラだ。支払い処理業者やCDN、アプリケーションサーバーがリアルタイムで署名を検証し、証明書を確認し、許可範囲を実行する。Visaの信頼エージェント・プロトコル(Trusted Agent Protocol)は、加盟店がエージェントが特定のユーザを代表して取引を行う権限を持つかどうかを検証できる仕組みの一例だ。Stripeのエージェント・ビジネス・プロトコル(ACP)は、類似の検証をプログラム可能な決済やステーブルコインの流れに拡張しつつある。

同時に、GoogleやShopifyが主導するユニバーサル・コマース・プロトコル(UCP)は、加盟店が発見・交渉できる「能力リスト」を公開できる仕組みを提供している。これは調整層として機能し、Google検索やGeminiに統合される予定だ。

@FintechBrainfood

重要な微妙な違いは、許可制と非許可制のシステムが共存することである。

パブリックブロックチェーン上では、エージェントは中央集権的なハードルなしに取引できる。これにより速度と組み合わせやすさは向上するが、規制の圧力も高まる。StripeによるBridge買収は、その緊張関係を象徴している。ステーブルコインは即時の越境送金を実現しているが、規制義務はチェーン上の決済だからといって消えるわけではない。

この緊張は避けられず、規制当局も巻き込まれる。自主エージェントが、直接人の監督なしに金融取引を開始し、市場と相互作用できるようになると、責任追及の問題は避けられなくなる。金融システムは、未識別または未承認の行為者を通じた資本の流動を許さない。たとえそれらがソフトウェアの断片であっても。

規制の枠組みはすでに採用されつつある。例えば、コロラド州AI法案は2026年2月1日に施行され、高リスクの自動化システムに対して責任追及の義務を導入している。世界的にも同様の立法が進行中だ。エージェントが金融決定を大規模に実行し始めると、本人確認はもはや選択肢ではなくなる。もし発見性がエージェントを見えるようにするなら、本人確認はそれらを認証する証明となる。

エージェントの実行と評判の検証

エージェントが金銭、契約、敏感情報を扱うタスクを実行し始めると、本人確認だけでは不十分になる。検証済みのエージェントであっても、幻覚を見たり、誤った結果を出したり、情報を漏らしたり、パフォーマンスが悪かったりする可能性がある。

したがって、最も重要な問いは、「エージェントが本当に自分の主張通りに仕事を完了したことを証明できるかどうか」である。

もしエージェントが1,000ファイルを分析し、詐欺パターンを検出し、取引戦略を実行したと宣言した場合、その計算が確かに行われたこと、出力が偽造や破損していないことを検証する方法が必要だ。そのために、性能層が必要となる。

現状、これを実現する方法は大きく分けて3つある。

  • TEE(信頼できる実行環境):最初の方法は、AWS NitroやIntel SGXなどのハードウェアを用いた証明に依存する。これは、エージェントが安全なエンクレーブ内で実行され、そのエンクレーブが暗号証明書を発行し、特定のコードが特定のデータ上で実行され、改ざんされていないことを確認させる仕組みだ。オーバーヘッドは比較的小さく(遅延は約5-10%増)、信頼性重視の金融・企業用途には許容範囲内だ。
  • ZKML(ゼロ知識機械学習):次の方法は数学的アプローチだ。ZKMLは、特定のモデルから出力されたことを暗号証明として生成でき、モデルの重みや秘密の入力を漏らすことなく証明できる。Lagrange LabsのDeepProve-1は、GPT-2の推論において全ゼロ知識証明を最近デモンストレーションし、従来の方法より54〜158倍高速だ。
  • リステーク・セキュリティ(Restake Security):最後のモデルは、計算ではなく経済的手段によって正しさを強制する。EigenLayerのようなプロトコルは、ステーキングに基づく安全性を導入し、検証者はエージェントの出力の背後に資本をステークする。出力に疑義が生じ、虚偽と証明された場合、ステーク資産は差し控えられる(Slashing)。この仕組みは、計算の正確性を証明するのではなく、不誠実な行為を経済的に不合理にさせることを目的としている。

これらのメカニズムは、異なる角度から同じ問題を解決しようとしている。しかし、証明は一時的なものであり、市場は蓄積的な信頼を必要とする。そこで、評判が重要になる。

評判は、孤立した証明を長期的な性能履歴に変換する。新興のシステムは、エージェントの性能を携帯可能かつ暗号的に錨付けし、プラットフォーム固有の評価や不透明な内部ダッシュボードに依存しない設計を目指している。

Ethereumの証明サービス(EAS)は、ユーザーやサービスがエージェントの行動に関する署名済みのオンチェーン証明を公開できる仕組みだ。成功したタスク、正確な予測、コンプライアンスを満たした取引は改ざん防止の形で記録され、エージェント間を越えて移動できる。

@EAS

競争的なベンチマーク環境も形成されつつある。エージェントアリーナ(Agent Arenas)は、標準化されたタスクに基づきエージェントを評価し、Eloなどのスコアリングシステムでランキング付けを行う。Recall Networkの報告によると、11万人以上の参加者が588万件の予測を行い、性能の測定データを生成している。これらのシステムの拡張により、AIエージェントの真の評価市場に近づきつつある。

これにより、評判はプラットフォームを越えて持ち運び可能となる。

従来の金融では、ムーディーズ(Moody’s)などの機関が債券を格付けし、信用シグナルを発している。エージェント経済も、非人間行為者を評価するための同等の層を必要とする。市場は、あるエージェントが十分に信頼できるか、資本を委託できるか、その出力が統計的に一貫しているか、長期的に安定して行動できるかを評価する必要がある。

結論

エージェントが本格的な権威を持ち始めると、市場はその信頼性を測る明確な方法を必要とする。エージェントは、検証済みの実行とベンチマークによる性能記録を携帯し、その質の低下に応じて評価が調整され、許可権は明確な承認に遡及できるものとなる。保険会社、商取引者、規制システムは、これらのデータに依存して、どのエージェントが資本やデータ、規制対象のワークフローにアクセスできるかを判断する。

要するに、これらの層はエージェント経済のインフラを構築し始めている。

  • 発見性(Discoverability):エージェントはサービスを機械可読の方法で発見できなければならない。さもなければ機会を見つけられない。
  • 本人確認(Identity):エージェントは自分が誰で、誰が許可したのかを証明しなければならない。さもなければシステムに入れない。
  • 評判(Reputation):エージェントは信頼に値することを証明する検証可能な記録を作り、継続的な経済的信用を獲得しなければならない。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし