著者:DWF Ventures翻訳:深潮 TechFlow深潮ガイド:AIエージェントはすでにDeFiの取引量の約5分の1を占めており、収益最適化のようなルールが明確なシナリオでは確かに人間を凌駕しています。しかし、実際に自主取引をさせると、トップクラスのAIのパフォーマンスはトップ人間の5分の1にも満たない。この研究は、DeFiのさまざまなシナリオにおけるAIの実際のパフォーマンスを解剖し、自動化取引に関心のあるすべての人にとって価値ある内容です。核心ポイント自動化とエージェント活動は現在、すべてのオンチェーン活動の約19%を占めていますが、真のエンドツーエンドの自主性はまだ実現していません。収益最適化などの狭く明確に定義されたユースケースでは、エージェントは人間やボットよりも優れたパフォーマンスを示しています。しかし、取引など多方面の行動に関しては、人間の方がエージェントよりも優れています。エージェント間では、モデル選択とリスク管理が取引パフォーマンスに最も大きな影響を与えています。エージェントの大規模採用に伴い、信頼や実行に関するリスクが複数存在します。これには、女巫攻撃、戦略の飽和、プライバシーのトレードオフなどが含まれます。エージェント活動は継続的に増加過去1年間、エージェント活動は着実に増加し、取引量と取引数の両方が増えています。特に、Coinbaseのx402プロトコルが大きな進展を牽引し、Visa、Stripe、Googleなどのプレイヤーも参入し、自社の標準を打ち出しています。現在構築中のインフラの大部分は、エージェント間のチャネルや人間がトリガーするエージェント呼び出しの2つのシナリオにサービスを提供することを目的としています。ステーブルコインの取引は広くサポートされていますが、現状のインフラは依然として従来の決済ゲートウェイに依存しており、これは中央集権的な対抗者に依存していることを意味します。したがって、エージェントが自己資金調達、自己実行、そして絶えず変化する条件に基づいて最適化を続ける「完全自主」なエンドポイントはまだ実現していません。エージェントはDeFiにとって全く未知のものではありません。長年にわたり、オンチェーンのプロトコルにはボットを用いた自動化が存在し、MEVを捕捉したり、コードなしでは実現できない超過収益を得たりしてきました。これらのシステムは、頻繁に変化しない明確なパラメータの下で非常に良く動作しますが、市場は時間とともにより複雑になっています。これが、私たちが次世代のエージェントの登場を目の当たりにしている理由であり、過去数ヶ月、オンチェーンはこうした活動の実験場となっています。エージェントの実際のパフォーマンスレポートによると、エージェント活動は指数関数的に増加しており、2025年以降、1万7000以上のエージェントが稼働しています。自動化/エージェント活動の総量は、すべてのオンチェーン活動の19%以上をカバーしていると推定されます。これは驚くべきことではありません。なぜなら、推定で全ステーブルコインの送金量の76%以上がボットによって生成されているからです。これにより、DeFiにおけるエージェント活動は大きな成長余地を持つことが示唆されます。エージェントの自主性は広範囲にわたります。高度な人間の監督を必要とするチャットボットのような体験から、市場条件に応じて戦略を調整できるエージェントまでさまざまです。ボットと比べて、エージェントにはいくつかの重要な利点があります。例えば、ミリ秒以内に新情報に反応し実行できる能力や、同じ厳格さを保ちながら数千の市場にわたるカバレッジを拡大できる点です。現状、多くのエージェントは分析者や副操縦士レベルにとどまっており、多くはテスト段階にあります。収益最適化:エージェントのパフォーマンスは優秀流動性提供は自動化が頻繁に行われている分野であり、エージェントが保有する総TVLは3900万ドルを超えています。この数字は、ユーザーが直接エージェントに預けた資産を主に示していますが、金庫ルーティングの資本は含まれていません。Giza Techはこの分野で最大級のプロトコルの一つで、昨年末に最初のエージェントアプリARMAをリリースし、主要なDeFiプロトコルの収益捕捉を強化しました。管理資産は1900万ドルを超え、エージェント取引量は400億ドルを超えています。取引量と管理資産の比率が高いことは、エージェントが頻繁に資本をリバランスし、より高い収益を狙っていることを示しています。資本がコントラクトに預けられると、自動化された実行が行われ、ほぼ監督不要のワンボタン体験を提供します。ARMAのパフォーマンスは測定可能で、USDCで年率9.75%以上のリターンを生み出しています。追加のリバランス費用やエージェントの10%のパフォーマンスフィーを考慮しても、リターンはAaveやMorphoの普通の貸付を上回っています。それでも、スケーラビリティは依然として重要な課題です。これらのエージェントは実戦での管理や主要なDeFiプロトコルへの拡張にはまだ十分にテストされていません。取引:人間が圧倒的にリードしかし、より複雑な行動、特に取引に関しては結果は多様です。現在の取引モデルは人間が定義した入力に基づき、事前設定されたルールに従って出力を提供します。機械学習は、新情報に基づいてモデルの行動を更新できるようにし、明示的な再プログラミングなしに副操縦士的役割を果たすことでこれを拡張します。完全な自主エージェントが登場すれば、取引の構図は大きく変わるでしょう。すでにいくつかのエージェント間や人間とエージェントの取引コンテストが開催されており、モデル間には大きな差異があることが示されています。Trade XYZは、そのプラットフォームに上場している株式の人間対エージェントの取引コンテストを実施しました。各アカウントは10,000ドルの初期資金を持ち、レバレッジや取引頻度に制限はありません。結果は圧倒的に人間側に偏り、トップ人間のパフォーマンスはトップエージェントの5倍以上高かったです。一方、Nof1は複数のモデル(Grok-4、GPT-5、Deepseek、Kimi、Qwen3、Claude、Gemini)間のエージェント取引コンテストを開催し、資本の保全から最大レバレッジまでさまざまなリスク設定をテストしました。結果から、パフォーマンス差を説明するいくつかの要因が明らかになりました。ポジション保持時間:強い相関があり、平均2〜3時間保持のモデルは頻繁にポジションを入れ替えるモデルよりも大きく優れています。期待値:各取引の平均的な収益性を示します。興味深いことに、上位3つのモデルだけが正の期待値を持ち、多くのモデルは損失取引の方が多いことを示しています。レバレッジ:平均6〜8倍の低レバレッジの方が、10倍超の高レバレッジモデルよりも良好な結果を出すことが証明されました。高レバレッジは損失を加速させるリスクがあります。ヒント戦略:Monk Modeはこれまでで最も良いパフォーマンスを示し、Situational Awarenessは最も悪い結果でした。モデルの特徴に基づき、リスク管理に集中し外部情報を少なくすることが良い結果につながることが示されています。基本モデル:Grok 4.20は、さまざまなヒント戦略の中で他のモデルより22%以上優れており、唯一平均的に利益を出しているモデルです。その他の要因(多空の偏好、取引規模、信頼度スコアなど)については十分なデータがなく、モデルのパフォーマンスと正の相関があることも証明されていません。全体として、結果は、エージェントは明確に定義された制約内でより良く動作する傾向があり、人間は目標設定において依然として重要な役割を果たしていることを示しています。エージェントの評価方法エージェントはまだ初期段階にあるため、包括的な評価フレームワークは存在しません。過去のパフォーマンスは一般的に評価の基準として使われますが、それらは基礎的な要素に左右され、これらの要素はエージェントの優れたパフォーマンスのより強い兆候を提供します。異なるボラティリティ下でのパフォーマンス:条件が悪化した場合の規律ある損失コントロールを含み、エージェントが取引の収益性に影響を与えるオフチェーン要因を識別できることを示しています。透明性とプライバシー:双方にはトレードオフがあります。透明なエージェントは、積極的にコピーされる可能性があるため、戦略上の優位性はほとんどありません。プライベートなエージェントは、作成者内部の情報抽出リスクに直面し、作成者が自分のユーザーに対して情報優位を保つことが可能です。情報源:エージェントがアクセスするデータソースは、エージェントの意思決定にとって極めて重要です。信頼できるソースであり、単一依存を避けることが不可欠です。セキュリティ:スマートコントラクトの監査や適切な資金管理構造を持ち、ブラックスワンイベントに備えることが非常に重要です。エージェントの次のステップエージェントを大規模に採用するには、インフラ面で多くの作業が必要です。これは、エージェントの信頼と実行に関わる重要な問題に集約されます。自主的なエージェントの行動にはバリアがなく、資金管理の不備例も既に発生しています。ERC-8004は2026年1月にローンチされ、最初のオンチェーン登録簿となり、自律エージェントが相互に発見し、検証可能な評判を築き、安全に協働できる仕組みを提供します。これはDeFiのコンポーザビリティの重要な解放であり、信頼スコアがスマートコントラクトに埋め込まれることで、エージェントとプロトコル間の非許可型活動を可能にします。ただし、これだけではエージェントが常に悪意なく動作する保証はなく、連携評判や女巫攻撃などのセキュリティ脆弱性は依然として存在します。したがって、保険、安全性、エージェントの経済的ステークなどの分野で大きな改善余地があります。DeFiにおけるエージェント活動の拡大に伴い、戦略の飽和が構造的リスクとなる可能性があります。収益農場は最も明確な例であり、戦略の普及によりリターンは圧縮されていきます。同じダイナミクスはエージェント取引にも当てはまる可能性があり、多数のエージェントが類似のデータを用いて類似の目標を最適化すれば、類似のポジションや退出シグナルに収束することになります。コーネル大学が2026年1月に発表したCoinAlg論文は、この問題の一つの側面を正式化しています。透明なエージェントはアービトラージの対象となりやすく、その取引は予測可能であり、先回りされる可能性があります。一方、プライベートエージェントはこのリスクを回避しますが、作成者が内部情報を保持し続けるリスクや、不透明性による内部知識の価値抽出のリスクを伴います。エージェント活動は今後も加速し続け、今日築かれるインフラが次世代のオンチェーン金融のあり方を決定します。エージェントの利用率が高まるにつれ、自己改善とユーザーニーズへの適応も進むでしょう。したがって、最も差別化される要素は、信頼できるインフラに集約され、市場シェアの最大化につながると考えられます。
DWF 深度レポート:AIはDeFiで収益最適化において人間を超えるが、複雑な取引は依然として5倍遅れている
著者:DWF Ventures
翻訳:深潮 TechFlow
深潮ガイド:AIエージェントはすでにDeFiの取引量の約5分の1を占めており、収益最適化のようなルールが明確なシナリオでは確かに人間を凌駕しています。しかし、実際に自主取引をさせると、トップクラスのAIのパフォーマンスはトップ人間の5分の1にも満たない。この研究は、DeFiのさまざまなシナリオにおけるAIの実際のパフォーマンスを解剖し、自動化取引に関心のあるすべての人にとって価値ある内容です。
核心ポイント
自動化とエージェント活動は現在、すべてのオンチェーン活動の約19%を占めていますが、真のエンドツーエンドの自主性はまだ実現していません。
収益最適化などの狭く明確に定義されたユースケースでは、エージェントは人間やボットよりも優れたパフォーマンスを示しています。しかし、取引など多方面の行動に関しては、人間の方がエージェントよりも優れています。
エージェント間では、モデル選択とリスク管理が取引パフォーマンスに最も大きな影響を与えています。
エージェントの大規模採用に伴い、信頼や実行に関するリスクが複数存在します。これには、女巫攻撃、戦略の飽和、プライバシーのトレードオフなどが含まれます。
エージェント活動は継続的に増加
過去1年間、エージェント活動は着実に増加し、取引量と取引数の両方が増えています。特に、Coinbaseのx402プロトコルが大きな進展を牽引し、Visa、Stripe、Googleなどのプレイヤーも参入し、自社の標準を打ち出しています。現在構築中のインフラの大部分は、エージェント間のチャネルや人間がトリガーするエージェント呼び出しの2つのシナリオにサービスを提供することを目的としています。
ステーブルコインの取引は広くサポートされていますが、現状のインフラは依然として従来の決済ゲートウェイに依存しており、これは中央集権的な対抗者に依存していることを意味します。したがって、エージェントが自己資金調達、自己実行、そして絶えず変化する条件に基づいて最適化を続ける「完全自主」なエンドポイントはまだ実現していません。
エージェントはDeFiにとって全く未知のものではありません。長年にわたり、オンチェーンのプロトコルにはボットを用いた自動化が存在し、MEVを捕捉したり、コードなしでは実現できない超過収益を得たりしてきました。これらのシステムは、頻繁に変化しない明確なパラメータの下で非常に良く動作しますが、市場は時間とともにより複雑になっています。これが、私たちが次世代のエージェントの登場を目の当たりにしている理由であり、過去数ヶ月、オンチェーンはこうした活動の実験場となっています。
エージェントの実際のパフォーマンス
レポートによると、エージェント活動は指数関数的に増加しており、2025年以降、1万7000以上のエージェントが稼働しています。自動化/エージェント活動の総量は、すべてのオンチェーン活動の19%以上をカバーしていると推定されます。これは驚くべきことではありません。なぜなら、推定で全ステーブルコインの送金量の76%以上がボットによって生成されているからです。これにより、DeFiにおけるエージェント活動は大きな成長余地を持つことが示唆されます。
エージェントの自主性は広範囲にわたります。高度な人間の監督を必要とするチャットボットのような体験から、市場条件に応じて戦略を調整できるエージェントまでさまざまです。ボットと比べて、エージェントにはいくつかの重要な利点があります。例えば、ミリ秒以内に新情報に反応し実行できる能力や、同じ厳格さを保ちながら数千の市場にわたるカバレッジを拡大できる点です。
現状、多くのエージェントは分析者や副操縦士レベルにとどまっており、多くはテスト段階にあります。
収益最適化:エージェントのパフォーマンスは優秀
流動性提供は自動化が頻繁に行われている分野であり、エージェントが保有する総TVLは3900万ドルを超えています。この数字は、ユーザーが直接エージェントに預けた資産を主に示していますが、金庫ルーティングの資本は含まれていません。
Giza Techはこの分野で最大級のプロトコルの一つで、昨年末に最初のエージェントアプリARMAをリリースし、主要なDeFiプロトコルの収益捕捉を強化しました。管理資産は1900万ドルを超え、エージェント取引量は400億ドルを超えています。取引量と管理資産の比率が高いことは、エージェントが頻繁に資本をリバランスし、より高い収益を狙っていることを示しています。資本がコントラクトに預けられると、自動化された実行が行われ、ほぼ監督不要のワンボタン体験を提供します。
ARMAのパフォーマンスは測定可能で、USDCで年率9.75%以上のリターンを生み出しています。追加のリバランス費用やエージェントの10%のパフォーマンスフィーを考慮しても、リターンはAaveやMorphoの普通の貸付を上回っています。それでも、スケーラビリティは依然として重要な課題です。これらのエージェントは実戦での管理や主要なDeFiプロトコルへの拡張にはまだ十分にテストされていません。
取引:人間が圧倒的にリード
しかし、より複雑な行動、特に取引に関しては結果は多様です。現在の取引モデルは人間が定義した入力に基づき、事前設定されたルールに従って出力を提供します。機械学習は、新情報に基づいてモデルの行動を更新できるようにし、明示的な再プログラミングなしに副操縦士的役割を果たすことでこれを拡張します。完全な自主エージェントが登場すれば、取引の構図は大きく変わるでしょう。
すでにいくつかのエージェント間や人間とエージェントの取引コンテストが開催されており、モデル間には大きな差異があることが示されています。Trade XYZは、そのプラットフォームに上場している株式の人間対エージェントの取引コンテストを実施しました。各アカウントは10,000ドルの初期資金を持ち、レバレッジや取引頻度に制限はありません。結果は圧倒的に人間側に偏り、トップ人間のパフォーマンスはトップエージェントの5倍以上高かったです。
一方、Nof1は複数のモデル(Grok-4、GPT-5、Deepseek、Kimi、Qwen3、Claude、Gemini)間のエージェント取引コンテストを開催し、資本の保全から最大レバレッジまでさまざまなリスク設定をテストしました。結果から、パフォーマンス差を説明するいくつかの要因が明らかになりました。
ポジション保持時間:強い相関があり、平均2〜3時間保持のモデルは頻繁にポジションを入れ替えるモデルよりも大きく優れています。
期待値:各取引の平均的な収益性を示します。興味深いことに、上位3つのモデルだけが正の期待値を持ち、多くのモデルは損失取引の方が多いことを示しています。
レバレッジ:平均6〜8倍の低レバレッジの方が、10倍超の高レバレッジモデルよりも良好な結果を出すことが証明されました。高レバレッジは損失を加速させるリスクがあります。
ヒント戦略:Monk Modeはこれまでで最も良いパフォーマンスを示し、Situational Awarenessは最も悪い結果でした。モデルの特徴に基づき、リスク管理に集中し外部情報を少なくすることが良い結果につながることが示されています。
基本モデル:Grok 4.20は、さまざまなヒント戦略の中で他のモデルより22%以上優れており、唯一平均的に利益を出しているモデルです。
その他の要因(多空の偏好、取引規模、信頼度スコアなど)については十分なデータがなく、モデルのパフォーマンスと正の相関があることも証明されていません。全体として、結果は、エージェントは明確に定義された制約内でより良く動作する傾向があり、人間は目標設定において依然として重要な役割を果たしていることを示しています。
エージェントの評価方法
エージェントはまだ初期段階にあるため、包括的な評価フレームワークは存在しません。過去のパフォーマンスは一般的に評価の基準として使われますが、それらは基礎的な要素に左右され、これらの要素はエージェントの優れたパフォーマンスのより強い兆候を提供します。
異なるボラティリティ下でのパフォーマンス:条件が悪化した場合の規律ある損失コントロールを含み、エージェントが取引の収益性に影響を与えるオフチェーン要因を識別できることを示しています。
透明性とプライバシー:双方にはトレードオフがあります。透明なエージェントは、積極的にコピーされる可能性があるため、戦略上の優位性はほとんどありません。プライベートなエージェントは、作成者内部の情報抽出リスクに直面し、作成者が自分のユーザーに対して情報優位を保つことが可能です。
情報源:エージェントがアクセスするデータソースは、エージェントの意思決定にとって極めて重要です。信頼できるソースであり、単一依存を避けることが不可欠です。
セキュリティ:スマートコントラクトの監査や適切な資金管理構造を持ち、ブラックスワンイベントに備えることが非常に重要です。
エージェントの次のステップ
エージェントを大規模に採用するには、インフラ面で多くの作業が必要です。これは、エージェントの信頼と実行に関わる重要な問題に集約されます。自主的なエージェントの行動にはバリアがなく、資金管理の不備例も既に発生しています。
ERC-8004は2026年1月にローンチされ、最初のオンチェーン登録簿となり、自律エージェントが相互に発見し、検証可能な評判を築き、安全に協働できる仕組みを提供します。これはDeFiのコンポーザビリティの重要な解放であり、信頼スコアがスマートコントラクトに埋め込まれることで、エージェントとプロトコル間の非許可型活動を可能にします。ただし、これだけではエージェントが常に悪意なく動作する保証はなく、連携評判や女巫攻撃などのセキュリティ脆弱性は依然として存在します。したがって、保険、安全性、エージェントの経済的ステークなどの分野で大きな改善余地があります。
DeFiにおけるエージェント活動の拡大に伴い、戦略の飽和が構造的リスクとなる可能性があります。収益農場は最も明確な例であり、戦略の普及によりリターンは圧縮されていきます。同じダイナミクスはエージェント取引にも当てはまる可能性があり、多数のエージェントが類似のデータを用いて類似の目標を最適化すれば、類似のポジションや退出シグナルに収束することになります。
コーネル大学が2026年1月に発表したCoinAlg論文は、この問題の一つの側面を正式化しています。透明なエージェントはアービトラージの対象となりやすく、その取引は予測可能であり、先回りされる可能性があります。一方、プライベートエージェントはこのリスクを回避しますが、作成者が内部情報を保持し続けるリスクや、不透明性による内部知識の価値抽出のリスクを伴います。
エージェント活動は今後も加速し続け、今日築かれるインフラが次世代のオンチェーン金融のあり方を決定します。エージェントの利用率が高まるにつれ、自己改善とユーザーニーズへの適応も進むでしょう。したがって、最も差別化される要素は、信頼できるインフラに集約され、市場シェアの最大化につながると考えられます。