対話OpenClaw創設者:AIはレバレッジであり、代替品ではない。80%のアプリが取って代わられる

PANews

作者:宝玉

これは ClawdBot/OpenClaw 作者の Peter Steinberger との40分間のインタビューのもう一つで、Peter Yang が司会を務めています。

Peter は PSPDFKit の創設者で、iOS の開発経験は約20年以上あります。2021年に Insight Partners から1億ユーロの戦略的投資を受けた後、彼は「引退」しました。現在、彼が開発した Clawdbot(現在は OpenClaw に改名)は爆発的にヒットしています。Clawbot は WhatsApp、Telegram、iMessage であなたとチャットできる AI アシスタントで、背後にはあなたのパソコン上のさまざまなアプリケーションと連携しています。

Peter は Clawbot を次のように説明しています:

「まるであなたのパソコンの中に住む友達のようなもので、ちょっと変だけど、賢すぎて怖いくらいです。

このインタビューでは、彼は多くの面白い見解を共有しています:なぜ複雑なエージェント(Agent)編成システムは「slop 生成器」なのか、なぜ「AIを24時間動かす」ことが虚栄心の指標なのか、そしてなぜプログラミング言語はもはや重要ではないのか。

1時間のプロトタイプ、30万行のコード

Peter Yang が彼に Clawbot とは何か、なぜロゴがロブスターなのかと尋ねました。

Peter Steinberger はロブスターの話には直接答えず、物語を語りました。「引退」して戻ってきた後、彼は直感(vibe)に従ったコーディングに全力投球しました——それは AI のインテリジェントエージェントにコードを書かせるような仕事です。問題は、エージェントは30分動くこともあれば、2分で止まって質問してくることもあるということです。食事に行って戻ると、すでに止まっていてイライラすることもあります。

彼は、いつでもスマホでパソコンの状態を確認できるものを作りたかったのですが、手を動かしませんでした。なぜなら、それはあまりにも明白で、大手企業ならきっとやるだろうと考えたからです。

「去年の11月まで誰もやっていなかったので、諦めて自分でやることにしました。

最初のバージョンは非常にシンプルでした:WhatsApp を Claude Code に接続し、メッセージを送ると AI を呼び出して結果を返すだけです。1時間もあれば完成しました。

そして、それが「生き返った」のです。今の Clawbot は約30万行のコードを持ち、ほぼすべての主要なメッセージプラットフォームをサポートしています。

「これが未来の方向だと思います。誰もが超強力な AI を持ち、それが一生あなたについて回る。

彼は言います、「一度あなたが AI にあなたのパソコンへのアクセス権を与えれば、基本的にあなたができることは何でもできるようになる。」

モロッコのあの朝

Peter Yang は、今やあなたはパソコンの前に座って見張る必要はなく、指示を出すだけで良いと言います。

Peter Steinberger は頷きながらも、別のことを話したいと思っていました。

ある日、彼はモロッコで友人の誕生日を祝っているときに、ずっと Clawbot を使っていることに気づきました。道案内やレストランの推薦などは小さなことです。本当に驚いたのは、その朝:Twitter に誰かが投稿したツイートで、彼のオープンソースライブラリにバグがあると指摘されていたことです。

「私はそのツイートの写真を撮って WhatsApp に送信しました。

AI はそのツイート内容を理解し、バグ報告だと認識しました。該当の Git リポジトリをチェックアウトし、問題を修正し、コードをコミットし、その後 Twitter でその人に修正済みと返信しました。

「これもできるのか?」と私は思いました。

さらにもう一つ、もっと驚くことがありました。街を歩いているときに、面倒で音声メッセージを送ったのです。問題は、彼は Clawbot に音声メッセージのサポートを事前に組み込んでいなかったことです。

「'入力中’と表示されたのを見て、これは終わったと思ったのですが、ちゃんと返信してきました。

彼は後で AI にどうやってできたのか尋ねました。AI はこう答えました:「ファイルを受け取りましたが拡張子がありませんでした。ファイルヘッダーを見たところ、Ogg Opus 形式だとわかりました。あなたのパソコンには ffmpeg があるので、それを使って WAV に変換しました。それから whisper.cpp を探しましたが、インストールされていませんでした。でも、あなたの OpenAI API キーを見つけたので、curl で音声を送って文字起こしをしました。」

Peter Yang は聞き終わって言いました:「これらは本当にすごい方法です。ちょっと怖いくらいです。」

「ウェブ版 ChatGPT よりずっと強力です。まるで解放された ChatGPT のようです。多くの人は気づいていませんが、Claude Code のようなツールは、単なるプログラミングだけでなく、あらゆる問題に対しても非常に有効です。」

コマンドラインツール(CLI)軍団

Peter Yang が彼に、これらの自動化ツールはどうやって作ったのか、自己流か AI に任せたのかと尋ねました。

Peter Steinberger は笑いました。

この数ヶ月、彼は自分の「CLI 軍団」を拡充してきました。インテリジェントエージェントが最も得意とするのは何か?コマンドラインツールの呼び出しです。なぜなら、訓練データのほとんどがそれだからです。

彼は Google のサービス全体にアクセスできる CLI を作成しました。Places API も含まれています。絵文字や GIF を検索する専用のツールも作り、AI が返信するときにミームを送れるようにしました。さらに、音声を可視化するツールも作り、AI に音楽を「体験」させたいとも考えています。

「私はさらに、ローカルのデリバリーサービスの API にハッキングして、AI に食べ物の配達まで何分か教えさせることもできました。もう一つは、Eight Sleep の API を逆向きに解析して、ベッドの温度をコントロールできるようにしました。

【注:Eight Sleep はスマートマットレスで、表面の温度調整が可能ですが、公式には API は公開されていません。】

Peter Yang が追及します:「これらはすべてあなたが AI に作らせたのですか?」

「最も面白いのは、私は以前 PSPDFKit で20年近く Apple エコシステムの開発をしていて、Swift や Objective-C に非常に精通していました。でも、戻ってきてからは別の道に進むことに決めました。Apple は何でも管理しすぎるし、Mac アプリのターゲット層も狭すぎると感じたからです。

問題は、熟知した技術スタックから別のものに切り替えるのはとても苦痛だということです。すべての概念は理解しているのに、文法がわからない。prop とは何か?配列はどう分割するのか?ちょっとした疑問も調べる必要があり、自分がバカみたいに感じる。

「でも AI があれば、これらすべてが消え去ります。システムレベルの思考、アーキテクチャの能力、センス、依存関係の判断——これらこそ本当に価値のあるもので、今やどんな分野にも簡単に移行できる。

彼は一瞬間を置きました。

「突然、何でも作れる気がしてきました。言語はもう重要ではありません。大事なのはエンジニアリングの思考です。」

現実世界をコントロールする

Peter Steinberger は自分の設定をデモンストレーションし始めました。彼が AI に与える権限リストは驚くべきものでした。

メール、カレンダー、すべてのファイル、Philips Hue の照明、Sonos スピーカー。彼は AI に朝起こしてもらい、徐々に音量を上げることもできます。AI は彼の防犯カメラにもアクセスできます。

「あるとき、誰かが不審者がいるかどうか見張らせました。翌朝、AI は『Peter、誰かいます』と教えてくれました。映像を見たら、夜通し私のソファのスクリーンショットを撮り続けていて、カメラの画質が悪くて、ソファに誰かが座っているように見えたのです。

ウィーンのアパートでは、AI は KNX スマートホームシステムも制御しています。

「本当に私を鍵をかけて外に閉め出すこともできるのです。

Peter Yang が質問します:「これらはどうやってつながっているのですか?」

「ただ直接伝えるだけです。これらのものは非常にスマートで、API を見つけてきたり、Google 検索したり、システム内のキーを探したりします。

ユーザーの使い方はさらに過激です:

  • Tesco でネットショッピングさせる
  • Amazon で注文させる
  • すべてのメッセージに自動返信させる
  • 家族グループチャットに「家族メンバー」として参加させる

「私は彼に British Airways のサイトでチェックインさせました。これはまさにチューリングテストのようなもので、航空会社のサイト上でブラウジング操作をさせるのです。そのインターフェースは人間にはとても使いづらい。

最初は20分近くかかりました。システムもまだ粗い状態だったからです。AI は彼の Dropbox からパスポートを見つけ出し、情報を抽出し、フォームに記入し、人間と AI の認証も通過させました。

「今では数分でできるようになっています。‘私は人間です’ の認証ボタンもクリックできるし、実際にブラウザを操作しているので、人間と変わらない行動パターンです。」

80% のアプリは消える

Peter Yang が質問します:「新規ダウンロードした普通のユーザーにとって、安全に始められる使い方は何ですか?」

Peter Steinberger は「人それぞれの道がある」と答えます。ある人はすぐにそれを使って iOS アプリを書き始めるし、別の人は Cloudflare の管理に走る。あるユーザーは最初の週に自分にインストールし、次の週に家族に、3週目には企業版を作り始めました。

「私が非技術者の友人にインストールしたら、彼は私にプルリクエストを送ってきました。彼はこれまで一度もプルリクエストを送ったことがなかったのに。

でも彼が本当に言いたかったのは、もっと大きなビジョンです。

『考えてみてください、この技術はあなたのスマホの80%のアプリを置き換える可能性があります。

なぜ MyFitnessPal で食事記録を続ける必要があるのか?

「私は無限のリソースフルな助手を持っていて、私がケンタッキーで間違った決定をしたこともすぐにわかる。写真を送ると、それをデータベースに保存し、カロリーを計算し、ジムに行くようにリマインドしてくれる。

なぜ Eight Sleep の温度設定にアプリを使うのか?AI に API 権限を与えれば、直接調整してくれる。なぜ ToDo アプリを使うのか?AI が覚えてくれる。フライトのチェックインもアプリを使う必要はない。AI がやってくれる。買い物アプリも、AI が推薦し、注文し、追跡してくれる。

「これらのアプリは徐々に消えていくでしょう。API があれば、それは単なる AI が呼び出すサービスに過ぎません。

彼は2026年が、多くの人が個人用 AI アシスタントの探索を始める年になると予測しています。大手企業も参入してくるでしょう。

「Clawbot が最後の勝者になるとは限りませんが、この方向性は正しいです。」

ただ話しかけるだけ

話題は AI のプログラミング手法に移ります。Peter Yang は、「Just Talk to It」という非常に話題になった記事を書いたことがあり、彼の解説を聞きたいと言います。

Peter Steinberger の核心的な見解は、「エージェントの罠(agentic trap)」に陥るなということです。

「Twitter で見かけるのは、AI がすごいと気づいた人たちが、もっとすごくさせようとし、どんどん深みにはまっていく例です。彼らはさまざまな複雑なツールを作ってワークフローを加速させようとしますが、実際に作っているのはツールだけで、価値のあるものは何も作っていません。

私もかつてはまったことがあります。初期には2ヶ月かけて VPN トンネルを作り、スマホから端末にアクセスできるようにしたこともあります。やりすぎて、あるときレストランで友人と食事中に、全ての時間を vibe coding に費やし、会話に参加しなくなったこともあります。

「そのときは、精神的な健康のために止めざるを得ませんでした。」

Slop Town

彼が最近イライラさせられているのは、Gastown という編成システムです。

「超複雑なオーケストレーター(orchestrator)で、10〜20のインテリジェントエージェントを同時に動かし、相互に通信しながら役割分担しています。観察者(watcher)、監督者(overseer)、市長(mayor)、p-cats(おそらく「平民」や「ペットの猫」などの役割)もいます。ほかに何があるのか全然わかりません。

Peter Yang:ちょっと待って、市長もいるの?

「はい、Gastown プロジェクトには市長がいます。私はこのプロジェクトを『Slop Town』(ゴミ町)と呼んでいます。

さらに、RALPH モード(「使い捨て」の単一タスクループモード)もあります。これは、AI に小さなタスクを与え、完了したらすべてのコンテキストを破棄し、リセットしてループさせるものです。

「これは究極のトークン燃焼器です。夜通し動かすと、翌朝には究極のゴミ(slop)が得られるわけです。

問題の核心は:これらのインテリジェントエージェントはまだ品味がないことです。ある面では非常に賢いのですが、あなたが導いてやらなければ、何も価値のないゴミになってしまいます。

「他の人がどうやって動かしているのかはわかりませんが、私は最初はぼんやりとしたアイデアだけでプロジェクトを始めます。作りながら、遊びながら、感じながら、ビジョンはだんだん明確になっていきます。いくつか試してみて、ダメなものもありますが、その過程でアイデアは進化し、最終的な形になっていきます。次のプロンプト(prompt)は、今見ているもの、感じていること、考えていることに基づいて決まります。

すべてを最初の仕様書に書き込もうとすると、この人間と機械のサイクルを逃してしまいます。

「感覚や品味がなければ、良いものは作れないと思います。」

Twitter で「全 RALPH 生成」のノートアプリを自慢している人もいます。Peter は返信しました:「そうですね、まさに RALPH 生成のように見えます。普通の人がそんな設計をするはずがありません。」

Peter Yang のまとめ:多くの人は AI を24時間動かすのは、ただ自分ができることを証明したいだけです。

"これって、参照物のない大きさ比べみたいなものです。私も26時間ループを回したことがありますが、そのときは自慢でした。でも、それは虚栄心の指標にすぎず、意味のあることではありません。何でも作れるからといって、それを作るべきだとか、良いものになるとは限らないのです。

Plan Mode はただの寄せ集め(ハック)

Peter Yang が彼に、どうやってコンテキストを管理しているのか、会話が長くなると AI が混乱しませんかと尋ねました。

Peter Steinberger は、「これは『旧モード』の問題だ」と答えます。

「Claude Code もこの問題はありますが、Codex ははるかに優れています。表面上はコンテキストは30%増えるだけですが、体感では2〜3倍の差があります。これは内部の思考メカニズムに関係していると思います。今では、ほとんどの機能開発は一つのコンテキストウィンドウ内で完結し、議論と構築が同時に進行しています。

彼は worktrees は使いません。なぜなら、それは「不要な複雑さ」だからです。彼は単純に複数のリポジトリをチェックアウトします:clawbot-1、clawbot-2、clawbot-3、clawbot-4、clawbot-5。空いているものを使い、テストをして、メインブランチにマージし、同期させます。

「これは工場のようなもので、すべてが忙しければ良いのですが、1つだけだと待ち時間が長くなり、集中状態に入れません。

Peter Yang はこれをリアルタイム戦略ゲームのようだと言います。攻撃隊を管理し、監視しなければならないのです。

Plan Mode について、Peter Steinberger は議論を呼ぶ見解を述べます。

「Plan mode は、Anthropic が無理やり付け加えた寄せ集めの方案です。モデルがあまりにも衝動的で、最初からコードを書き始めてしまうからです。最新のモデル、例えば GPT 5.2 を使えば、ただの対話になります。『この機能を作りたい、こうしたい、このデザインが好きだ、いくつか案を出してくれ、まず話し合おう』と。そうすれば、提案を出し合い、合意してから作業に入るのです。」

彼はタイピングしません。話すのです。

「私はほとんどの場合、彼と話しています。」

Discord での開発推進

Peter Yang が、彼が新機能を開発する流れはどうかと質問します。まず問題を探るのか、計画を立てるのか。

Peter Steinberger は、「私がやった中で最もクレイジーなことの一つは」と前置きし、「自分の Clawbot を公開の Discord サーバーに接続し、誰でも私のプライベート AI と対話できるようにしたことです。記憶も持たせて、公開の場で使えるようにしたのです。

「このプロジェクトは言葉で説明しにくい。まるでジャービス(Iron Man の AI アシスタント)と映画『her』の融合のようです。実演する人はみんな興奮しますが、Twitter に画像と文章を投稿しても流行らない。だから、みんなに実際に体験してもらおうと思ったのです。

ユーザーは Discord で質問したり、バグを報告したり、要望を出したりします。今の開発フローは、Discord の会話のスクリーンショットを取り、それを端末にドラッグして、「これについて話そう」とAIに言うだけです。

「タイピングは面倒なので、誰かが『これサポートしてる?』と聞けば、AI にコードを読ませて FAQ を書かせるのです。

彼はまた、毎日少なくとも一回は Discord の help チャンネルをスキャンし、AI に最大の痛点を要約させ、それを修正しています。

MCP も複雑な編成もなし

Peter Yang が、「そういった華やかなものは使っているのか」と質問します。多インテリジェントエージェント、複雑なスキル、MCP(Model Context Protocol)など。

「私のスキルの大部分は生活スキルです。食事記録や買い物など。プログラミングはほとんどやりません。必要ないからです。私は MCP も使わないし、あれこれやりません。

彼は複雑な編成システムを信用していません。

「私はループの中にいて、より良い製品を作れると感じています。もしかしたらもっと速い方法もあるかもしれませんが、もうAIの性能には限界が近づいています。主に自分の思考速度に制約されていて、たまに Codex の待ち時間に引っかかるくらいです。

彼の前の PSPDFKit の共同創設者であり、元弁護士の人物も、今や彼に PR(プルリクエスト)を送っています。

「AI は、技術的背景のない人でも何かを作れるようにしてくれるのがすごい。反対意見もあることは知っています。これらのコードは完璧ではありません。でも、私はプルリクエストをプロンプトリクエスト(指示文)として捉えています。それは意図を伝えるものです。多くの人は同じシステム理解を持っていないので、モデルを最適な結果に導くことはできません。だから、私は意図を受け取って、自分でやるか、PR をもとに書き直します。

彼は彼らを共著者(co-author)としてマークしますが、他人のコードを直接マージすることはほとんどありません。

自分の道を見つける

Peter Yang のまとめ:要点は、slop generator を使わず、人間がループの中にいる状態を保つことです。人間の脳と品味は代替できません。

Peter Steinberger は付け加えます。

「つまり、自分の道を見つけることです。多くの人が『どうやってやったのか』と尋ねますが、答えは:自分で探すしかない。これらを学ぶには時間がかかるし、自分の間違いを犯す必要もあります。これは何かを学ぶのと同じです。ただし、この分野は特に変化が速い。

Clawdbot は clawd.bot と GitHub で見つかります。Clad は W 付きで、C-L-A-W-D-B-O-T、まるでロブスターのハサミのようです。

(注:ClawdBot はすでに OpenClaw に改名されています)

Peter Yang は、「自分も試してみる必要がある」と言います。外で子供と遊びながら、いつでも指示を出せるようにしたいと。

「きっと気に入ると思います」と Peter Steinberger は言います。

Peter Steinberger の核心的な見解は、次の二つの言葉に要約できます。

  1. AI はあなたのスマホの80%のアプリを置き換えるほど強力になった
  2. しかし、人間の品味と判断がループにないと、出力はゴミになる

この二つの言葉は一見矛盾しているようですが、実は同じ結論を指しています:AI はレバー(てこ)であり、代替品ではない。あなたの持つシステム思考、アーキテクチャ能力、良い製品の直感を拡大するものです。これらがなければ、多インテリジェントエージェントが24時間並列で動いても、ただの slop の大量生産に過ぎません。

彼の実践そのものが最良の証明です:20年の iOS の古参プログラマーが、数ヶ月で TypeScript で30万行のプロジェクトを作り上げたのは、新しい言語の文法を学んだのではなく、言語に依存しない本質的なものを理解していたからです。

「プログラミング言語はもう重要ではありません。大事なのは私のエンジニアリングの思考です。」

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし