1M AI Newsの監測によると、オープンソース開発者のTommaso De Rossiは、デスクトップ自動化コマンドラインツールusecomputerを公開しました。これはZigで書かれたネイティブバイナリで、Node.jsランタイムに依存せず、AIプログラミングアシスタント(Claude Code、Codex、OpenCodeなど)がマウス、キーボード、スクリーンショットを直接制御できるようにします。macOSとLinux(X11、WaylandはXWayland経由で対応)をサポートしています。
usecomputerは、スクリーンショット、マウスの移動/クリック/ドラッグ/スクロール、キーボード入力、ショートカットキーの合成などのCLIコマンドを提供し、座標マッピングシステム(coord-map)を備えています。これにより、スクリーンショット内のピクセル座標を実際の画面座標に自動変換します。スクリーンショットの出力は、モデルのコンテキストウィンドウに適合させるために、最長辺を1568ピクセルに縮小します。さらに、Kitty Graphics Protocolに対応しており、環境変数を設定することで、スクリーンショットを直接モデルのコンテキストにインラインで埋め込むことができ、追加のファイル読み込みは不要です。
De Rossiは以前、ブラウザ自動化ツールPlaywriter(GitHubスター数3200以上)を開発しており、usecomputerはブラウザ自動化からデスクトップ自動化へと拡張されたものです。プロジェクトは彼のkimaki単一リポジトリから独立して分離されており、CLIとNode.jsライブラリの両方の使用方法を提供しています。READMEには、OpenAIのコンピュータツールやAnthropicのコンピュータ使用の完全な統合例も含まれています。