OpenClawは「自宅に住み込みで働く執事」
第1に、他の一般的なAIエージェントと、OpenClawの最大の違いは「エージェントがどこに住んでいるか」だ。
従来のAIエージェントは、生成AIチャットボットと同様、サービス提供企業のクラウドサーバー上で動いている。ユーザーは専用のウェブサイトにログインして指示を出し、エージェントはクラウド上の安全な隔離環境の中で作業する。ユーザーのパソコンの中身には一切触れない。いわば「派遣会社のオフィスで働く派遣社員」のような存在だ。
一方でOpenClawは、前述の通り、ユーザー自身のパソコンやサーバーの中で動く。しかも、ファイルを開いたり、コマンドを実行したり、ブラウザを操作したりと、パソコンの管理者に近い権限を持つ。「自宅に住み込みで働く執事」のような存在と言える。
この差は決定的だ。従来のエージェントは「ウェブ上の作業」しかできないが、OpenClawは「パソコン内のExcelファイルを開いて中身を読み、それをもとにウェブで検索し、結果を別のファイルに保存する」といった、ローカルとウェブをまたぐ作業ができるのである。
またウェブサイトを操作するとき、従来のエージェントは画面のスクリーンショットを撮影し、画像認識でボタンの位置を特定することが多い。この方式は直感的だが、画像データは重く、処理に時間とコストがかかる。
それに対して、OpenClawは「Semantic Snapshot」という技術を使う。これにより、ウェブページの構造を「ここに『購入』というボタンがある」といったテキスト情報として読み取ることが可能になる。それによって、画像を取得する場合の約100分の1のデータ量で済むため、高速かつ安価に動作する。
「記憶」という点でも進化している。従来のエージェントの記憶、つまり「これまでユーザーとどのようなやり取りをし、そこでどのような指示や情報を覚えたか」は、クラウド上のデータベースに保存され、中身はユーザーからは見えにくい。
一方でOpenClawの記憶は、ユーザーのパソコン内にあるファイルに書き込まれる。“MEMORY.md”というテキストファイルを直接開いて、「このサイトではこのクレジットカードを使うこと」といった指示を自分で書き加えたり修正したりできる。透明性が高く、カスタマイズの自由度も高い。
さらに細かな点も述べておこう。従来のAIエージェントの中には、それを使う場合、専用の管理画面にアクセスしなければならないものがある。そのようなサービスでは、新しい画面の使い方を覚えなければならない。
しかしOpenClawは、普段使っているチャットアプリ(Slack、WhatsApp、Telegramなど)をそのまま操作画面として使える。外出先からスマートフォンで「家のパソコンのログを確認して」とメッセージを送れば、結果が返ってくるのである。
要するに従来のAIエージェントは、ウェブ上で完結する作業(買い物や予約など)を安全に任せたい一般ユーザー向けと言えるだろう。そしてOpenClawは、ローカルとウェブをまたぐ複雑な自動化をしたい技術者、あるいはパワーユーザー向けの仕様となっている。