
(小林 啓倫:経営コンサルタント)
ユーザーの代理でネットを見るAIエージェント
今年初め、「2025年はAIエージェントの年になるだろう」と予想する声が多く聞かれたが、どうやらその予想は正しかったようだ。いま主要なIT企業やAI研究機関からさまざまなエージェントが発表され、その機能も日々進化している。
たとえば、ChatGPTでお馴染みのOpenAIが開発したAIエージェント、その名も「Operator(オペレーター)」は、ウェブブラウザの操作を自動化できる。
つまりオペレーターが自分で仮想的なブラウザを開いて、そこに表示されるテキストや画像を認識し、その上で人間がするような操作(クリックやスクロールなど)を実行できるのだ。
それにより、ECサイトやホテル予約サイトなどでの商品購入や各種予約手続きを、人間に代わって完了させることができる。
たとえば、次のスクリーンショットは、筆者が実際にOperatorに指示を与えてみたところだ。

残念ながら筆者にそんな予定はないのだが、ゴールデンウイーク間近ということで、期間指定した上で、東京—香港間の最安の航空券を探させてみた。
すると、ご覧のように、検索エンジン(MicrosoftのBing)が開かれ、何やら検索を行っているのがわかる。何度かやり取りをするうちに、この期間での最安値は、HK Expressの4万3477円だということが分かった。

上のスクリーンショットでは、Operatorが「予約ページに飛んで、実際にこの便を予約しますか?」と提案している。
もちろん、このまま予約してしまっては、行きもしない香港旅行の航空券を予約してしまうことになるので、実験はここでストップしたが、いまAIエージェントがどこまでの性能を獲得しているのか実感できるだろう。