AIエージェントが買い物をする「エージェントコマース」の時代がやってくる(筆者がWhiskで生成)
(小林 啓倫:経営コンサルタント)
ChatGPTの「エージェントモード」が発表される
2025年7月17日、OpenAIからChatGPTの新しい機能が発表された。「エージェントモード(Agent mode)」と名付けられたこの機能は、その名の通り、最近注目を集める「AIエージェント」に関するものだ。
AIエージェントとは、簡単に言ってしまえば、自動的に動作できる範囲が従来よりもはるかに拡大されたAIを指す。
たとえば、従来のAIでは「東京駅に近いホテルを探して」と指示した場合、返ってくるのは東京駅周辺のホテルのリスト程度だった(それだけでも十分に高度な機能だが)。しかしAIエージェント時代には、「東京駅周辺で一番安いホテルを予約しておいて」と指示するだけで、エージェントがあなたの予定表アプリの中を覗いて出張の予定を把握。さらにその日程で空き部屋があるホテルを検索して、得られた候補から宿泊料金がもっとも安くなるものを判断し、予約まで完了してくれる。
そんなSF的な話があるかと思われたかもしれないが、後述するように、このシナリオのかなりの部分が既に実現されている。そしてAIエージェント機能をさらに高度化すべく、IT各社がしのぎを削っており、今回リリースされた「エージェントモード」もその一環というわけだ。
ChatGPTのエージェントモードでは、AIがユーザーに代わって各種作業を自動的に進められるよう、新しい仕組みが導入されている。ここでポイントとなるのが「仮想コンピュータ」という仕組みだ。これはAIの内部に用意された専用の作業スペースや、仮想的なデスクトップ環境のことを指す。パソコンの中にもうひとつ「仕事部屋」が用意され、そこにAIが自分専用の道具やメモ、アプリを持ち込み、まとめて作業を進めるといったイメージだ。
従来のChatGPTにも、「ウェブ操作」や「データ収集」など、特定のタスク向けに設計されたAIエージェント系機能があった。しかしこれらを横断する作業を実行させるには、個々の機能ごとに指示を出す必要があった。
今回のエージェントモードでは、これらがひとつに統合され、AI自身が「調べて、判断して、必要なアプリを動かし、結果をまとめて報告する」といった一連の流れを自分でコントロールできるようになっている。
たとえば、ユーザーが「会議資料をまとめて」と依頼すれば、AIはこの仮想作業スペースで情報を探し、必要な書類を作り、スケジュール調整なども自動で進めてくれる。
この新機能は、「仕事の資料作成」「スケジュール管理」「ネットショッピングの手配」「メールの要約や送信」など、複数の工程が必要な複雑なタスクを簡単に任せられることが想定されている(ただし安全面への配慮から、現時点では銀行振込など一部の重要な操作は制限されている)。画面上でAIの進行状況も確認でき、必要に応じて中断や追加指示も可能なので、技術に詳しくない一般のユーザーでも使いやすい設計となっている。
エージェントモードがどのように機能するのか、簡単な例を示そう。


