AIエージェントはどこまでパンデミック抑制に成功したか

 検証は、米国の州レベルCOVID-19データ(2020年4月〜12月)に加えて、州間の人流データ、州レベルの政策記録を使ってシミュレーションを行うという形で実施された。

 また論文では、1種類の政策を検証するのではなく、①AIエージェントによる協調政策、②現実に行われた人間主導の政策、③専門家の経験則に基づく政策、④ランダムに設定された政策の4つの結果が比較された。

 そして得られたのが、冒頭の通り、AIエージェント政策では個別州レベルで累積感染が最大63.7%、死亡が最大40.1%減少し、複数州を集計しても感染39.0%、死亡27.0%減少という結果である。

 ただ州レベルの改善幅は一様ではなく、現実の政策が比較的緩かった州(ミシシッピやテキサスなど)で改善が大きかったが、逆に低く留まるケースもあった。つまり論文が強調しているのは「どの州でも同じだけ良くなる」ではなく、「状況と初期条件によって効果は異なるが、協調政策が改善を生み得る」という主張だ。

 また政策アプローチの違いが、思わぬ「副作用」を生み出すことも確認された。具体的には、前述のSISアプローチの問題点である。

 SIS、つまり特定の高リスク起点州からの流入を一定割合抑制するアプローチは、「目的地の州にとっては局所的に有効だが、抑制された人流が別の州へ迂回・再配分されるため、非制限州の感染を悪化させる『空間的スピルオーバー』を誘発し得る」という。実際、SISで多くの州が改善する一方、ある州では感染が10%以上増える例も示された。この結果は、パンデミック対策が「局所最適の足し算」では上手くいかないことを示している。

 一方で研究チームは、AIエージェント政策の限界も明確に指摘している。

 第1に、AIエージェントの行動はモデルの学習内容とエージェントに対する指示、すなわちプロンプトによって左右される。学習済みの専門知識が不十分だったり、指示の文脈が曖昧だったりすれば、重要なポイントを取りこぼし、政策立案が効率的でなくなる可能性がある。

 第2に、現実の政策効果は政治・行政・物流上の制約や、個人の遵守の不完全さに縛られる。処方された対策通りに移動が変化しない「実行・遵守の摩擦」が、シミュレーション上の政策と現実の結果の乖離を生む。

 第3に、この研究で扱われている政策介入は主にマクロレベルで、州間モビリティ規制に焦点を当てており、現実のパンデミック対策の「一側面」に過ぎない。実世界では、ワクチン接種、マスク義務、検査戦略、複合介入などより広範で異質な施策が絡み合う。

 第4に、LLM自体の性能による制約である。論文では、異なる複数のLLMを使用した結果も説明されている。

 シミュレーションの結果、政策による改善の大きさや安定性がモデルによって異なること、能力の高いモデルほど州間で整合的かつバランスの取れた協調効果が得られ、能力の低いモデルでは政策品質のばらつきが大きいことが確認されたそうだ。つまり、現場で「どのモデルを採用するか」という選択が、支援品質に直結し得るわけである。