
インタビューの前編では、伊東潤平氏(東京大学医科学研究所准教授)に、新型コロナウイルスで次に流行する可能性が高い変異株を早期に予測する手法について話を聞いた。ただ、この方法では「既に観測されている変異株」だけが予測候補となる。
試行錯誤を重ねた伊東氏は、ついに「まだ存在しない変異株」の出現予測を的中させた。用いたのは独自に開発したAI「CoVFit」。CoVFitはどこまでウイルスの進化を見通せるのか、社会実装のリアルな現場とは──。前編に続き、伊東氏に話を聞いた。(聞き手:関瑶子、ライター&ビデオクリエイター)
【前編】ウイルスの変化は予測できるか?変異株の「適応度」がカギを握る、次のパンデミックを防ぐ科学の最前線
──CoVFitというAIを用いて、ウイルスの進化を予測しているとのことですが、どのような仕組みなのでしょうか。
伊東潤平氏(以下、伊東):CoVFitでは、大規模言語モデルというAIを使用しています。ChatGPTのような生成AIと同じ仕組みですが、生成AIでは自然言語の文章を学習させるのに対し、CoVFitではタンパク質の配列を学習させています。「大規模言語モデル」ではなく「タンパク質言語モデル」とも言えるかもしれません。

CoVFitには、2つのタイプのタンパク質配列データを学習させています。
1つは、新型コロナウイルスの変異株の適応度情報です。次期流行株予測でも使用したウイルスゲノム疫学調査のデータの約1万3000種類の変異株のスパイクタンパク質(※)のゲノム配列情報と、その変異株の実効再生産数の情報です。
※ウイルス表面にある突起状の構造で、ヒトの細胞に取りつき侵入するための鍵のような役割を果たす。新型コロナウイルスではこの部分が免疫の標的となるため、変異が生じやすく、感染力やワクチン効果に大きな影響を及ぼす。
2つ目は、免疫逃避に対する変異の効果の情報です。なぜこの情報が必要かというと、免疫から逃避できれば、適応度が上がるため、ウイルスは免疫のプレッシャーから逃避する方向に進化していく傾向があるからです。
免疫逃避に対する変異の効果を調べるには、deep mutational scanning実験が非常に有効です。この実験では、たとえばスパイクタンパク質のゲノム配列のある部分に変異が生じた際に、免疫逃避能力がどう変化するのかを網羅的に調べることができます。
理科だけを勉強するより、理科と数学を一緒に学ぶと理解が深まるように、AIも複数種類の情報を学習させたほうがより精度の高い予測が可能になります。これを「マルチタスク学習」といいます。
──CoVFitで、実際にどのような成果が出ているのでしょうか。