CoVFitが出した驚くべき成果

伊東:新型コロナウイルスは、これまでさまざまな変異株が時間の経過とともに出現してきました。

 そこで、ある時点で区切って、「過去の変異株のデータセット」と「未来の変異株のデータセット」を作成しました。そして、過去の変異株のデータセットだけを学習させたモデルで、未来の変異株の適応度を予測させたところ、かなりの高精度で当てることができました。

 また、私たちはCoVFitを用いて、現在流行している変異株がどのような変異を獲得すると適応度がさらに上昇するのかという予測シミュレーションも行っています。「存在していない変異株」の適応度を予測しているということです。

 例えば、JN.1株という変異株では、スパイクタンパク質のゲノム配列のアミノ酸に特定の変異が生じると、適応度が上がると予測されました。これは、もともと存在しない変異株です。けれども、2023年12月頃にその変異株が出現し、一気に流行が拡大しました。

 これにより、CoVFitを使うことで1アミノ酸変異のウイルスの進化に伴う適応度の変化を、ある程度予測できるということが示唆されました。

──新型コロナウイルスのパンデミックでは、次から次に新しい変異株が登場しました。あのような進化の速さは、新型コロナウイルス特有のものなのでしょうか。

伊東:すべてのウイルスに当てはまるようなものではありません。新型コロナウイルスや季節性のインフルエンザウイルスなどが、このようなパターンに従っています。

 ウイルスの進化の速度を規定するには、主に2つの要素があります。

 1つ目は、ウイルスのゲノムへの変異の入りやすさです。これは「変異速度」と呼ばれています。ヒトの場合、ゲノムはDNAですが、新型コロナウイルスのゲノムはRNAゲノムです。

 DNAと比較して、RNAは化学的に不安定ですので、RNAウイルスはDNAを持つ生物やウイルスよりも早く、進化することが知られています。新型コロナウイルスの場合は、ヒトと比較して1000倍速い変異速度であると言われています。

 2つ目は、進化の選択圧です。進化の選択圧は、生物やウイルスが生存・繁殖する上で有利または不利になるような環境要因や条件のことを指します。これにより、ある形質を持つ個体が生き残りやすくなったり、逆に淘汰されたりします。

 新型コロナウイルスの進化が速いといっても、ウイルスすべてのタンパク質の進化が同じように速いわけではありません。

 新型コロナウイルスは、免疫のターゲットとなるスパイクタンパク質の進化だけが顕著に速いという特徴があります。スパイクタンパク質に変異が入ると、免疫が効かなくなり、宿主の体内で有利に増えることができるからです。

 新型コロナウイルスにおいて、進化の選択圧は、そのウイルスがどれだけ流行しているかによって決まります。例えば、日本人は新型コロナウイルスの自然感染とワクチン接種により、100%近くの方が新型コロナウイルスに対する何らかの免疫を持っていると考えられます。

 その免疫から逃げるため、新型コロナウイルスはものすごいスピードでスパイクタンパク質を進化させていきます。

 一方で、全然流行していない、例えば、数百万人に1人しか感染していないウイルスの免疫を持っている人の数はごくわずかです。宿主の免疫からプレッシャーを受ける機会はほとんどありませんので、免疫から逃れる方向に進化する必要はなくなります。