ノーベル化学賞はタンパク質構造の設計と予測に

 2024年のノーベル化学賞は、計算によるタンパク質の設計の功績と、タンパク質構造の予測の功績に、2分の1ずつ授与されました。前者は米国ワシントン大のデイヴィッド・ベイカー教授(1962-)が、後者を英国グーグル・ディープマインドのデミス・ハサビス博士(1976-)とジョン・ジャンパー博士(1985-)が受賞しました。主に後者について説明しましょう。

 タンパク質は、生命が生命活動のために利用している複雑な形状の分子です。あなたの体内では今この瞬間もさまざまな種類のタンパク質が盛んに合成され、化学反応の触媒として、細胞を形作るパーツとして、ミクロな建設機械や工作機械として、情報伝達物質として、その他まだ解明されていない複雑かつ重要な役目を担ってばりばり働いています。

 基本的にタンパク質は、アミノ酸という部品が数十個〜数万個も鎖のように連結された、ひも状の分子ですが、このひもがあちこちで折れ曲がり、たたまれ、あっちの部位とこっちの部位がくっついて、立体構造が完成すると、高度な機能を発揮します。

 生命はアミノ酸の鎖を器用に折りたたんで、立体的な構造のタンパク質を作るのですが、人間がアミノ酸配列から立体構造を予想しようとすると、これが非常に面倒で厄介なのです。まともに計算しようとすると、超高速の計算機が膨大な計算時間をかけてもうまくいかない難問です。研究者は何年も、うまい予想方法はないものかと探し求めました。

衝撃のアルファフォールド

 そういう状況下の1994年から開催された「CASP(Critical Assessment of protein Structure Prediction)競技会」は、タンパク質構造を予想する技術を競う大会です。腕に覚えのある(?)プログラムやアルゴリズムが世界から出場し、出題されたアミノ酸配列からタンパク質構造を予想し、実際の構造に最も近かったものが優勝するという趣旨です。1994年に始まり、毎年開かれています。

 最初の数年は、どのプログラムも大した性能ではなかったのですが、2018年に「アルファフォールド」という、AI技術を用いた手法が登場し、停滞気味だったそれまでの記録を一気に10%も上回るスコアを叩き出して話題となりました。

 それ以来CASP競技会は、アルファフォールド・チームの進歩を観察する会と化していたのですが、2020年には、改良版の「アルファフォールド2」の行なう予想が、実際のタンパク質構造と約90%の「精度」で一致しました。ついにAIによるタンパク質構造予想が実用レベルに達したのです。

 現在、アルファフォールド2のプログラムと学習用データは世界に公開され、すでに200万種以上のタンパク質の構造が計算されています。これにより医薬品開発、医学、生物学に革命的進歩が現在形で進行中です。これが今回のノーベル化学賞の受賞対象です。