新型コロナウイルス感染症のワクチン接種が始まり、パンデミックが終息に向かうと期待されている。ウイルスは変異を繰り返し、今年に入り相次いで英国型や南アフリカ型異変種が発見された。これら異変種は感染力が高いが、ワクチンは有効であるとの見解が示されている。しかし、最新のAIを使った解析では、更に複数の異変種が生まれ、その幾つかはワクチンが効かないと推定する。この事態に陥れば、新型コロナウイルスの終息にはもう少し時間がかかるかもしれない。

出典: Brian Hie et al. |
Viral Escape:ワクチンが効かなくなる
新型コロナウイルスなど感染症向けにワクチンが開発されるが、ウイルスの遺伝子が変異するとワクチンの有効性が低下し、最悪の場合は効かなくなる。ワクチン接種により体内に抗体(Antibody)が生成されるが、ウイルスが変異すると抗体がこれを認識できなくなる。これは「Viral Escape」(ウイルスがワクチンをすり抜けるという意味)と呼ばれ、感染症対策の大きな課題となっている。ワクチン開発ではウイルスがどう変異するとワクチンが効かなくなるのかが重要な情報となる。(上のグラフィックスは新型コロナウイルスのスパイクたんぱく質で、Viral Escapeが発生する可能性が高い個所(黄色)と低い個所(青色)を示している。スパイクたんぱく質に対してワクチンが開発されているが、Viral Escapeが発生しない部分(上のグラフィックス右側、S2と示された個所)に作用する仕組みを取る必要がある。)
ウイルスに自然言語解析を適用
MITのAI研究チームはViral EscapeをAIの自然言語解析(Natural Language Processing)を使って予測する技法を開発した。ウイルスの遺伝子配列を言葉として捉え、そこから文法(Grammar)と意味(Semantics)を把握することで、どの遺伝子変異がViral Escape(ワクチンが効かない状態)に繋がるかを予測した。この研究ではインフルエンザウイルス(influenza A hemagglutinin)、エイズウイルス(HIV-1 envelope glycoprotein)、及び、新型コロナウイルス(SARS-CoV-2 spike glycoprotein)の三種類が使われた。
遺伝子配列の文法と意味
ウイルスの遺伝子配列を解析し、その文法と意味を把握するが、それらを次のように解釈できる。文法とはウイルスの基礎機能を決める。文法がしっかりしているウイルスは感染能力が高く、ウイルスが生存する可能性が高いことを示す。一方、意味はウイルスの変異を示す。異なる意味をもつウイルスは異なる形状を示すことになる。例えば、新型コロナウイルスが変異して、意味が異なり、文法が正しければ、ワクチンが効かない感染力の強いウイルスが生まれることになる。

出典: Brian Hie et al. |
遺伝子配列の文法と意味を可視化
上のグラフはこれを可視化したもので、縦軸が文法で横軸が意味を示す。文法が正しいほど(上に行くほど)、感染能力が高い(赤色の円)。意味が変わるとワクチンが効かなくなる。矢印の通り、左上のウイルスが右上のウイルスに変異すると、感染力が高く、ワクチンが効かないウイルスとなる(Viral Escapeが起こる)。一方、ウイルスが変異しても文法が正しくなければ、感染力が低下し無害のウイルスとなる(青色の円)。
自然言語解析の手法
この研究では自然言語解析の手法を適用したが、具体的には、LSTM(Long short-term memory)というタイプのニューラルネットワークが使われた。LSTMは時系列のデータを解析する手法で、言語処理では入力された言葉に続く言葉を推定する。この研究では、LSTMにウイルスの遺伝子配列を入力し、ネットワークは意味と文法を出力する。

出典: Brian Hie et al. |
上のグラフィックス;BiLSTMにウイルスの遺伝子配列を入力すると(最下段)、ネットワークはその意味(入力データに続く言葉 = 変異)を出力し(中段)、更に、その文法を出力する(最上段)。モデルは推定した言葉と、この言葉が持つ文法の正しさを推定し、Viral Escapeとなる確率を算定する。
解析の結果
モデルが予測した結果を過去のデータで検証し推定の精度を検証した。このモデルはインフルエンザやHIVや新型コロナウイルスなど5種類のウイルスを解析した。その結果、新型コロナウイルスに対して、モデルは85%の精度Viral Escapeとなる変異を予測した(下のグラフ、右端)。

出典: Brian Hie et al. |
感覚的な理解
このモデルを自然言語に応用するとこの機能を理解しやすい。モデルは元の文章が変異するパターンを予測し、それが文法に適合しているかどうかを判定する。更に、文章の意味に関し、それらがどのような位置関係にあるかを算定する(下のグラフィックス)。
- 上段:元の文章は「オーストラリア人がバリ島で死んだ」
- 中段:文章が変異する(australianがaussieに変わる)が意味は変わらない
- 下段:文章が変異する(deadがballetに代わる)と「オーストラリア人がバリ島でバレイ」となり意味が変わるが、文法も正しい。この変異がViral Escapeとなる。

出典: Brian Hie et al. |
事前に対策を講じる
いま新型コロナウイルスが変異し、英国型や南アフリカ型変異種の感染が広がっている。もし、変異種が発生する前に、ワクチンが有効かどうかを把握できると、医療関係者はその拡散に備え、必要な対策を取ることができる。また、ワクチンや治療薬の開発では、Viral Escapeが発生しにくい領域を対象に、モデルを開発することができる。このモデルはまだ研究段階であるが、AIは現行ワクチンが効かない新型コロナウイルスの発生を予測しており、不測の事態に備えておく必要がある。