カテゴリー別アーカイブ: 遺伝子解析

GoogleはAIで新型コロナウイルスの3D形状を解明、この情報が治療薬開発を加速する

新型コロナウイルスの感染者数が30万人を超え世界は危機的な状況となった。病気を防ぐワクチンや治療薬がないため、感染が拡大し病気が重篤化している。世界の研究機関はワクチンや治療薬の開発を急いでいる。Google系DeepMindはAIを使い新型コロナウイルスの3D形状を推定した。医薬品開発では病気を引き起こすたんぱく質の形状が決定的に重要で、AIがワクチンや治療薬の開発を加速するのか期待が寄せられている。

出典: DeepMind

AlphaFold

DeepMindはたんぱく質の形状をニューラルネットワークで推定する研究を早くから進めている。このAIは「AlphaFold」と呼ばれ、遺伝子情報を解析し、たんぱく質の3D形状を推定する。つまり、たんぱく質を生成する遺伝子配列を読み込むと、たんぱく質の形が分かるというもの。DeepMindはAlphaFoldを新型コロナウイルス(SARS-CoV-2)に適用し、その形状を推定した(上の写真)。これは新型コロナウイルスの「Membrane Protein」(下の写真、ウイルスの膜に付着しているたんぱく質)といわれる部分で、治療薬の開発には不可欠な情報となる。

たんぱく質の形状が持つ意味

たんぱく質の形状が注目されるのは、その形が機能を決めるからである。細胞内のたんぱく質の形状を見ることで、その役割が推定される。これにより、対象とするたんぱく質(例えばがん細胞)の形に作用する薬の開発に繋がる。新型コロナウイルスも同様で、ワクチンや治療薬を開発するにはウイルスの形状が決めてとなる。しかし、従来の手法(低温電子顕微鏡など)では形状を特定するまでに数か月かかり、この緊急事態に対応できない。このため、DeepMindは既に開発を進めていたAlphaFoldを新型コロナウイルスに適用し、その形状を推定した。

出典: Nature

Protein Folding Problem

たんぱく質はアミノ酸の配列で構成される(下の写真)。アミノ酸と別のアミノ酸が結合するとき、両者の距離や結合角度が決まる。これにより、アミノ酸結合は、らせん配列(Alpha Helix)とシート配列(Pleated Sheet)という構造を取る。更に、これらが絡み合い3D構造のたんぱく質ができる。たんぱく質がどのように折り畳まれているかを解明する研究を「Protein Folding Problem」と呼び、過去数十年にわたり研究が続いている。

出典: DeepMind

ニューラルネットワークの技法

AlphaFoldは三つのニューラルネットワークを使ってたんぱく質の形状を推定した(下の写真)。最初のネットワークはアミノ酸の配列から、それぞれのアミノ酸の間隔と結合角度を推定する。ここでは教育データとして実際のたんぱく質とその距離や角度のデータが使われた。二つ目のネットワークは推定されたたんぱく質の形状がどれだけ正確かを算定する。三つ目のネットワークは、これらの情報からたんぱく質の3D形状を描き出す。

出典: DeepMind

出力結果の検証

このプロセスを新型コロナウイルスに適用し、その形状を推定したのが先頭の写真となる。ただし、これはAlphaFoldによる推定で、実際にこの形状が正しいかどうかは検証されていない。実験で新型コロナウイルスの形状を決定するまでには時間を要し、DeepMindはこの確認を待たないで解析結果を公表した。未確認の情報であるがこれを研究開発に役立てほしいとしている。

体内で生成されるたんぱく質

AlphaFoldは新型コロナウイルスだけでなく、他の病気の治療薬を開発するために開発が続いている。医学分野では、人間の体内で生成されるたんぱく質の構造についての研究が進んでいる。既に、体内で生成されるたんぱく質の中で、その半分について構造が分かっている。これらの情報はProtein Data Bankに登録され一般に公開されている。世界の研究者はこれらたんぱく質の形状を理解し新薬の開発を進めている。

AIを創薬に応用

しかし、遺伝子変異により人間のたんぱく質の構造が変わり、これが原因で病気を引き起こす。これらの病気を治療するためには、変異したたんぱく質の構造を理解する必要がある。この分野でAlphaFoldが活躍し、難病の治療に繋がると期待されている。また、新型コロナウイルスのように新しい種類のウイルスの形状を解析するためにも有益なツールとなる。

医療以外の応用分野

AlphaFoldは医療だけでなく環境問題を解決するツールとしても期待されている。いまプラスチックが海に流れ出て環境汚染が深刻化している。AlphaFoldはプラスチックを生物学的に分解する(Biodegradable)技法の開発を目指している。プラスチックを分解する酵素の発見がゴールとなりAIでその形状を推定する。

遺伝子変異から新型コロナウイルスの感染経路を解明、中国での感染拡大と同時に世界に拡散

新型コロナウイルスが世界各国で広がり世界保健機関(WHO)はパンデミックを宣言した。トランプ大統領は、国家非常事態宣言を発令し、新型ウイルス対策に500億ドル支出する。新型コロナウイルスはどのように広がったのか、ウイルスの遺伝子解析でその経路が見えてきた。

出典: Nextstrain

Nextstrain

これはNextstrainが開発したソフトウェアによるもので、新型コロナウイルスの感染経路をグラフィカルに表示する(上の写真)。これを見ると世界でどのように感染が進んだのかを時系列に把握できる。新型コロナウイルスの遺伝子解析の結果をもとに経路を推定した。Nextstrainは非営利団体の研究機関でオープンソースの手法でウイルスの感染をリアルタイムに把握する技術を開発している。過去にもインフルエンザ、エボラ出血熱、ジカウイルスの感染経路の解析を実施している。

新型コロナウイルスの発祥地

新型コロナウイルスの遺伝子は頻繁に変異を起こし、それを手掛かりに感染経路を特定する。遺伝子が変異し多くの種別が生まれるが、それを「家系図」で示している(下の写真)。ウイルスの遺伝子は左から右に向かって変異していく。左側が先祖で右側が子供となる。丸印は感染者を表わし、丸印と丸印の間で遺伝子が変異している。左右の実線は遺伝子の世代関係を示す。

ウイルスは発生場所により色分けされている。紫色の部分が武漢で検出されたウイルスで、これらは左端に集中している。これらが新型コロナウイルスの初期の患者となる。更に、世界各国で検知されたウイルスはこの子孫にあたり、新型コロナウイルスの最初の感染は武漢で起こり、それが各国に拡大したと推定される。(緑色系は欧州各国で、赤色は米国を示す。日本は薄い青色で示されている。)

出典: Nextstrain

ウイルスが拡大したルート

Nextstrainはウイルスが広がった経路をマップ上にアニメーションで示している。武漢で新型コロナウイルスが急拡大すると同時に、2020年1月中旬には、これが世界に蔓延した(下の写真)。米国では主要都市に、欧州ではイギリス、フランス、ドイツ、イタリアなどに広がった。この時期に、日本にもウイルスが持ち込まれた。

出典: Nextstrain

武漢での新型コロナウイルスの急拡大を受け、各国は中国からの入国を禁止する措置を取り、2月中旬にはウイルスの移動は止まった(下の写真)。

出典: Nextstrain

中国からの感染は止まったものの、この時点では既に手遅れで、欧州と米国で感染者数が急増した。3月上旬には欧州域内で感染が広がるとともに、今度は、欧州から他の地域へウイルスの移動が始まった(下の写真)。米国は3月13日、欧州からの入国を制限したが、既に米国内で感染者が急増している。

出典: Nextstrain

欧州内での感染経路

今では欧州が新型コロナウイルスの発生場所となっている。欧州では同じグループの遺伝子が多数の国で検出され、欧州ではウイルスが国を跨って循環していると推定される(下の写真)。特に、イギリス・ドイツ・オランダ間で同じタイプのウイルスが循環している。

出典: Nextstrain

米国の感染経路

米国には異なるルートで中国からウイルスが持ち込まれた(下の写真)。米中間は人の行き来が多く、多くの都市で感染が広がった。いまワシントン州で市中感染が大規模に発生しているが、これらのウイルスを解析すると、武漢から持ち込まれたウイルスの子孫にあたる。

出典: Nextstrain

イランからの感染が広がる

イランで感染者が急増しているが、これが世界に広がっている。イランを訪問した人が世界各地にウイルスを持ち込んでいる。特に、オーストラリア、ニュージーランド、英国、米国などに広がっている。イラン国内の感染者の遺伝子情報はないが、各国にもたらされた遺伝子は極めて類似性が高く、イランでは一種類のウイルスが国内に蔓延していると推定できる。

出典: Nextstrain

日本の感染経路

日本には数回にわたり新型コロナウイルスが持ち込まれた。これらはすべて武漢からで、これ以外の国からの感染は無い。1月下旬に、大阪、奈良、京都でウイルスが検知され、その直後、静岡と東京でウイルスが検知されている。日本には1月下旬に集中的にウイルスが武漢から流入している。ただし、日本のサンプル数は11と少なく、2月以降のデータはなく、武漢以外の感染経路は特定されていない。

出典: Nextstrain

感染を防ぐには

これらのグラフを見ると武漢で新型コロナウイルスが蔓延し、このウイルスが世界各地に持ち込まれたことが分かる。多くの国で中国からの入国を制限したが、その時点では既に多くの感染者が入国している。米国では最初の感染者は1月15日に武漢からワシントン州に帰国した人物に特定された。いまシアトル近郊で大規模な集団感染が発生しているが、遺伝子解析の結果、そのルーツは最初の感染者にあることが分かっている。

ウイルスのアウトブレークを監視

米国政府は2月初旬に中国からの入国を制限したが、その時には既に米国内で感染が広がっていた。いかに早くウイルスのアウトブレークを検知し、移動を制限するかが決め手となる。米国では新しいタイプのウイルスのアウトブレークを監視する団体が活動しているが、この役割の重要性が改めて認識されている。

経路推定のメカニズム

新型コロナウイルスはRNAタイプのウイルスで、RNAは約3万対の塩基から構成されている。ウイルスが増殖するときにRNAが複製されるが、エラーチェック機能がなく、頻繁に複製の間違い(変異)が起きる。平均して、ウイルスが二回感染すると、RNAは一回変異を起こす。多くの種類のRNAが生成されることになり、これを手掛かりに遺伝子の成長の過程を解析する。この手法は「Pathogen Phylogenies」と呼ばれる。実際には、世界各地でウイルスの遺伝子解析が行われ、その情報はGISAIDに集約される。NextstrainはGISAIDの遺伝子情報を使い、その配列を解析してウイルスが感染した経路を推定した。GISAIDはドイツ・ミュンヘンに拠点を置く非営利団体で医療技術の研究を推進している。

シリコンバレーで新型コロナウイルス治療薬の開発が進む、最新バイオ技術がこの危機を救えるか

サンフランシスコ郊外で感染経路が不明な新型コロナウイルス感染者が見つかり、米国社会の緊張感が一気に高まった。これに先立ち、トランプ大統領は臨時の記者会見を開き、国民に落ち着いて行動するよう求めた。一方、CDCは深刻な事態に直面しており、新型コロナウイルスの蔓延は避けられないとの見解を示した。NIHは新型コロナウイルスの治療薬の開発状況を説明し最新医学の力でこの危機を乗り切る姿勢を示した。

出典: Centers for Disease Control and Prevention

期待される治療薬

この記者会見の中でアメリカ国立衛生研究所(NIH)のAnthony Fauciは、既に新型コロナウイルスの治療薬の臨床試験を進めていることを明らかにした。この治療薬は「remdesivir(レムデシビル)」と呼ばれ、Gilead Sciencesにより開発された。Remdesivirは幅広い種類のウイルスを対象とし、エボラウイルス(Ebola Virus)の治療で効果をあげた。また、動物実験でMERS(Middle East respiratory syndrome)とSARS(Severe acute respiratory syndrome)で効果があることが報告されている。

臨床試験が始まる

Remdesivirを人間に投与してその効用を検証する臨床試験が始まった。これはNIH配下の国立アレルギー・感染症研究所(National Institute of Allergy and Infectious Diseases)が主導し、ネブラスカ大学医学部(University of Nebraska Medical Center)で実施されている。これが米国での最初の臨床試験となり、クルーズ船Diamond Princessの乗客でチャーター機で帰国した患者が被験者となる。世界保健機関(WHO)は新型コロナウイルスの治療薬候補を公開しており、そこには50余りの治療薬がリストされている。この中で、WHOはremdesivirに期待しており、この薬が新型コロナウイルスに効果があるとの見解を示している。

治療薬の仕組み

Remdesivirは新型コロナウイルス(正式名称はSARS-CoV-2、下の写真)に感染した細胞の中で、ウイルスがRNAの複製を造るプロセスを阻害することで、病気(正式名称はCOVID-19)の進行を抑止する。新型コロナウイルスはRNAウイルスで、MERSやSARSも同じタイプである。RemdesivirはMERSにおける動物実験で効果をあげており、同じタイプのウイルスである新型コロナウイルスでも効果があると期待されている。事実、GileadはC型肝炎の治療薬「Harvoni」でこの手法を使っており、その効果が実証されている。C型肝炎ウイルスはRNAウイルスで、Gileadはこの分野で多くの知見を有している。

出典: National Institute of Allergy and Infectious Diseases

補足情報:ウイルスの種類

ウイルスは遺伝子情報を格納する形式でDNAウイルスとRNAウイルスに区分される。DNAウイルスはウイルス内部にDNAを持ち、ここに遺伝子情報を格納する。天然痘を引き起こすウイルスなどがこのタイプとなる。一方、RNAウイルスはRNAに遺伝子情報格納する。新型コロナウイルスはこのタイプで、感染すると体内の細胞の中にウイルスのRNAが放出され、そのコピーが作られ増殖する。新型コロナウイルスは名前が示す通り、新しい種類のコロナウイルスとなる。コロナウイルスには前述のMERSやSARSが含まれ、哺乳類や鳥類に感染し病気を引き起こす。人間の場合は呼吸器感染症などを引き起こす。

Gilead Sciencesとは

Gilead Sciencesはシリコンバレーに拠点を置くバイオ製薬会社で、基礎研究をベースに医療技術を開発している(下の写真)。Gileadは抗ウイルス薬(Antiviral drug)を中心に研究を進め、HIV、B型肝炎、C型肝炎などの治療薬を出荷している。GileadはスイスRocheにインフルエンザ治療薬をライセンスしており「Tamiflu(タミフル)」のブランドで出荷されている。Gilead本社の近くにはGenentechやAlphabet配下のVerilyやCalicoがオフィスを構えており、バイオ技術と情報技術を組み合わせ、先端医療技術を生み出している。

出典: Gilead Sciences

ワクチンの開発状況

この他に、新型コロナウイルスに対するワクチンの開発も進んでいる。インフルエンザを予防するためにワクチンの接種をするが、新型コロナウイルスの予防にもワクチンが欠かせない。通常、ワクチンを開発して製造するまでには3年から4年かかり、この方法では新型コロナウイルスの治療に間に合わない。このため、新たな手法でワクチンの開発が進んでいる。Moderna Therapeuticsは合成したMessenger RNAを体内に注入することで免疫力をつける手法を取る。既に、ワクチンのサンプルをNIHに送付し、臨床試験が4月から開始される。また、InovioはNIHからの助成金を受け新型コロナウイルス向けのワクチンの開発を進めている。

新型コロナウイルスの遺伝子配列

新型コロナウイルスのワクチンを開発するためには、ウイルスの遺伝子配列情報が必須となる。ウイルスの遺伝子配列からその種別や特性などを理解する。中国の研究グループは2019年12月、新型コロナウイルスの遺伝子配列を解析しデータベース「GenBank」に登録した(下のグラフィックス)。病気発症から一か月余りでウイルスの全遺伝子を解読し、この情報が治療薬開発などで使われている。これに続き日本の研究グループは2020年1月、遺伝子配列を解読しGenBankに登録している。この解析データによると、新型コロナウイルスのRNAは29903の塩基対から構成され、11の遺伝子を含んでいることが分かる。GenBankとはNIHが運営するデータベースで、人間を含む生物組織の遺伝子配列が登録されている。自由にアクセスでき、医療技術の発展に寄与している。

出典: GenBank

遺伝子の合成

ワクチンや治療薬の開発では新型コロナウイルスの遺伝子配列情報だけでなく、ウイルスの遺伝子そのものが必要になる。感染者からライブのウイルスを採取してワクチンを開発するのでは時間がかかり、今ではウイルスの遺伝子を研究室で生成する手法が使われる。先進バイオベンチャーなどからウイルスのDNAを人工的に生成した合成遺伝子(Synthetic DNA)が提供されている。サンフランシスコに拠点を置くTwist Bioscienceはこの分野のトップ企業で、ウイルスや酵母の遺伝子を生成し、これを研究機関に提供している。実際に、Twist Bioscienceは新型コロナウイルスの遺伝子を合成し、前述のInovioに提供している。Inovioはこの合成遺伝子で新型コロナウイルスのワクチンを開発している。

出典: Twist Bioscience

遺伝子合成とその危険性

遺伝子を生成する手法は早くから使われてきたが、生成するコストが高く、幅広く普及するには至らなかった。2000年当時、一対の塩基を生成するために10ドルを要した。その後、技術が進み、2010年にはこれが1ドルとなり、現在は0.09ドルで生成でき、医薬品や新素材開発の基礎を支えている。ただ、この手法が悪用されると、テロリストがウイルスを生成し、それを兵器として使う恐れがある。この手法は「Mail-Order Virus」として警戒されている。遺伝子合成が悪用されることを防ぐため、Twist Bioscienceなど合成生物学企業は、生成する遺伝子配列やそれを発注した企業などを政府の規定に従って精査し、安全であることを確認して合成遺伝子を発送する。

出典: Centers for Disease Control and Prevention

サンフランシスコで非常事態宣言

サンフランシスコ郊外で新型コロナウイルスの感染者が見つかり動揺が広がっている。これは感染経路が特定できない市中感染(Community Spread)で、病院の医師は既に多くの感染者がいるとの見解を示し全米で危機感が高まった。カリフォルニア州知事は、8,100人に感染の疑いがあるとして検査を実施する方針を示した。ただ、新型コロナウイルスを検査するためのキット(上の写真)はアメリカ疾病予防管理センター(CDC)から支給されるが、カリフォルニア州全体で200セットしかなく数量が不足している。CDCはキットを増産し、これから本格的な検査が始まることになる。ここで多くの患者が見つかる可能性もあり、サンフランシスコ市は非常事態宣言を発令し、市民に対応を呼びかけている。トランプ大統領は楽観的な見方を示しているが、市民は重大事態が発生することに身構えている。

あなたは何歳まで生きられる?遺伝子で細胞の年齢を計測する

老化の科学Biogerontologyの分野で新しい技術が登場している。身体の細胞の遺伝子を解析することで身体の生理的年齢が分かる。生きた歳月の年齢ではなく、身体が刻んでいる年齢を測定する。この基礎情報をもとにライフスタイルを改善し若さを維持する取り組みが始まった。

出典: Telomere Diagnostics

細胞年齢を計測

この技術を開発しているのはMenlo Park(カリフォルニア州)に拠点を置くベンチャー企業Telomere Diagnosticsで、遺伝子解析でエージングを査定する技術を開発している。遺伝子を解析し細胞年齢を計測するサービス「TeloYears」を展開している。細胞年齢とは体の中の細胞が生物学的観点から何歳であるかを示す指標となる。細胞年齢は身体の健康を示す指標でもあり、この情報を元に問題点を把握し身体を若く保つ。

テロメアの長さ

細胞年齢測定サービスTeloYearsは遺伝子のテロメア(Telomere)の長さを計測することで、細胞の年齢を推定する。テロメアとは染色体の先端のキャップの部分で染色体を保護する役目がある(上の写真)。細胞が分裂を繰り返すとき、テロメアは遺伝子配列が解けるのを防ぐ機能を果たすと考えられる。テロメアの塩基配列は「TTAGGG」のパターンの繰り返しで構成される。

テロメアと老化の関係

しかし、テロメアは年とともに短くなっていくことが知られている(下の写真)。生まれた時にはテロメアの長さが最長で、年を重ねるごとにこの長さが短くなっていく。細胞分裂によりテロメアの塩基配列の一部が壊されると考えられる。テロメアが短くなりすぎると細胞は分裂できなくなる。細胞分裂が止まると体内で新しい細胞が生まれず、古い細胞が取り残される。これが老化のメカニズムで、この状態はSenescent(老化状態)と呼ばれる。

出典: Telomere Diagnostics  

テロメアと病気の関係

テロメアの長さが老化に伴う病気に関係することも分かってきた。テロメアの長さと病気の関係に関する論文が数多く出されている。また論文は血液中のテロメアの長さと60歳以上の高齢者の生存率の間には相関関係があることも指摘している。更に、ライフスタイルや遺伝子や環境がテロメアの長さに影響するとの論文もある。加齢に起因する病気発症は複雑なプロセスであるがテロメアの長さを指標にした健康管理が可能となる。

TeloYears検査キット

このサービスを利用するにはTeloYear検査キットを購入して検体(血液)を送付する。解析結果は3-4週間後にレポートとして送られる。レポートは二種類で検査結果(TeloYears Results Report)と健康管理指針(TeloYears Blueprint for Aging Well)から構成される。また、「Advanced Ancestry」のオプションを購入すると家系についてのレポートが付加される。

検査結果レポート

TeloYears Results Reportは細胞年齢に関する基礎情報を提供する(下の写真)。テロメアの長さは「T/S Ratio」で表示される。「T」はテロメアの平均の長さ(Average Telomere Length)で「S」は規準遺伝子の長さ(Single Gene Length)を表す。TとSの長さの比が細胞年齢の指標となる。下のケースではT/S Rateは0.99と測定された。被験者の年齢は53歳で、このケースではT/S Rateは0.93が標準となる。つまり、被験者の細胞年齢は標準より若く47歳と計測された。

出典: Telomere Diagnostics  

健康管理指針レポート

健康管理指針レポートは若さを保つためのライフスタイルが記載されている。ここにはテロメアの長さを短くする要因が纏められている。その最大の要因は酸化ストレス(Oxidative stress、酸化反応による有害な作用)や炎症(inflammation)で、これらがテロメアを短くする。レポートはこれらの要因を防ぎ若さを保つための食生活、運動、睡眠などを記載している。

サプリメント

Telomere Diagnosticsは検査サービスの他にサプリメント「Telomere Support」を販売している。これは同社が開発したサプリメントでテロメアの健康を促進する効果がある。抗酸化物質(antioxidant)や抗炎症薬(anti-inflammatory)やビタミンを含み、これらがテロメアの健康を促進する。

ライフスタイルの改善

健康管理指針レポートに従ってライフスタイルを改善することでテロメアが短くなるプロセスを抑制し加齢の速度を抑えることができる。また、別の論文では、健康なライフスタイルによりテロメアを長くすることができるとの報告もある。定期的にテロメアの長さを検査することで、自分に最適なライフスタイルをみつけ、若さを保つことが可能となる。一方、この市場には加齢を抑えると謳ったサプリメントやサービスやクリニックが多数あり注意が必要である。

血液一滴でガンを超早期に検知する技術、 臨床試験で好成績をマーク

血液検査でガンを早期に発見する技術「Liquid Biopsy」の技術開発が進み実用段階に入ってきた。ガンを早期に発見できると生存率が格段に向上する。後期ステージに比べ生存率が5倍から10倍向上し、ガンは治療できる病気となる。この技術の背後にはDeep Learningがあり、アルゴリズムがガンのシグナルを検知する。

出典: VentureClef

会社概要

GrailはMenlo Park(カリフォルニア州)に拠点を置くベンチャー企業で、Liquid Biopsy技術で業界のトップを走る。Grailは高精度のDNAシークエンシング技術を使い、血液中を流れる遺伝子の断片を検出する。検知した遺伝子断片をAIで解析し、それがガンであるかどうかを判定する。血液中を流れるガン遺伝子断片の数は希少で、また、その種類は膨大で、検知に高度な技術を要す。シークエンシングではIlluminaのDeep Sequencingが、ガン判定のプロセスではDeep Learningの手法が使われる。

ベンチャーキャピタル

GrailはIlluminaからスピオンオフし独立企業として運営している。ベンチャーキャピタルから注目され、大規模な投資を受けている。また、Bill GatesやJeff Bezosが出資していることでも話題となっている。今年Grailは香港に拠点を置くベンチャーキャピタルから大規模な投資を受け、この資金を元にアジアでの事業展開を進めている。Grailは香港で今年から、咽頭ガン(nasopharyngeal cancer)検知の医療サービスを始める。

大規模な臨床試験

これに先立ち、Grailは開発した技術を検証するために、大規模な臨床試験を実施した。臨床試験の目的は、大規模データを使いAIアルゴリズムを教育することと、教育したアルゴリズムが正しくガンを判定できることを確認することにある。実際に、血液サンプルからガン遺伝子の組織を検出し、高精度でガンをスクリーニングできるかを検証した。

ガンのシグナル

Grailは15,000人の被験者を対象に臨床試験を実施した。このうち70%がガン患者で、被験者から血液サンプルを採取し、cfDNAの手法でDNA断片を解析する(後述)。DNA断片の特徴を抽出し、ガンであるシグナルを把握する。同時に、ガンでないシグナルも把握する。これがガンを特定するデータベースとなり、製品開発の基礎技術となる。

臨床試験の結果

臨床試験では19種類のガンについて検知精度(Sensitivity)が測定された。検知精度は特異性(Specificity)が98%のポイントで測定された。この中で肺ガンについて、前期ステージのガンを51%の精度で検知できた。これは業界トップレベルの検知精度で、Liquid Biopsyの実用化が視界に入ってきた。一方、製品として提供するには、更に精度を向上させる必要があり、今後も開発は続く。

出典: Sysmex  

解析手法

Grailはcell-free DNA (cfDNA) と呼ばれる手法を使っている。これは血液中のがん細胞遺伝子(ctDNA、circulating tumor DNA、上の写真、赤色のらせん構造)を検知することでガンを特定する手法である。ctDNAはガン細胞から血管中にリリースされたDNAで、これを検出してガン発症をつかむ。膨大な数のDNA断片の中から数少ないctDNAを検出するために大規模データをDeep Learningの技法で解析する。

Deep Sequencing

血液サンプルはDeep Sequencingと呼ばれる高度なシークエンシング技術で処理される。シークエンサーはIlluminaのNGS (Next-Generation Sequencing、下の写真) が使われる。シークエンシングされたデータの量は膨大でこれをAIで解析する。Grailは大規模データを取り扱うIT企業でもある。

出典: Illumina  

事業開始時期

膨大な数のcfDNAからガン細胞から排出されたctDNAを検出するため、Deep Sequencingの手法でシークエンシングする。このため検査コストは高く一回の検査で1万ドル近くかかる。このためGrailは保険会社などと交渉し、スクリーニング試験に保険を適用することを計画している。Grailは2018年から香港で事業を開始するが、米国での事業時期は明らかにしていない。

ガンによる病死を激減させる

GrailはLiquid Biopsy研究でトップを走っている。Grailの特徴は血液検査で異なる種類のガンを検知でき、初期ステージのガンの検知精度が高いこと。市場に出ているLiquid Biopsyは特定のガン(大腸がん等)に特化し、後期ステージのガンの検知で使われる。Grailは初期ステージのガン検知を目指し、スクリーニング技術を一般に幅広く普及させ、ガンによる病死を激減させることを目標としている。