AIが新型コロナウイルスによる肺炎を検知、オープンソースとして公開され医療技術の進化に寄与

世界で新型コロナウイルスの感染が爆発的に広がっているが、その中心は欧州から米国に移ってきた。ニューヨーク州が危機的な状況にあるが、その次はカリフォルニア州といわれ、州知事はロックダウン(shelter-in-place)命令を発令した。会社や小売店やレストランは休止状態で、住民は自宅に留まることを求められ、街は静まり返っている。

出典: Linda Wang et al.

COVID-Net

新型コロナウイルスが広がる中、研究機関は病気(COVID-19)を検知するためのAIを公開した。これは「COVID-Net」と呼ばれ、患者のレントゲン写真から、新型コロナウイルスによる肺炎を検知する。病気検知のために多くのAIが開発されているが、これらはクローズドソースで一般の研究は使うことができない。これに対して、COVID-Netはオープンソースとして公開され、だれでも自由に利用できる。

データセットも公開

COVID-Netはカナダ・ウォータールー大学(University of Waterloo)とDarwinAIにより開発された。同時に、COVID-Netを教育するためのデータセット「COVIDx」も公開された。ここには13,645人の患者の16,756枚のレントゲン写真が格納されている。アルゴリズムとデータセットが公開され、これらをテンプレート(Reference Model)として研究が進み、COVID-19治療技術の確立に寄与することが期待されている。

病気の早期発見

いま、新型コロナウイルスにより病気を発症した患者を早期に特定する技術が求められているが、胸部のレントゲン写真がその手掛かりになる。COVID-19を発症した患者の肺のレントゲン写真にはこの病気に特有な形状が現れる。この特性をAIが学習しCOVID-19による肺炎を検知する。

ニューラルネットワーク構造

COVID-Net(下の写真)は胸部のレントゲン写真を読み込み(左端)、それを解析して判定を出力する(右端)。AIが下す判定は三種類で、1)感染していない(正常)、2)COVID-19肺炎、3)それ以外の肺炎となる。ネットワークのアーキテクチャは、人間がモデルの原型を決め、これをAIで最適化する手法が取られた。つまり、人間とAIがコラボしてCOVID-Netが生成された。最適化の条件として、精度は80%以上で、演算(multiply–accumulate operation、掛け算と保存の演算)の量は25億回以下とした。演算量を抑えるが、そこそこの精度がでる構成とした。

出典: Linda Wang et al.  

判定精度

実際に、データセットを使ってCOVID-19の性能を検証すると、判定精度(Accuracy)は92.4%となった。具体的な検証結果は下記のグラフィックスの通りで、縦軸が基準値(Ground Truth)で横軸が検証精度(Precision)で、箱の中の数字は件数を示す。COVID-19患者10人について検証すると、COVID-Netは8人を正しく判定し、もう一人は通常の肺炎と、もう一人は感染なしと判定していることが分かる。COVID-Netは早期にCOVID-19感染者を見つけるために使われ、また、通常の肺炎とCOVID-19肺炎を見分けるためにも活用される。

出典: Linda Wang et al.  

アルゴリズムの判定理由

この研究ではCOVID-Netは何を根拠に病気を特定したのか、その理由を説明する機能が導入された。これは「GSInquire」と呼ばれる技法で、ニューラルネットワークがオブジェクトを判定した根拠を表示する。このケースでは、COVID-Netがレントゲン写真で肺炎と判定した根拠となる部分をピンクのシェイドで示している(先頭の写真)。この部分にCOVID-19肺炎に特有なパターンがみられる。これにより、AIのブラックボックスが開かれ、医師は判定の理由を理解できる。また、COVID-Netは医師が認識していない肺炎のパターンを検知でき、新たな知見が生まれることが期待されている。また、COVID-Netのデバッグにも利用でき、アルゴリズムが誤検知する理由を把握する。

研究者のツール

COVID-Netの判定精度は92.4%とあまり高くはなく、まだ、医療ツールとして病院で使える品質とは言えない。一方、COVID-Netは研究者コミュニティにより改良が進み、精度や機能が向上し、医療ツールとして使えるよう進化する。今は研究のためのプロトタイプであるが、これをベースに新型コロナウイルスの治療技術が進むと期待される。