ゲノム編集技術CRISPRで新型コロナウイルスを検知、5分で結果が分かり感染対策の切り札として期待される

バイデン次期大統領は政権移行の準備を進め、先週、新型コロナウイルス対策のタスクフォースのメンバーを発表した。就任後はこのチームが司令塔となり、世界最悪とも言われる米国のコロナウイルスと戦うことになる。バイデン次期大統領は、科学と技術を最大限に活用し、都市をロックダウンすることなく、感染を食い止めるとしている。

出典: Melanie Ott et al.

現行のコロナウイルス検知技術

コロナ対策でカギを握るのはウイルスの検知技術で、短時間で正確に判定できる技法が求められている。現在はPCR検査が主流であり、高精度に判定できるものの、結果が出るまでに時間を要す。また、処理量を増やすことが難しく、これらが感染拡大を防げない要因とされる。

CRISPRベースの検査

いま、ゲノム編集技術CRISPRを使った新型コロナウイルス検知技術の開発が進んでいる。ノーベル化学賞を受賞したジェニファー・ダウドナ教授らの研究チームは先月、CRISPRを使った新型コロナウイルス検知技術を発表した。この技法を使うと5分間でウイルスを検知でき、感染拡大を防ぐ切り札になると期待されている。

検査キットの概要

検査キットは専用デバイスとスマホから構成され(上の写真、左側)、判定結果はスマホに表示される(上の写真、右側)。採取した検体をサンプル容器にいれ、それを専用デバイス(箱型の部分)に装着する。ここにレーザー光を照射し、これを専用デバイス上のスマホカメラで読み取る。新型コロナウイルスを検知するとサンプルは緑色に発光し、陽性であることを示す。また、光の強度はウイルスの数を示し、陽性判定だけでなく、検体の中のウイルスの量を把握できる。このキットは病院や会社などで使われ、現場でリアルタイムに感染状況を把握できる。

CRISPRで検知する仕組み

検査キットはCas13aとcrRNAを使い、新型コロナウイルスに特有のRNA配列を検知する(下のグラフィックス)。検査キットにはマーカー(Reporter RNA)が入っており、ウイルスのRNAを検知するとCas13aがその周囲のマーカーを切断する。マーカーが切断されると蛍光物質が放出され、ここにレーザー光線を照射すると発光する。この光を検知することでウイルスの存在を把握する。

出典: Melanie Ott et al.

感染対策の決め手

CRISPRベースの検査キットは既に使われているが、検査結果が出るまに1時間かかり、更なる改良が求められていた。ダウドナ教授らの研究チームはこれを大幅に短縮し、5分で結果を得ることに成功した。また、この方式はウイルスの量が少なくても検知できるとしている。新型コロナウイルスに感染した直後は、ウイルス量が少なく検知が難しいが、この方式はこれを解決した。短時間で高感度でウイルスを検知でき、感染対策の切り札として期待されている。

[米国における新型コロナウイルス検査方法]

新型コロナウイルスの検査の種類

新型コロナウイルスの検査ではPCR検査と抗原検査が普及している。PCR検査はウイルスのRNAの断片を検知することで感染を把握する。抗原検査はウイルスを特徴づける抗原(タンパク質)を検知し感染を把握する。ここにCRISPR検査が加わった。CRISPRベースの検査では、ウイルスを特徴づけるRNAの断片を遺伝子編集の手法で把握する。

PCR検査

ウイルス検査ではPCR検査(RT-PCR、Reverse transcription polymerase chain reaction)が標準手法で、高精度で判定でき幅広く使われている。PCR検査は20年の歴史があり、新型コロナウイルス以外でも標準検査として定着している。一方、PCR検査は特殊機器を備えた施設で実施され、検査結果がでるまでに数日かかる。医療現場で手軽に検査できないことが課題となっている。

高速PCR検査

この問題を解決するため、PCR検査を高速で処理するキットが開発された。これはAbbottが開発した「ID Now」で(下の写真)、アメリカ食品医薬品局はこれを医療機器として認可した。検体を採取して15分ほどで結果がでることから注目を集めた。トランプ大統領が記者会見でID Nowを推奨したことで有名となった。一方、ID Nowは検査精度が高くなく、利用法が難しいことが指摘される。実際に、大統領や高官が相次いでウイルスに感染し、検知精度の限界が明らかになった。

出典: Abbott

抗原検査

抗原検査キットは多くの企業から販売されている。Abbottは「BinaxNOW」というブランドで販売している(下の写真)。特殊な機器は不要で短時間で結果がでるため容易テストとして使われている。抗原検査はPCR検査に比べ精度は低く、また、偽陰性(陽性を陰性と判定)と判定されるケースが多い。

出典: Abbott

CRISPR検査

マサチューセッツ州ケンブリッジに拠点を置く新興企業Sherlock BioSciencesはCRISPRベースの新型コロナウイルス検知キットを開発した。これは「Sherlock CRISPR SARS-CoV-2 Kit」と呼ばれ、アメリカ食品医薬品局が認可した最初の製品となった。この基礎技術はマサチューセッツ工科大学のFeng Zhang教授らにより開発され、技術改良が進んでいる。

出典: Sherlock BioSciences

アメリカ大統領選挙の予想は大きく外れた、一方AIは有権者の群集心理から勝敗を正確に予想

アメリカ大統領選挙はバイデン氏が圧勝すると予測されていたが、ふたを開けると僅差での勝利となった。選挙予想は再び外れたが、今回の予測は四年前より誤差が大きく、現行手法の限界が示された。一方、AIは有権者の群集心理を解析する手法で、激戦州の勝敗をズバリと的中させた。また、このAIは、勝敗が決まった後も、トランプ大統領は、選挙は不当であると主張し、敗北宣言をしないと予測している。

出典: CNN  

再び予測が外れる

アメリカ大統領選挙で主要メディアはバイデン氏が圧勝すると予測したが、バイデン氏が勝ったもののその差は小さく、再び予測が外れた。2016年の大統領選挙でも予測が外れたが、今年の選挙では前回より誤差が大きく、世論調査の手法についての検証が始まっている。国の世論が激しく対立する中、いまの手法で動向を予測することは限界であるとの意見も聞かれる。

AIによる選挙予測

このような社会情勢のなか、AIで選挙結果を予想する技法が注目されている。このAIを開発したのはサンフランシスコに拠点を置く新興企業Unanimous AIで、群集心理を解析することで勝敗を予測する。この技法は「Swarm Intelligence」と呼ばれ、個人ではなく集団で予測すると予測精度が上がるという仮説の元に構築されたモデル。大統領選挙の他に、野球やフットボールの試合の結果を正確に予測する。また、アメリカ映画のアカデミー賞では受賞作品を正確に予測し、社会を驚かせた。

激戦州の予測

大統領選挙ではSwarm Intelligenceを激戦州に適用してその結果を予測した。多くの州はその結果は明白で、投票前に勝敗が分かる(例えばカリフォルニア州は民主党支持でバイデン氏が勝利など)。しかし、10余りの州は勝敗の予測が難しく、激戦州(Swing States)と呼ばれ、これらの州の結果で大統領が決まる。Unanimous AIはこれら激戦州の勝敗の予測を投票日の45日前(9月21日)に実施し、その結果を公開した(下のグラフ)。

出典: Unanimous AI

予測結果

このグラフは激戦州ごとに勝敗の予測とその差が示されている。例えば、ペンシルベニア州はバイデン氏が3.5%の差で勝利すると予測。選挙結果が出そろったが、この判定はすべて的中している。注目はフロリダ州で、主要メディアはバイデン氏が3%から5%の差で勝つと予想していたが、Unanimous AIは1.6%の差でトランプ氏が勝つと予測した。実際に、トランプ氏が3.4%の差で勝利し、この手法の有効性が示された。

トランプ大統領が負けを認めない期間

Unanimous AIは選挙結果が出た後の両者の行動を予測している。トランプ大統領が負けた場合、94%の確率で、「この選挙は公正でない」と主張すると予測し、実際にこの事態が発生している。また、82%の確率で「勝敗が確定した後も最低二週間は負けを認めない」と予測している(下のグラフ、左側)。つまり、少なくても11月21日まではトランプ大統領は勝ちを主張することになる。

出典: Unanimous AI  

トランプ大統領支持率の予測

Unanimous AIはこれに先立ち、トランプ大統領就任後100日間の支持率を予測している(下のグラフ、緑色の線、歴代大統領との比較)。AIの予測によると支持率は42.1%で、他の大統領と比較して極めて低く、ショッキングな数字となった。しかし、この予測は的中し、支持率は41.9%で、在任中一度も50%を上回ることはなかった。

出典: Unanimous AI  

応用分野

Unanimous AIはこの技法をマーケティング調査や専門家の意見集約などに応用している。実際に、スタンフォード大学医学部は肺のレントゲン写真から結核を判定するプロセスにSwarm Intelligenceを導入した(下の写真)。複数の放射線医師がレントゲン写真から結核の判定をするが、そのプロセスをSwarm Intelligenceで解析すると判定精度が22%向上した。この病院ではAIが自動で結核を判定するシステム「CheXNet」を使っているが、Swarm Intelligenceの判定精度がこれを上回った。人間の知恵を集約することでAIより高度な判定ができることを示している。

出典: Unanimous AI  

何故予測が偏るのか

主要メディアは予測が大きく外れた理由を解析しているが、四年前に増して今回も、数多くの「Shy Trump Voters」がいたと考えられている。これは隠れトランプ支持者とも呼ばれ、世論調査の統計に表れない層を指す。今回は、トランプ大統領が支持者に対し、世論調査には答えないよう発言しており、この数が増えたとの見方もある。

有権者は懐疑的

一方、今回は、有権者は世論調査結果に懐疑的で、数字を割り引いてみる傾向が強かった。特に、マイケル・ムーア映画監督はしばしばテレビ番組に出演し、世論調査の結果はバイデン氏に偏っているので、これを信用しないようバイデン支持者に呼びかけた。このように、今回の選挙戦は有効な予想技術を持たない中、霧の中での戦いとなった。分断されたアメリカ社会で世論動向を正しく把握する技術としてAIに期待が寄せられている。

アメリカ大統領選挙はバイデン氏が勝利、トランプ大統領家族はフェイクイメージでテレビ番組に出演

アメリカ大統領選挙はバイデン氏が勝利宣言し、新しい時代の幕開けとなった。選挙期間中はフェイクイメージが有権者を混乱させると警戒していたが、予想に反し目立った被害はなかった。一方、AIで構成されたテレビ番組が始まり、初回はトランプ大統領家族が“出演し”、AIがリアルに描いたフェイクイメージが注目を集めている。

出典: Sassy Justice

Deepfakeで作られた番組

この番組は「Sassy Justice」という名前で、登場人物の顔はすべてAIで描かれる。世の中の不正を暴くことを使命とする主人公Fred Sassyが、ワイオミング州の州都シャイアンで活躍するというパロディーで、多くの著名人が登場するが、その顔はDeepfakeで生成されている。Deepfakeとは顔を置き換えるAIで、演技する俳優の顔を著名人の顔で置き換える。

トランプ政権の風刺

この番組は大統領選挙前にYouTubeに公開され、トランプ政権を風刺した内容となっている。トランプ大統領とニュースキャスターのインタビューがDeepfakeで再現された。実際の場面が描かれ、回答に困窮するシーンがクローズアップされた(下の写真)。顔はDeepfakeで生成されたものであるが、映像からそれが偽物であるとは分からない。しかし、受け答えや演技はコミカルで、フェイクビデオであることが分かる。

出典: Sassy Justice  

ロシア政策のパロディー

この番組はトランプ一家が登場し、イヴァンカ・トランプ(先頭の写真)は記者会見で、「米国でDeepfakeが拡散している理由はロシアによるもの」との見解を示した。トランプ大統領はロシアによる情報操作は無いと主張するが、この番組でイヴァンカがこれを認めた形となっている。一方、ジャレッド・クシュナーは子供として登場し(下の写真)、Deepfakeの取り締まりを強化しているが、その目的は「パパが選挙で勝つため」と答える。

出典: Sassy Justice  

映画スターの登場

トランプ家族の他にも著名人が登場し、女優ジュリー・アンドリュースは若いころの姿で、Deepfakeの検知技術を開発している研究者として描かれている(下の写真)。社会にDeepfakeが溢れる中、コンピュータ技術を使い、これを見抜く技法を開発している。しかし、それを使ってビデオ画像を判定するが、どうも上手くいかない。。。

出典: Sassy Justice  

番組制作者

この番組は米国の人気アニメ「South Park」の監督・声優であるTrey Parkerらにより制作された。米国のトップ・プロデューサーが手掛けるDeepfakeは完成度が高く、映像からフェイクであることを見抜くことはできない。一方、音声は声優によるものであり、また、前述の通り、コミカルな演技から、Deepfakeを使ったコメディであることが分かる。

Deepfakeで番組を制作する目的

Trey Parkerはメディアとのインタビューの中で、このビデオを制作した理由はDeepfakeの危険性を分かりやすく伝えるためとしている。フェイクイメージが社会に広がり、人々は戦々恐々としているが、このビデオはコミカルにDeepfakeとは何かを説いている。同時に、完成度の高いDeepfakeのインパクトは強く、映画やテレビ番組でAIで顔を生成する手法が広がる兆しを感じさせる。

[Deepfake技術概要]

Deepfakeとは

Deepfakeは顔を置き換える技法で、実在の人物の顔を著名人の顔に置き換えるツールとして使われている(下の写真)。ある人物の顔写真(左端)を著名人の顔(中央、トム・クルーズ)に置き換えると、その人物の顔の部分だけがトム・クルーズになる(右端)。例えば、ビデオ撮影した自分の顔をトム・クルーズの顔に置き換えると、映画スターが映っている偽のビデオができる。

DeepFaceLab

この番組では「DeepFaceLab」というタイプのDeepfakeが使われた。DeepFaceLabはオープンソースとして公開されており、誰でも自由に使うことができる。DeepFaceLabは演技者の顔が鮮明に映ってなくても、高精度なDeepfakeを生成できるという特徴を持つ。(下の写真:DeepFaceLabで生成したイメージで、サングラスで目が覆われていても高精度なDeepfakeを生成できる。)

出典: Ivan Perov et al.

NvidiaはAIビデオ会議システムを開発、GANが在宅勤務社員の姿を鮮明に描く

Nvidiaは開発者会議「GTC20」で、ビデオ会議機能をAIで強化する技法を公開した。フェイクイメージを生成する技術GAN(Generative Adversarial Network)は重大な社会問題となっているが、この技術を使うとビデオ画像が格段に鮮明になる。在宅勤務でビデオ会議が多用され通信回線がひっ迫しているが、GANを使うことで、限られた帯域の中で鮮明な画像を送信できる。

出典: Nvidia

Nvidia Maxineとは

これは「Nvidia Maxine」と呼ばれ、AIをフルに活用したビデオ会議フレームワーク (上の写真)。この技術を使うと通信回線の状態が悪くても鮮明な画像を送ることができる。また、出席者の顔を常にカメラに正対するよう補正できる。会話型AIが発言者の言葉をリアルタイムで翻訳する。様々なAI機能が搭載され、ビデオ会議の機能が大幅にアップする。Nvidia Maxineはフレームワークで、企業は既存のテレビ会議システムにこれらAI機能を組み込み機能を強化する。

通信データの圧縮

ネットワークの状況が悪いと、ビデオ会議の映像がスムーズに伝わらない。例えば、相手の人物の映像が荒くなる(下の写真、左側)。これに対し、Nvidia MaxineはAIをデータ転送に適用することで、通信速度が遅い環境でも、高精度なイメージを送信できる(下の写真、右側)。Nvidia Maxineは、実際に顔のイメージを送信する代わりに、受信側でAIが顔のイメージを生成することで高解像度の画像を表示する。ストリーミングデータの送信ではH.264という画像圧縮規格が使われるが、Nvidia Maxineはこれに比べ10倍の精度で送信できる。

出典: Nvidia

顔を正面に向ける

この他に、「Face Alignment」という機能を使うと、AIが横を向いている顔を正面に向ける。PCのディスプレイを見ながら話すと顔が横に向くケースが多く(下の写真、左側)、この機能を使うとこれを補正し、正対して会議をすることができる(右側)。ここでも、GANが顔イメージを生成し、それを正面に向くよう補正する。

出典: Nvidia  

同時通訳

また、「Translation」という機能を使うと、リアルタイムで話し言葉を翻訳し、それをディスプレイに表示する(下の写真)。ここでは対話型AIフレームワーク「Nvidia Jarvis」が使われている。Nvidia Jarvisが話し言葉を理解し、それを翻訳し、その結果をテキストとしてディスプレイに表示する。

出典: Nvidia  

AIアバターとの対話

開発者会議では対話型AIアバター「Conversational AI Avatar」のデモが実施された。AIアバターは音声で会話できるだけでなく、表情を変えることができ、対話における表現が増す。エイリアンのAIアバターは宇宙に関するトピックスについて対話できる(下の写真)。

出典: Nvidia  

在宅勤務とネットワーク環境

在宅勤務が続きビデオ会議が多用されるが、最大の問題点はネットワーク通信であることが分かってきた。コロナ以前は通信容量が問題になることはなかったが、在宅勤務で一斉にビデオ会議が使われると、ネットワーク環境がこれに追随できないことが明らかになった。今すぐにネットワークを補強することは難しいが、Nvidia Maxineを使うと鮮明な画像を送ることができる。

[技術概要:ストリーミングデータをGANで生成]

データ送信の仕組み

Nvidia Maxineは、顔イメージを送信するのではなく、GAN(Generative Adversarial Network)が顔のランドマークから顔のイメージを生成する手法を取る(下の写真)。送信者はカメラで撮影した写真(下の写真、Keyframeの部分)を参照データとして送り、それ以降は、顔のランドマーク (Keypointsの部分)だけを送る。受信側のPCは、GANで顔のランドマークから顔のイメージを描き出す。ここではGauGANという方式のGANが使われている。

出典: Nvidia

GauGANとは

GauGANとはNvidiaの研究チームが開発したGANで、セマンティック情報を写真に変換する機能を持つ(下の写真)。セマンティック情報とは色で区分けされたマップ(下の写真、最上段)で、色がオブジェクト種別を示す(青色が空で茶色が樹木など)。GauGANはこのセマンティック情報を写真のようなリアルのイメージ(二段目以降)に変換する。その際に、指定されたスタイル(左端の列、朝焼けや日没など)に沿って変換する。GauGANは他の手法に比べ入力された条件(セマンティック情報)に忠実に従い、写真のようにリアルなイメージを生成できる点に特徴がある。Nvidia Maxineはこの技法を使い、入力された顔の特徴(Keypoints)を顔の写真(Keyframe)にそって生成する。顔の特徴がセマンティック情報で顔の写真が指定されたスタイルとなる。

出典: Taesung Park et al.

女性の服を脱がせるAIが進化:GANが高解像度ヌードイメージを生成、攻撃対象がセレブから一般女性に移り深刻な社会問題に

女性の服を“脱がせる”アプリ「DeepNude」で被害が拡大している。このアプリは写真の中の女性の服を取り去るもので、セレブが被害を受けてきたが、今では攻撃の対象が一般女性に移り、深刻な問題が報告されている。SNSに投稿している写真が悪用され、裸の写真が公開されている。DeepNudeは高度なAIを使い、生成されるヌード写真はリアルで、真偽の区別はつかない。

出典: layne@pinterest

調査レポート

これはセキュリティ会社Sensity.aiの分析によるもので、DeepNudeによる被害状況が明らかになった。DeepNudeはメッセージングサービス「Telegram」で使われ、一般女性が攻撃の対象となっている。2020年7月時点で、104,852人の女性の写真が使われ、被害者の数はここ三か月間で3倍になっている。

攻撃の仕組み

被害が拡大している理由はDeepNudeのユーザインターフェースの進化にあり、誰でも簡単に写真を加工できるようになったため。Telegramでボット(対話型AI)と対話しながら操作を進めるだけで服を脱がす (下の写真)。ボットの指示に従って、写真をアップロードすると、DeepNudeがそれを編集する。DeepNudeは写真に写っている女性のイメージを読み込み、それをベースに、服の部分を肌に変換する。つまり、アプリが女性の服を脱がしたイメージが生成される。

生成されたイメージを公開

生成した写真はスマホにダウンロードして閲覧できる。また、この写真をTelegramや他のサイトに公開すると、不特定多数がこれを閲覧することになる。簡単な操作でヌード写真を生成できるので、利用者が増え被害が拡大している。

出典: Sensity.ai

誰が攻撃を受けるのか

今まではセレブの写真が使われてきたが、今では攻撃の対象が一般女性となっている。利用者の63%が知人女性や一般女性を攻撃するとしている。SNSなどに掲載されている写真が本人の了解なく使われる。また、スマホで撮影した写真を使うケースもある。SNSには膨大な数の写真が掲載されており、誰もが被害にあう可能性がある。

攻撃の理由

生成した写真はTelegramの他に、他のメディアに掲載され、だれでも閲覧できる状態になっている。知人女性のヌード写真を生成する目的は、リベンジポルノや嫌がらせなどとされる。また、ランサムウェアのように、ヌード写真を消去するために、金銭を要求するケースもある。

攻撃から身を守る方法

DeepNudeは進化を続け、女性の写真から高解像度のヌード写真を生成する。生成されたイメージはリアルで真偽の判別はできない。このため、攻撃される危険性を認識し、写真の管理を厳格にすることが最初のステップとなる。SNSに全身がアップで写った写真を掲載すると悪用される可能性が高まる。また、水着など肌に密着し体形が分かる写真は特に危険で、高精度なヌードイメージに変換される。防衛技術は無く自分で身を守るしか手段が無い。

Telegramとは

Telegramはメッセージングサービスで、ロシアの実業家Pavel Durovにより開発された。2013年から運用を開始し、今では全世界で4億人の利用者がいる。利用料金は無料で、広告の掲載もなく、Durovが運用資金を拠出しているといわれている。Telegramはロシアで事業を開始したが、今は本社をロンドンに置き、開発拠点はドバイにある。DurovはロシアでSNS「VK」を運用しており、ロシアのZuckerbergとも呼ばれる。

出典: Telegram

Telegramのポジション

TelegramがDeepNudeをホスティングしていることは警察などに報告されているが、運用が続いている。Telegramは反社会的な団体の利用を容認しており批判を受けている。しかし、Telegramは表現の自由と利用者のプライバシー保護を理由に、一貫して、利用条件を設けないで運用している。

[技術情報:DeepNudeとGAN]

開発経緯

DeepNudeは匿名の技術者により開発され、2019年6月、ウェブサイト(下の写真)に公開された。このサイトからアプリをダウンロードしてWindowsとLinuxで実行することができた。しかし、社会の反響が甚大で、その危険性が指摘され、五日後にはサイトが閉鎖された。その後、この技術は別の人物に売却され、今では、オープンソースとして公開されている。Telegramで使われているDeepNudeはオープンソースを改良したものとみられている。

出典: DeepNude

技術概要

DeepNudeは改良が進み、最新版は「pix2pixHD」という技法を使っている。これはNvidiaにより開発されたGAN(Generative Adversarial Networks)で、入力されたイメージをベースに別のイメージを高解像度で生成する。下の写真:pix2pixHDの構造。pix2pixHDは二つのGAN(G1とG2)で構成される。G1はGlobal Generatorと呼ばれ低解像度のイメージを生成し、これをG2で高解像度(2048 × 1024)のイメージにエンハンスする。pix2pixHDは、Berkeley AI Research (BAIR) Laboratoryが開発した「pix2pix」を改良し、解像度を向上させ、安定性を強化した。

出典: Ting-Chun Wang et al.

利用方法

Pix2pixHDは、市街地のタグイメージ(下の写真、左側、Semantic Label Map)を、写真イメージ (下の写真、右側) に変換する。写真イメージはGANが生成したものであるが、本当の写真のようにリアルで、細部まで詳細に描かれている。どこかの街並みのように見えるが、このような場所は存在せず、生成された写真はGANが描き出した仮想社会。pix2pixHDで生成した市街地のイメージは自動運転車の教育データとして使われている。

出典: Ting-Chun Wang et al.