カテゴリー別アーカイブ: 人工知能

顔認識AIでプライバシーが崩壊‼我々の顔写真が全米の警察で使われている

新興企業「Clearview」は高精度の顔認識AI(下の写真)を開発し、全米の警察で犯罪捜査に利用されている。Clearviewはソーシャルメディアに公開されている顔写真をダウンロードしてこのシステムを開発した。写真の数は30億枚を超え、世界最大規模の顔写真データセットとなる。これに対し、市民団体は、個人の顔写真を許可無く使用することは違法であるとして、Clearviewに対し集団訴訟を起こした。

出典: Clearview

情勢はClearviewに有利

これから審理が始まるが、情勢はClearviewに有利で、米国には、イリノイ州を除いて、顔写真をダウンロードすることを禁止する法令は無い。このため、裁判所は公開されている顔写真を使うことは違法ではないとの判決を下すと予想される。顔認識AIは我々の顔写真を使っていることは間違いなく、この行為は違法ではなく、顔写真は個人情報として保護されないことになる。

Clearviewとは

Clearviewはニューヨークに拠点を置くAI新興企業で、高精度な顔認識技術を開発した。創設者のHoan Ton-That(下の写真)はベトナムで生まれ、オーストラリアで育ち、アメリカで起業した。Clearviewの開発手法はユニークで、FacebookやTwitterやYouTubeに投稿された顔写真と属性(名前など)をダウンロード(Scraping)して顔写真のデータセットを構築した。このデータセットをAIの教育や顔認識アプリの実行で使っている。Clearviewの顔認識アプリは主に警察で使われている。警察は容疑者の写真を撮影し、それを顔認識アプリに入力し、容疑者の身元を割り出す。

出典: CNN

Clearviewの評価

データセットに格納された写真の数は30億枚を超え、ClearviewのAIが容疑者の身元を特定する精度は極めて高く、全米の警察から高く評価されている。今年1月、トランプ前大統領の支持者がアメリカ連邦議会に乱入した事件で、FBIや各地の警察は前例のない規模で事件の解明を進めている。その際に乱入者の身元を割り出すことがカギとなるが、ここでClearviewの技術が使われ、350人を超える容疑者の逮捕に繋がった。(下の写真、検索結果の事例)

出典: Clearview

Clearviewの問題

一方、ClearviewのAI開発手法に対し、個人のプライバシーを侵害しているとの懸念が高まっている。顔認識AIを開発するには大量のデータが必要であるが、Clearviewはネット上の顔写真をスクレイピングしてデータセットを構築した。我々の顔写真と名前がFacebookなどからダウンロードされており、個人のプライバシーの重大な侵害であるとして、社会から批判を受けている。

集団訴訟が始まる

ソーシャルメディアに掲載されている顔写真をサイト管理者や写真本人の了解を得ないでダウンロードすることは違法かどうかの議論が始まった。各地の市民団体はClearviewに対して集団訴訟を起こした。カリフォルニア州では、個人のプライバシーを保護する法令があり、州の住人は10件の集団訴訟を起こしている。この法令は、住民は個人情報が利用されることを制限できると定めており、Clearviewに顔写真を使うことを停止するよう求めている。

Clearviewの主張

これに対し、Clearviewは、企業が公共のデータにアクセスする権利は、アメリカ合衆国憲法修正第1条(First Amendment)で保障されていると主張する。修正第1条は「表現の自由」や「報道の自由」を定めており、公開されている情報を収集する権利は保障されていると反論する。事実、Googleはサイトに公開されているテキストや写真をスクレイピングしており、Clearviewも同じ手法を取っている。

出典: Clearview

スクレイピングを禁止する法令は無い

米国では個人や企業がサイトに掲載されている情報をスクレイピングすることを禁止する法令は無い。一方、システムをハッキングすることを禁止する法令「Computer Fraud and Abuse Act」は1986年に制定された。これは個人や企業がシステムに許可なくアクセスすることを禁止するもので、システムに危害を与えることを防ぐ目的で設立された。

LinkedInの判例

LinkedInはサイトに掲載されている情報に新興企業がアクセスし、これをスクレイピングされるという被害を受けた。このため、LinkedInは上述の法令を根拠に、新興企業を提訴した。しかし、巡回裁判所(9th Circuit Court、日本の控訴裁判所に相当)は、スクレイピングは違法ではないとの判決を下しLinkedInは敗訴した。

パンドラの箱

スクレイピングの法解釈はグレーな部分が多く、また、インターネット企業のビジネスに直結するため、企業はあえて議論を避けてきた。しかし、Clearviewは法廷でこの問題を明確にする戦略を取り、これから各地の裁判所で審理が進み、スクレイピングについての判決が下されることになる。今の情勢では、この訴訟は最高裁判所まで進み、ここでスクレイピングに関する法解釈が決まるとみられている。

Googleのスクレイピング

Googleは検索クローラが世界のサイトからテキストや写真をスクレイピングしている。顔写真や氏名や電話番号などが取得され、個人情報の巨大なデータベースが運用されている。検索エンジンは巨大な顔認識システムでもあり、著名人の顔写真を入力すると氏名を検索できる(下の写真)。Googleはスクレイピングが認められるが、Clearviewにはこれが認められていないとして、Clearviewは法廷で争う姿勢を示している。

出典: Google

Microsoftの対応

このような中、Microsoftはプライバシー問題から、顔認識AIを教育するためのデータセットを消去した。Microsoftは著名人の顔写真100 万枚を収集しデータセット「Microsoft Celeb」を構築し、顔認識AIの教育で利用していた。Microsoft はデータセットに収集されている顔写真について、本人の同意を得ていないとして全てのデータを消去し、公開サイト「MS Celeb38」を閉鎖した。顔写真のプライバシーに関する解釈が分かれる中、Microsoftは独自のルールを定め倫理的な方針を取った。

政府の規制が求められる

MicrosoftなどIT企業は、顔認識技術の危険性と有益性について認識しており、早くから政府による規制を求めてきた。Microsoft 社長のBrad Smith は連邦政府議会に対し、AI による顔認識技術を規制することを求めた。同様に、ClearviewのHoan Ton-Thatも連邦議会に対し、顔認識AIの運用に関する規制を制定するよう求めている。顔認識技術は誤用すると危険なツールとなるが、正しく使うと社会に大きな恩恵をもたらすとして、許容できる利用法と禁止すべき利用法を明確にすることを求めている。

10年後アメリカ国民は毎年140万円支給される、AIが労働力を担い稼いだ利益を社会に還元

AIは社会で労働力を担い富を生み出すが、それがGoogleなどAI企業に集約される。これにより、アメリカ社会で富の偏在化が加速し、抜本的な対策が求められている。高度なAIを開発するOpenAIの創業者であるSam Altmanは、この問題を解決するためには新たな仕組みが必要であるとし、AIが得た利益を国民に還元する構想を提唱した。10年後のアメリカ社会でこれを実施し、国民は一人当たり毎年13,500ドル(訳140万円)の給付金を受ける。

出典: OpenAI

10年後のAIの機能

この構想の前提条件となるのが10年後のAIの機能で、人間に代わり労働を担えるまでに成長すると予測する。AIは5年後には人間のような読解力を持ち、文章を読んで意味を理解する。また、医学の知識を蓄え、人間の医師に代わり診断を下す。更に、10年後には、ロボティックス技術が進化し、人間に代わり製造ラインで作業する。その後は、分野を特定することなく、AIは人間に代わり科学や技術の研究開発に従事する。

AI革命

Sam Altmanはこれを「AI革命(AI Revolution)」と呼んでいる。歴史を振り返ると、人間が農業を始めた「農業革命」から機械化による「工業革命」に続く。更に、計算機の登場による「コンピュータ革命」となり、これから「AI革命」が始まる。AIが人間のような思考能力や理解力や判断能力を備え、仕事に従事し、膨大な富を生み出す。AIが生み出す富は、国民が最低限の生活をするに十分な額となり、社会構造が大きく変わる(下の写真)。10年後にはこのポイントに到達し、国民は生活費を支給され、労働に縛られない自由な生活ができる。労働から解放され趣味に打ち込むことができる。また、自分の嗜好に沿った仕事を選択でき、そこで能力を開花させることもできる。

出典: Sam Altman

ムーアの法則

AltmanはAIにより社会の全ての領域でムーアの法則(Moore’s Law)が適用されると予測する。これを「Moore’s Law for Everything」と呼んでいる。ムーアの法則とはコンピュータの技術進化を一般化したもので、半導体チップのゲートの数は2年ごとに2倍になるという経験則に基づく将来予測。これは半導体素子や加工技術の進化によるもので、コンピュータや家電の単価は毎年低下する。

AIとムーアの法則

一方、アメリカでは医療費や大学授業料が異常に高く、深刻な社会問題となっている。特に、医療費の値上がりは顕著で、対GDP比は先進国の中で最も高い値となっている。AIの進化でこれらの価格がムーアの法則に従って下がると予測する。例えば、医師に代わりAIが病気を診断し治療することで医療費が値下がりする。大学ではAIが教師に代わり、学生の習熟度を把握して最適な授業をする。AIが医師や教師を置き換えることで、医療費や大学授業料もムーアの法則に従って単価が下がる社会が到来する。

American Equity Fund

これらAIが得た収入はAIを活用する企業に集約される。AltmanはAIが労働力となる社会では今とは異なる課税体系が必要だと主張する。現在は労働で得た利益に課税されるが、AIが労働力となる社会では、企業の時価総額(発行株式の価値)と企業が所有する不動産(土地の部分)に課税する。この方式を「American Equity Fund」と呼び、AI企業が生み出した富の一部を基金とし、それを国民に分配する。American Equity Fundは“AI税”とも解釈でき、AI企業の利益を国民に還元するメカニズムとなる。

試算すると

Altmanは具体的な税率を示しており、企業の時価総額と不動産資産(土地の部分だけ)の2.5%を基金に納入する。時価総額のケースでは株を、また、不動産資産のケースでは現金で納税する。現在、米国企業全体の時価総額は50兆ドルで、土地価格は30兆ドルで、10年後にはこれが2倍になると予測される。米国の成人人口は2億5000万人で、一人当たり毎年13,500ドルの支給を受ける計算となる。

ベーシックインカム

この背後にはベーシックインカム (Universal Basic Income)の考え方がある。ベーシックインカムとは、社会保障の一種であるが、従来の失業保険などとは異なり、全ての国民に一律にお金を支給する制度を指す。受取のための条件はなく、毎月一定額の金額が支給される。受け取ったお金の使途の制限も無く、受給者が自由に使うことができる。ベーシックインカムの構想は50年前から議論されてきたが、AIによる失業問題が拡大する中、再び注目されている。

出典: New Atlas

オークランドでの実証試験

実際に、Altmanはシリコンバレーでベーシックインカムの実証試験を展開することを発表した。サンフランシスコ対岸のオークランドにおいて、100家族に毎月1000ドルから2000ドルの現金を支給する。支給期間は6か月から1年の間で、受給者は受け取ったお金を自由に使うことができる。まだプロジェクトはスタートしていないが、政府機関でなくAI企業創業者が実施することで話題となっている。

ストックトンでの実験結果

シリコンバレー郊外のストックトン(下の写真)は、2019年から二年に渡り、ベーシックインカムの実証実験を展開し、先月、その実験成果を公表した。これによると、市民は毎月500ドルを受け取り、それを自由に使うことができ、その結果、受給者の就業率が向上し、健康状態も改善された。また、ベーシックインカムの使途は生活必需品(食料品や衣料品など)で、たばこやアルコールを購入したケースは殆ど無かった。ベーシックインカムの有効性については賛否両論があり、反対者は給付金で労働意欲が無くなり、生活が怠惰になると主張する。しかし、ストックトンのケースはこれと反対の結果となり、給付金で就労率が上がり生産性が向上した。

出典: City of Stockton

利益を再分配するメカニズム

これから、間違いなく、人の仕事はAIやロボットに奪われ、大失業時代が到来する。オフィスワークなど事務部門だけでなく、医療や教育など専門性の高い部門でも起こり、自動化による失業が世界規模で発生する。レイオフで企業は高い利益を生み出すが、利益を再分配するメカニズムが無ければ、収入の格差が今以上に増大する。ひいては、社会や経済が不安定になり、平和な世界が脅かされる。

ハイパー富裕層と貧困層

このため、AltmanだけでなくElon Muskなど業界著名人はベーシックインカムが必須となるのは自明であると主張する。ベーシックインカムの必要性については理解が広がっているが、そのための巨大な財源が常に議論となってきた。2020年の大統領選挙ではAndrew Yangがベーシックインカムを公約に掲げ、アメリカ国内でその認知度が一気に高まった。米国でハイパー富裕層が巨大な富を構築する中で、貧困層の割合が増え、階層間で緊迫状態が続いている。公平な社会の仕組みを構築することが今まで以上に求められている。

AIで新型コロナウイルスの遺伝子配列を解析、配列を言葉として解析しワクチンが効かない異変種の発生を予測

新型コロナウイルス感染症のワクチン接種が始まり、パンデミックが終息に向かうと期待されている。ウイルスは変異を繰り返し、今年に入り相次いで英国型や南アフリカ型異変種が発見された。これら異変種は感染力が高いが、ワクチンは有効であるとの見解が示されている。しかし、最新のAIを使った解析では、更に複数の異変種が生まれ、その幾つかはワクチンが効かないと推定する。この事態に陥れば、新型コロナウイルスの終息にはもう少し時間がかかるかもしれない。

出典: Brian Hie et al.

Viral Escape:ワクチンが効かなくなる

新型コロナウイルスなど感染症向けにワクチンが開発されるが、ウイルスの遺伝子が変異するとワクチンの有効性が低下し、最悪の場合は効かなくなる。ワクチン接種により体内に抗体(Antibody)が生成されるが、ウイルスが変異すると抗体がこれを認識できなくなる。これは「Viral Escape」(ウイルスがワクチンをすり抜けるという意味)と呼ばれ、感染症対策の大きな課題となっている。ワクチン開発ではウイルスがどう変異するとワクチンが効かなくなるのかが重要な情報となる。(上のグラフィックスは新型コロナウイルスのスパイクたんぱく質で、Viral Escapeが発生する可能性が高い個所(黄色)と低い個所(青色)を示している。スパイクたんぱく質に対してワクチンが開発されているが、Viral Escapeが発生しない部分(上のグラフィックス右側、S2と示された個所)に作用する仕組みを取る必要がある。)

ウイルスに自然言語解析を適用

MITのAI研究チームはViral EscapeをAIの自然言語解析(Natural Language Processing)を使って予測する技法を開発した。ウイルスの遺伝子配列を言葉として捉え、そこから文法(Grammar)と意味(Semantics)を把握することで、どの遺伝子変異がViral Escape(ワクチンが効かない状態)に繋がるかを予測した。この研究ではインフルエンザウイルス(influenza A hemagglutinin)、エイズウイルス(HIV-1 envelope glycoprotein)、及び、新型コロナウイルス(SARS-CoV-2 spike glycoprotein)の三種類が使われた。

遺伝子配列の文法と意味

ウイルスの遺伝子配列を解析し、その文法と意味を把握するが、それらを次のように解釈できる。文法とはウイルスの基礎機能を決める。文法がしっかりしているウイルスは感染能力が高く、ウイルスが生存する可能性が高いことを示す。一方、意味はウイルスの変異を示す。異なる意味をもつウイルスは異なる形状を示すことになる。例えば、新型コロナウイルスが変異して、意味が異なり、文法が正しければ、ワクチンが効かない感染力の強いウイルスが生まれることになる。

出典: Brian Hie et al.  

遺伝子配列の文法と意味を可視化

上のグラフはこれを可視化したもので、縦軸が文法で横軸が意味を示す。文法が正しいほど(上に行くほど)、感染能力が高い(赤色の円)。意味が変わるとワクチンが効かなくなる。矢印の通り、左上のウイルスが右上のウイルスに変異すると、感染力が高く、ワクチンが効かないウイルスとなる(Viral Escapeが起こる)。一方、ウイルスが変異しても文法が正しくなければ、感染力が低下し無害のウイルスとなる(青色の円)。

自然言語解析の手法

この研究では自然言語解析の手法を適用したが、具体的には、LSTM(Long short-term memory)というタイプのニューラルネットワークが使われた。LSTMは時系列のデータを解析する手法で、言語処理では入力された言葉に続く言葉を推定する。この研究では、LSTMにウイルスの遺伝子配列を入力し、ネットワークは意味と文法を出力する。

出典: Brian Hie et al.  

上のグラフィックス;BiLSTMにウイルスの遺伝子配列を入力すると(最下段)、ネットワークはその意味(入力データに続く言葉 = 変異)を出力し(中段)、更に、その文法を出力する(最上段)。モデルは推定した言葉と、この言葉が持つ文法の正しさを推定し、Viral Escapeとなる確率を算定する。

解析の結果

モデルが予測した結果を過去のデータで検証し推定の精度を検証した。このモデルはインフルエンザやHIVや新型コロナウイルスなど5種類のウイルスを解析した。その結果、新型コロナウイルスに対して、モデルは85%の精度Viral Escapeとなる変異を予測した(下のグラフ、右端)。

出典: Brian Hie et al.  

感覚的な理解

このモデルを自然言語に応用するとこの機能を理解しやすい。モデルは元の文章が変異するパターンを予測し、それが文法に適合しているかどうかを判定する。更に、文章の意味に関し、それらがどのような位置関係にあるかを算定する(下のグラフィックス)。

  • 上段:元の文章は「オーストラリア人がバリ島で死んだ」
  • 中段:文章が変異する(australianがaussieに変わる)が意味は変わらない
  • 下段:文章が変異する(deadがballetに代わる)と「オーストラリア人がバリ島でバレイ」となり意味が変わるが、文法も正しい。この変異がViral Escapeとなる。
出典: Brian Hie et al.  

事前に対策を講じる

いま新型コロナウイルスが変異し、英国型や南アフリカ型変異種の感染が広がっている。もし、変異種が発生する前に、ワクチンが有効かどうかを把握できると、医療関係者はその拡散に備え、必要な対策を取ることができる。また、ワクチンや治療薬の開発では、Viral Escapeが発生しにくい領域を対象に、モデルを開発することができる。このモデルはまだ研究段階であるが、AIは現行ワクチンが効かない新型コロナウイルスの発生を予測しており、不測の事態に備えておく必要がある。

Amazonはリストバンド「Halo」を投入、究極の健康管理ウエアラブルでAIが身体とメンタルの状態をモニター

Amazonは健康管理のウエアラブル「Amazon Halo」(下の写真)の出荷を開始した。これはリストバンドタイプのウエアラブルで、身体情報をモニターするセンサーとして機能する。ディスプレイは備えておらず、健康管理に特化したセンサーで、スマホアプリとペアで使う。実際に使ってみると、フィット感は良く、身体やメンタルの状態を把握でき、健康管理デバイスの新しい流れを感じる。

出典: Amazon

Amazon Haloの概要

Amazon Haloは右手または左手の手首に装着し、身体状態をモニターするために利用する。四つの機能を搭載しており、運動量、睡眠の質、声のトーン、及び、体脂肪率を計測する。計測したデータはスマホの専用アプリ「Amazon Halo App」に表示される(下の写真)。スマートウォッチではディスプレイに情報が表示されるが、Amazon Haloは健康管理センサーとしてデザインされ、最小限の機能だけを搭載している。価格は99.99ドルでAmazon Prime会員向けには74.99ドルで販売されている。Amazon Haloはサブスクリプション方式のデバイスで、月額3.99ドルの使用料金を支払う。

出典: Amazon / VentureClef

運動量をモニター

Amazon Haloは運動量をモニターし、体を動かした量をポイントで表示する(下の写真、左側)。一週間に150ポイントを得ることが目標で、その過程がグラフで表示される。1ポイントは1分間に中程度の運動をする量となる(右側)。中程度の運動とは、速足でのウォーキングやほうきで庭を掃除する程度の運動で、医療学会American Heart Associationは一週間に150分の運動を推奨している。Amazon Haloは加速度センサーと心拍数センサーで運動量を算定する。

出典: VentureClef

睡眠の質を測定

Amazon Haloは睡眠の状態を測定し、その質を100点満点のスコアで示す(下の写真、左側)。スコアは睡眠時間と睡眠内容を総合的に評価したもので、70点を下回ると対策が必要となる(右側)。スコアは睡眠時間の他に、寝入るまでの時間、ステージごとの時間、夜中に起きた回数などを加味する。睡眠のステージは「Hypnogram」と呼ばれ、Light、Deep、REMから成る。Lightは浅い眠りで、睡眠時間の半分を占める。Deepは深い眠りで、睡眠の前半に起こる。深い眠りの中で身体の細胞が修復され、健康維持に深くかかわるとされる。REM(Rapid Eye Movement)は脳が活動して覚醒状態にある眠りで、このステージで人は夢を見たり、記憶が整理される。このスコアで睡眠の状態を把握し、問題があればこれを改善する。ただ、睡眠の質は人により異なり、スコア以外に、朝起きた時の爽快感や日中の気分などが重要な指標となる。

出典: VentureClef

声のトーンを分析

Amazon Haloに搭載されたマイクが利用者の声を聞き、それをAIで解析して、声のトーンを把握する(下の写真、左側)。声のトーンとは言葉に含まれた感情で、四つに分類され、Amused、Content、Reserved、Displeasedとなる(右側)。Amusedは楽しい時の、Contentは満足した時の声のトーンとなる。Reservedは静かな状態で、Displeasedは怒った時の声のトーンとなる。実際に使ってみると、声のトーンを通じてメンタルの状態を把握できる。その日の気分を正確に把握するのは難しいが、Amazon Haloはこれを客観的に分析しグラフで提示する。また、Amazon Haloは会話の”鏡”として機能し、自分の声が相手にどのような印象を与えているのかを理解できる。この機能を使うには、事前に声を入力し、AIが本人を特定できるよう教育しておく。

出典: VentureClef

体脂肪率を推定

Amazon Haloは体脂肪(Body Fat)の割合を計測する(下の写真、左側)。スマホカメラで身体を撮影し(右側)、AIが画像を解析し脂肪量(Fat Mass)を推定する。体重については利用者が測定して入力する。これにより体脂肪率が分かる。

出典: Amazon

体脂肪率は健康管理に重要な指標で、この値が健康寿命や病気発症に関連する。体脂肪率が高いと心臓疾患や糖尿病の発症確率が上がる。体重は食事などで頻繁に変わるが、体脂肪量は変動が少なく、その変化が健康に大きく影響する。このため、二週間おきに体脂肪率を測定することを推奨している。体脂肪については、多くの測定法があるが、Amazon Haloはコンピュータビジョンと機械学習でイメージを解析する手法を取る。AIが体形から体脂肪を推定するが、病院での測定技術(Dual-Energy X-Ray Absorptiometryなど)と同等の精度であるとしている。

健康管理のコンテンツ

Amazon Haloは研究所「Labs」を運用しており、ここに健康管理のコンテンツを揃えている。コンテンツはワークアウトや睡眠の質を向上させるプログラムやマインドフルネスのレッスンなどから成る。ワークアウトは自宅でできるエクササイズが揃っており、ビデオでインストラクターの指示に従って体を動かす(下の写真)。ストレングス、カーディオ、ヨガ、バー(Barre、右側下段)の分野があり、目的に合ったプログラムを選択できる。バーとはバレエダンスに基づくワークアウトで、ハリウッドのセレブが行っていることで人気となった。Appleはフィットネスのための有料プログラム「Apple Fitness+」をスタートしたがAmazon Haloはこれに対抗する位置づけとなる。

出典: VentureClef

実際に使ってみると

左手にはApple Watchを着けているので、Amazon Haloは右手に装着して利用している。Apple Watchより一回り小型の形状で、着装感は軽く負担は感じない。デバイスを操作する必要はなく、Amazon Haloが自動で身体状態をモニターするので、ウエアラブルというよりはバイオセンサーを着装している感覚に近い。

一番驚かされたデータ

睡眠を分析した情報に一番驚かされた。日ごとに睡眠のスコアは大きく変わり、また、睡眠のパターンも一定ではない。よく眠れた日とそうでない日が明らかになり、今までは、感覚的に寝不足を感じていたことがデータで示される。次のステップとしては、上述のLabsに登録されているコンテンツを使って、睡眠の質を上げることになる。

リアルタイムで声のトーンを分析

Amazon Haloが分析する声のトーンも参考になる。普段の会話の声のトーンを把握し、次は、好感を持ってもらえる声のトーンにアップグレードするステップとなる。また、スピーチで好まれるしゃべり方を学習することもできる。Amazon Haloはリアルタイムで声のトーンを解析する機能もあり(下の写真、右側)、このツールとLabsに掲載されているレッスンを併用して声のトーンを改良する。

出典: VentureClef

バイオセンサー

Amazon Haloは人気のウェアラブル「Fitbit Tracker」からディスプレイを取り外した形で、リストバンド形状のバイオセンサーとしてデザインされている。センサーが収取するバイオデータをAIが解析し、健康管理のポイントをアドバイスをする。実際に使ってみると、健康管理のウエアラブルは生活に必須のデバイスであると感じ、これから需要が大きく伸びると思われる。できることなら、血圧や血糖値や酸素飽和度を測定する機能があれば健康維持に大きく寄与する。

タンパク質フォールディングでブレークスルー!!DeepMindはアミノ酸配列からたんぱく質3D構造を予測するAIで50年に渡るチャレンジに解を出す

アミノ酸の配列からタンパク質の3D形状を推定する技法は「タンパク質フォールディング」と呼ばれ、生物学のグランドチャレンジとして、50年にわたり研究が続いてきた。DeepMindは高度なAI「AlphaFold」でこの問題に挑戦し、ついにこれを解くことに成功した。これは生物学の革命と称賛され、医療や製薬が大きく進展すると期待されている。(下の写真:タンパク質フォールディングの事例で、タンパク質の3D形状をイラストで示している。緑色の形状が実測値で、青色の形状がAlphaFoldの予測。)

出典: DeepMind

生物学のグランドチャレンジ

タンパク質はヒトや他の生物を構成する基本単位で、その数は2億種類にのぼる。ヒトは2万種類のタンパク質で構成され、これらが生命の源となる。タンパク質は3D構造が重要で、その形状が機能を決定し、また、他のタンパク質との相互作用を司る。このため、タンパク質は「structure is function」といわれ、その3D構造の解明が続いてきた。しかし、構造を解明できたタンパク質の数はわずかで、3D構造解析が生物学のグランドチャレンジとされてきた。

タンパク質フォールディング

タンパク質はアミノ酸の配列で構成され、ヒトのタンパク質は20種類のアミノ酸で構成される。DNA情報を元にアミノ酸の配列が生成され、それが折り畳まれて3D構造のタンパク質となる。アミノ酸とアミノ酸が結合するとき、両者の距離や結合角度が決まり、らせん配列(Alpha Helix)やシート配列(Pleated Sheet)の構造となる。更に、これらが絡み合い、3D構造のタンパク質ができる。タンパク質がどのように折り畳まれているかを解明する研究を「Protein Folding Problem」と呼び、過去50年にわたり研究が続いてきた。

実験による3D構造の解明

タンパク質の形状を実測するために様々な手法が使われている。主なものは、低温電子顕微鏡法(cryo-electron microscopy)、 核磁気共鳴(nuclear magnetic resonance)、X線回折(X-ray crystallography)などで、実験的手法でその形状を把握する。これらが標準手法(Gold standard)で高精度に形状を把握できるが、測定には時間と経験と費用がかかる。

AlphaFold2の概要

DeepMindはタンパク質の実測に代わり、ニューラルネットワークで形状を推定する研究を進めている。このAIは「AlphaFold」と呼ばれ、アミノ酸の配列からタンパク質の3D形状を推定する。AlphaFoldは既に形状が判明しているタンパク質のデータを使って教育された。AlphaFoldは10万のタンパク質のアミノ酸配列と3D形状を学習し、新たなタンパク質の形状を推定できるようになった。その最新版「AlphaFold2」は高精度に3D形状を推定できる。

出典: DeepMind

タンパク質フォールディングのコミュニティ

DeepMindはタンパク質フォールディングのコミュニティCASP (Critical Assessment of protein Structure Prediction)でずば抜けた性能を示した。CASPはアミノ酸の配列からタンパク質の3D形状を予測するコンペティションで二年ごとに実施される。DeepMindは2018年にはAlphaFoldで、今年は最新モデルAlphaFold2で参戦し、破格の成績を示した(上のグラフ)。

ベンチマーク結果

タンパク質フォールディングの性能はGDT(Global distance test)という指標で示される。これは実験で得られたタンパク質3D構造と予測した3D構造がどれだけ重なるかを査定し、100点満点で示される。AlphaFold2のスコアは90点を超え(上のグラフ右端)、これはタンパク質フォールディングの解を示したと解釈される。つまり、AlphaFold2は実測と同じ精度でタンパク質の3D形状を推定できることを意味する。

新型コロナウイルスの解析

DeepMindはAlphaFoldを新型コロナウイルス(SARS-CoV-2)に応用し治療法の研究に貢献している。新型コロナウイルスは30種類のタンパク質から成り、それらの3D構造の解析が進んでいる。しかし、その中で6種類のタンパク質についてはその形状が分からず、DeepMindはその中の「ORF3a」の形状を特定することに成功した(下の写真)。青色の形状がAlphaFoldによる推定で、緑色の形状がUC Berkeley Brohawn Labによる実測値で、推定結果は実測値に極めて近いことが示された。その後、AlphaFoldはもう一つのタンパク質「ORF8」の3D構造を解明した。

出典: DeepMind

医療への応用

AlphaFoldがタンパク質の3D形状を推定することで、医療技術が大きく進化すると期待されている。その一つが感染症対策で、アフリカなどの途上国で蔓延している感染症「睡眠病(sleeping sickness)」の治療法開発に役立つとされる。睡眠病はツェツェバエが媒介する感染症で、タンパク質の形状が分からないことが病気治療の妨げとなっている。これらは「neglected tropical diseases」と呼ばれ、医療の手が届かず放置された状態の病気で、緊急の対策が求められている。

新薬開発

また、製薬会社はAlphaFoldで分子構造を把握することで、新薬開発が大きく進展すると見ている。新薬開発では複数の候補分子を選び、そこから効果のあるものを絞り込み、完成までに10年の歳月と25億ドルの費用が掛かるとされる。AlphaFoldで病気に関与する人体のタンパク質の形状が分かると、それに効果のある分子を特定でき、新薬開発が大きく進化する。

出典: DeepMind

DeepMindの苦戦と成果

DeepMindは「AlphaGo」を開発し、高度なAIが囲碁の世界チャンピオンを破り、社会に衝撃を与えた。その後、DeepMindは研究開発を進めるが、社会に役立つAIが登場せず、その開発戦略が問われていた。AlphaGoから5年が経過するが、AlphaFoldはタンパク質フォールディングで画期的な成果を示し、今度は社会に役立つAIで世界を驚かせた。(上の写真、AlphaFold開発チーム、今年は在宅勤務で研究を続行。)