米国で白人至上主義団体の活動が拡大、しかしDNA解析により活動家の多くは純粋な白人でないことが判明

米国で白人至上主義団体による抗議活動が激化している。バージニア州シャーロッツビルでは白人至上主義者がクルマで反対集団を襲撃し死者と多数の負傷者がでる惨事となった。白人至上主義団体や極右団体が台頭し社会に不安が広がっている。同時に、DNA解析サービスの普及で白人の定義が明確になり白人至上主義の価値観が揺らいでいる。

出典: Google  

DNA解析サービスの結果は

白人至上主義 (White Supremacy) 団体の活動が拡大する中、活動家はDNA解析サービスを利用し自身が純粋な白人であることを確認する動きが始まった。純粋な白人であると思っていた活動家がDNA解析を受けると白人以外の人種が混ざっていたというケースが相次いで報告されている。活動家の多くは”白くない”という事実が判明しそのアイデンティティが揺らいでいる。

白人至上主義者の研究

この事実はカリフォルニア大学ロサンジェルス校のAaron PanofskyとJoan Donovanの研究で明らかにされた。研究結果は「When Genetics          Challenges a Racist’s Identity: Genetic Ancestry Testing among White Nationalists」として公開された。この研究は白人至上主義者の交流サイト「Stormfront」を追跡調査したもので、ここに投降される記事からDNA解析に関連するものを抽出し内容を分析したものとなっている。活動家の多くがここで意見を交換するが最近ではDNA解析に関する書き込みが目立っている。

純粋な白人は少数

論文によると白人至上主義者は純粋な白人であることを確認するために23andMeなどを利用してDNA解析による家系解析検査 (genetic ancestry test) を受けている。しかし、純粋な白人であることを確認できたのは1/3に過ぎず、残りの2/3は異なる人種が混じっていると報告している。純粋な白人でないと判定された人たちはこの結果をどう受け止めるべきか葛藤が続いている。

研究結果の具体的な事例

その一人がノースダコタ州に住むCraig Cobbという男性である。DNA解析サービスを受けたが、その結果ヨーロッパ人種 (European) である割合は86%で残りの14%はアフリカ人種 (Sub-Saharan African) であることが分かった。Cobbはテレビ番組に出演し独自の意見を展開した。この結果を受け入れることはできず「統計エラー」であると述べている。また「DNA解析技術はジャンクサイエンス」で「結果は仕組まれたもの」と奇異な解釈を示した。Cobbは黒人から友達と呼ばれ握手を求められるがこれを断るシーンも放送された。また、別の会員は「鏡を見て白人に見えれば問題ない」とか、「テスト結果ではなく本人の心情が重要」などと苦しい見解が目立っている。

出典: 23andMe  

23andMeの人種特定サービス

23andMeは遺伝子による人種特定サービス「Genetic Ancestry Composition」を展開している。被験者のルーツを辿るサービスでDNAを解析して人種を特定する。被験者の多くは複数の人種から構成されこのサービスはその割合を示す (上の写真)。対象となる人種の区分は「European」、「South Asian」、「East Asian & Native American」、「Sub-Saharan African」、「Middle Eastern & North African」、「Oceanian」の六種類からなる。日本人は「East Asian」に区分され、ここには「Japanese」の他に、「Korean」、「Yakut」、「Mongolian」、「Chinese」が含まれている。(Yakutとはロシア連邦サハ共和国に居住するヤクート族。)

世界の国々からサンプルを収集

23andMeは人種を特定するために被験者の遺伝子と特定地域に住んでいる人の遺伝子を比べる手法を取っている。まず、世界の国々からサンプルを集め人種と遺伝子を関係づけたデータベース (Referenceと呼ばれる) を生成する。被験者の遺伝子をReferenceと比較して人種を特定するプロセスとなる。Referenceの総数は10,000を超えるが、その多くは外部研究プロジェクト (スタンフォード大学のHuman Genome Diversity Projectなど) 結果を引用している。これに加え、23andMe会員のデータも利用している。

白人至上主義とは

白人至上主義は過去のものと思われていたが日々のニュースで登場する回数が増えた。白人至上主義とは白人が他の人種より秀でているというイデオロギーで白人が社会をコントロールすべきという考え方を示している。色々な団体があるがクー・クラックス・クラン (Ku Klux Klan) が有名で今でも活動を続けている。

南北戦争と関連する

米国の白人至上主義は南北戦争 (Civil War) に関連している。エイブラハム・リンカーン (Abraham Lincoln) は大統領になる直前、奴隷制度の拡大を禁止した。南部11州はこれに反対しアメリカ合衆国を離脱し独自にアメリカ連合国 (Confederate States of America) を設立した。連合国は1861年、サウスカロライナ州のサムター要塞 (Fort Sumter) を攻撃し南北戦争が始まった。連合国の大統領がJefferson Davisで、連合国軍を指揮した将軍がRobert E. Leeであった。連合国は合衆国に敗れ1865年に戦争は終わった。

連合国の彫像を撤去

戦争には敗れたものの、連合国を回想する目的でJefferson DavisやRobert E. Leeの彫像が数多く建立された。一方、人権団体からこれらは人種差別を象徴するとして彫像を撤去する声が高まり、各州や市は撤去作業に向けて動き出した。シャーロッツビル市はRobert E. Lee将軍の彫像 (先頭の写真) を撤去することを表明し、これに反対する白人至上主義団体は彫像を守るために集会を開き、これが惨事につながった。

歴史の解釈は難しい

この衝突を繰り返さないため他の州や市はJefferson DavisやRobert E. Leeの彫像の撤去作業を急いでいる。人種差別を象徴するシンボルは公の場には相応しくないというのがその理由である。一方、識者の中にはアメリカの歴史を後世に伝えるため、暗い事実を葬り去るのではなく過去の教訓として残すべきという意見も少なくない。事実、米国の国会議事堂 (United States Capitol) には50州を象徴する彫像が100体展示されている (下の写真)。ここにはJefferson Davis (ミシシッピー州を代表) とRobert E. Lee (バージニア州を代表) も含まれており、撤去すべきかどうかその取扱いについて議論が続いている。

出典: National Statuary Hall  

白人至上主義者はアイデンティティが揺らぎ活動が減衰するのか

白人至上主義団体や極右団体の活動が活発になっている理由はトランプ大統領のポジションが影響している。トランプ大統領は白人至上主義団体の過激な活動に寛容な態度を見せており、これが活動を暗に支持していると受け止められている。抗議活動には参加しないもののこの動きを支持するグループが存在しこれがトランプ大統領の支持基盤となっている。トランプ政権のもとで極右勢力が広がるのか、それとも白人至上主義者はアイデンティティが揺らぎ活動が減衰するのか、その動きが注目されている。

DNAを悪用したサイバー攻撃、遺伝子にマルウエアを埋め込みコンピュータに侵入する

DNAシークエンシング技術は高度に進化しヒトの全遺伝子配列を高速低価格で解明できるようになった。DNA編集技術も進化し、プログラムをコーディングする要領で遺伝子配列を生成できる。いまDNAを媒体とするサイバー攻撃の脅威が指摘されている。DNAにマルウェアを組み込み、これをシークエンサーで読み込むとコンピュータがウイルスに感染する。

出典: Tadayoshi Kohno et al.

DNAセキュリティ研究

これはワシントン大学コンピュータサイエンス学部 (Paul G. Allen School of Computer Science & Engineering, University of Washington) がセキュリティ研究として発表したもので、DNAを使ってサイバー攻撃ができることを示している。バイオサイエンスとコンピュータの交点が攻撃の対象となっている。実際に被害が発生しているわけではないが、この研究は将来の攻撃に対して今から対策を取る必要性を説いている。

システムが攻撃を受ける仕組み

この研究では実際にマルウェアを組み込んだDNA (上の写真、中央部の液体状の物質) を生成し、これでコンピュータの制御を奪うことに成功した。まず、DNAをシークエンサーで解析し遺伝子配列を読み取る。次に、解析された遺伝子配列はコンピュータで処理され遺伝子変異などの知見を得る。しかし、マルウェアが埋め込まれた遺伝子配列をコンピュータで処理するとシステムにウイルスが侵入し制御を奪う。

DNA Processing Pipelineを攻撃

具体的には、遺伝子解析のプロセスは検体 (唾液など) をDNAシークエンサーで処理し塩基 (A, T, C, G) 配列順序を把握する。塩基配列は解析システム (一般にDNA Processing Pipelineと呼ばれる) で処理され遺伝子変異などを検出する。DNA Processing Pipelineは大規模な遺伝子配列を解析し遺伝子変異のカタログを生成するプロセスとなる。研究ではこのプロセスで遺伝子配列を装ったマルウエアがコンピュータを攻撃し制御を奪うことに成功した。

シークエンシング技術の進化

DNAシークエンシング技術はムーアの法則を上回るペースで進化している。シークエンシング技術のトップを走るのがIlluminaで遺伝子解析のインテルとも呼ばれている。Illuminaによるヒトの全遺伝子をシークエンシングするコストは2009年は10万ドルであったが2014年は1000ドルに低下した。この価格破壊が遺伝子解析ビジネスの引き金になっている。(下の写真、Illuminaのシークエンサー「HiSeq」)

出典: Illumina

遺伝子編集技術

同時に、遺伝子編集技術も高度に進化し低価格で特定の配列を持つDNAを購入できる。研究では、マルウエアを埋め込んだDNAを合成するためにIntegrated DNA Technologiesという会社のgBlocks Gene Fragmentsというサービスが使われた。同社はCoralville (アイオワ州) に拠点を置きDNA合成サービスを提供している。gBlocks Gene Fragmentsとは指定された配列でDNAを生成するサービスで、このケースでは生成にかかる費用は89ドルであった。

クルマのハッキングを警告

同学部は2010年にクルマがハッキングされる危険性に関する論文を発表した。クルマの構造が機械部品からエレクトロニクスに進化し、インターネットに接続される構成となっている。研究者は実際にクルマの電子制御部分 (Electronic Control Unit) にハッキングするデモを公表し注意を喚起した。当時はクルマがハッキングされることは想像しにくく、セキュリティに関する意識は低かった。しかし、近年はクルマをハッキングする事例が数多く報告され、論文で指摘された危険性が現実になっている。

DNAビジネスの中心はソフトウェア   

同様にDNAにマルウェアを埋め込んだ攻撃が起こるとは考えにくいのが実情である。DNAシークエンシングやDNA解析システムに関するセキュリティ意識はまだまだ低い。DNAシークエンシング価格の低下で遺伝子配列データが大量に生成されている。DNAビジネスの中心はシークエンシングハードウェアから生成された遺伝子配列データを解析するソフトウェアに移っている。個人向け遺伝子解析やPrecision Medicineと呼ばれる個人に特化した医療サービスなどが普及することになる。遺伝子解析が個人の健康を支える社会インフラになり、システムを安全に運用するためのセキュリティ対策が求められる。

TeslaはModel 3を完全自動運転車として発売、AIはカメラだけでオブジェクトを判定

Teslaは普及モデル「Model 3」の出荷を開始した。既に50万台を受注しておりTeslaは需要に応えるため生産ラインの拡充を急いでいる。Model 3の登場でEVが一気に普及することとなる。同時にModel 3の登場で自動運転車開発が加速する。出荷されるModel 3は自動運転に必要なハードウェア機器を搭載しており、ソフトウェアの更新で自動運転車となる。

出典: Tesla  

Tesla Model 3の出荷を開始

Teslaは2017年7月Model 3 (上の写真) の出荷を開始した。Model 3はTeslaブランドの普及車として位置づけられる。価格は35,000ドルに設定され、富裕層だけでなく一般市民の手に届くレンジに降りてきた。Model 3は強化された運転支援機能「Enhanced Autopilot」を搭載している。更に、Model 3は自動運転に必要なハードウェア機器を搭載しており、ソフトウェアを更新するだけで完全自動運転車 (Level 5) になる。ただし、Teslaはこの機能を提供する時期については明らかにしていない。

Full Self-Driving Capability

Teslaが提供する完全自動運転機能は「Full Self-Driving Capability」と呼ばれる。最新モデルのModel SやModel 3には必要な機器が搭載されている。センサーとしてはカメラをクルマの周囲に8台搭載している。また、レーダーはフロントに1台、超音波センサーは12台搭載している。このようにTeslaはLidar (レーザーセンサー) は使わないでカメラがクルマの眼となる。センサーのデータは車載スパコン「Nvidia Drive PX2」 で処理される。

自動運転車とのインターフェイス

Teslaは自動運転できる場所は全米のほぼすべての地域と説明している。搭乗して目的地を告げるとクルマは最適なルートを算定しその場所まで自動で走行する (下の写真)。目的地を告げないで乗ると、クルマは搭乗者のカレンダーを参照し行き先を把握する。目的地に到着し降車するとクルマは駐車モードとなり自動で空きスペースを探し駐車する。乗車する時はスマホアプリでクルマを呼ぶと自動走行でその場所まで迎えに来る。

出典: Tesla

自動運転車時代のカーシェアリング

Teslaは自動運転車を繋ぐネットワーク「Tesla Network」を開発している。クルマが完全自動運転車となるとこのネットワークを介して車両を共有することができる。オーナーがクルマを使わない時はアプリでその旨を選択すると、クルマを他の利用者に貸し出すことができる。例えば、オーナーが休暇を取っている間、また、会社で働いている時間帯に、この機能を使うとクルマが他の利用者に貸し出されレンタル収入を得ることができる。クルマは自動運転で利用者のもとに走行するため貸し出しの手間はかからない。Tesla Networkは自動運転車時代のカーシェアリングのありかたを示している。

自動運転車にアップグレード

自動運転機能はEnhanced Autopilotの上に構築される。まずModel 3ベースモデルにEnhanced Autopilot機能を追加する必要があり価格は5,000ドルとなる。更に、ここから自動運転車にアップグレードする手順となり価格は3,000ドルとなる。つまり、8,000ドルの追加料金で自動運転機能を手に入れることができる。Teslaはこの機能の提供時期については明示していないが、現在、完全自動運転機能の試験を重ねていると述べている。また、政府からの認可が必要で自動運転車を運用できる地域はそれにより決まるとしている。

独自のAI技法「Tesla Vision」

Teslaは独自のAI技術を開発している。これは「Tesla Vision」と呼ばれDeep Neural Networkで構築される。Tesla Visionはクルマに搭載されたカメラの映像を入力し、これを解析することでクルマ周囲のオブジェクトを把握する。従来のComputer Visionから高度に進化した技術でTesla Visionはオブジェクトを漏れなく確実に特定する。安全性が求められるクルマでAIが視覚となり自動運転技術を支える。

自動運転車のデモ  

Tesla Visionを搭載した車両で自動運転のデモ走行が実施された (下の写真)。クルマはTesla本社をスタートしダウンタウンを通過し本社に戻ってくるルートで実施された。この間クルマが全工程を自動で走行した。Tesla Visionはカメラ画像を解析し、クルマ周囲のオブジェクト、経路上のオブジェクト、車線、信号機、道路標識などを識別する (下の写真、右側のウインドウ)。

出典: Tesla  

センサーの本命はLidar  

多種類のセンサーの中で一番幅広く採用されているのがLidarである。Lidarはレーザー光でクルマ周囲のオブジェクト(歩行者や車両など)を把握する。様々な条件で安定して計測できることからLidarがセンサーの本命となっている。一方、Lidarは形状が大きく価格が高く解像度が十分でない点が問題としてあげられる。屋根の上に搭載すると緊急自動車の赤色灯をほうふつさせデザイン面で問題がある。Lidarを半導体チップに実装し小型化した製品が登場しているが解像度が十分でなく自動運転車では使われていない。

Waymoは手堅い手法を取る    

Waymoはこの問題を解決するために独自の技術でLidarを開発している。Lidarを小型化し価格を従来モデルの1/10にし、更に、解像度を上げた。これに加え、Waymoは高機能カメラ (Vision Systemと呼ばれる) も開発しておりLidarと併用する。この方式はSensor Fusionと呼ばれ自動運転での標準技法になっている。不完全なセンサーであるがこれを複数個組み合わせて使いシステム全体でクリアな視覚を得る。Sensor Fusionが一番手堅い手法でWaymo以外に多くの企業が採用している。

Teslaのアプローチは革新的

これに対してTeslaはLidarを使わないでカメラだけで自動運転技術を達成する革新的な手法と言える。カメラなどコモディティ機器を使いDeep Learningの技量で安全な自動運転技術を達成する。ハードウェアではなくソフトウェアに軸足を置くシステムでイメージ認識技術Tesla Visionの開発が製品の成否を握る。

TeslaはAI開発体制を強化      

このためTeslaはAI開発体制を強化している。2017年6月、TeslaはDeep Learning研究の第一人者Andrej Karpathyを採用しAI・Autopilot部門のトップとした。また、Teslaは市販車が走行中に撮影するビデオ画像を収集することを始めた。Autopilot稼働中にカメラが撮影したビデオ画像がTeslaクラウドに送信される。Teslaは収集した画像を使い自動運転技術を検証する。Waymoは専用車両でビデオ画像を収集するが、Teslaは販売したクルマがテスト車両となり大規模にデータを収集することができる。AIの教育や試験で活用されここがTeslaの最大の強みとなる。

出典: Tesla  

Model 3のクールな機能 

Tesla Model 3は自動運転以外にもクールな機能が話題になっている。Model 3はカーキーは無く、スマホがBluetoothでドアと交信し鍵をアンロックする。スマホで搭乗できる仕組みとなる。ただし、緊急事態に備え専用カード (NFC Key Card) も提供される。コックピットには15インチディスプレイだけが備えてありここで全ての操作をする (上の写真)。必要最小限の機器を備えたデザインでクルマはどんどんシンプルになる。クルマはコンピュータに近づいている。

自動運転車時代が到来     

カメラだけで自動運転車を開発することが世界共通の目標になっているがTeslaがゴールに一番近い位置にいる。まだ達成できたわけではないが、市販車両から収集したデータでAI開発を加速させている。Lidarを使わないため価格は大幅に安くなりModel 3では43,000ドルで自動運転車を購入できる。EVの本格的な普及とともに自動運転車が一気に広がりそうな勢いを感じる。

中国で100万人のDNAを解析するプロジェクトが始まる、遺伝子と病気の関係をAIで解明

中国は世界のDNAシークエンシング工場としてヒトや動物や植物の遺伝子配列を解き明かしてきた。いま中国は遺伝子配列を読み取るだけでなく、その結果をAIで解析しライフサイエンスの分野で世界をリードしようとしている。米国では既にIBMやGoogleが取り組んでいる研究テーマであるが中国はこれを大規模に展開する。

出典: iCarbonX  

遺伝子データをAIで解析

その先端を走るのがShenzhen (中国・深圳) に拠点を置くベンチャー企業iCarbonXだ。馴染みが無い会社であるがiCarbonXは医療データを解析するAIプラットフォームを開発している。iCarbonXは中国において今後五年間で100万人の遺伝子データを収集する計画を明らかにした。収集した遺伝子データをAIで解析し病気や健康に関する様々な知見を得る。解析結果は専用アプリで消費者にフィードバックされ、健康な生活を送るためのアドバイスが示される。

個人データを大規模に低価格で収集

iCarbonXは2015年にJun Wang (上の写真) により創設された。WangはBGI (旧称Beijing Genomics Institute) のCEOの職を辞してiCarbonXを立ち上げた。BGIは世界最大規模のDNAシークエンシングセンターで遺伝子配列解明に寄与してきた。今ではライフサイエンスの先端技術を開発している。米国では既にIBMやGoogleが同様な研究を展開している。しかしiCarbonXは中国においては遺伝子情報を含む個人データを大規模に低価格で収集できると述べている。プライバシー保護に関する規制が緩やかなことがビジネスの優位点となる。

今年最も注目されているベンチャー企業

iCarbonXは今年最も注目されているベンチャー企業で累計で6億ドルの出資を受けている。企業時価総額は10億ドルを超え中国のエリートAI企業として評価されている。投資企業にTencentが含まれており2億ドルを出資している。Tencentは中国最大のソーシャルメディア企業でメッセージングサービス「WeChat」を運用している。TencentがiCarbonXに出資するのは奇異に感じるがその背景にはWeChatなどソーシャルメディアにログされている個人データを活用する狙いがある。個人のソーシャルデータを遺伝子データと組み合わせAIで解析することで分析精度が向上することが期待される。

遺伝子解析の限界

IBMを含む米国のAI企業は遺伝子解析の臨床試験を展開しているが期待していた成果が得られていない。遺伝子変異と病気発症の関係を研究しているが両者の間に強い相関関係を見つけることに苦慮している。つまり、病気を発症する遺伝子変異を突き止められないでいる。このためiCarbonXは従来の手法に加え被験者の生体検査を実施し精度の高い情報を得ることを計画している。

出典: iCarbonX

生体検査とは

具体的にはiCarbonXは被験者の生体検査として血液中のたんぱく質量の変化やメタボリズムを測定し、脳のイメージングデータを使う。またウエアラブルのバイオセンサーで血糖値をモニターする。更に、スマートトイレで尿と便に含まれるバイオマーカーを収集する。これら生体検査データと医療情報と遺伝子情報を組み合わせAIで解析することで健康管理に役立つ情報を抽出する。

専用アプリ「Meum」

iCarbonXのサービスは専用アプリ「Meum」から利用する (上の写真)。消費者はMeumに食事内容やエクササイズに関する情報を入力する。更に、身体情報やバイタルサインを入力する。AIはこれら入力情報と上述の遺伝子情報と生体情報を解析し、アプリは健康や病気に関連する情報を表示する。具体的には食事の内容、就寝時間、必要なエクササイズなど健康な生活を送るためのアドバイスを表示する。

ヘルスケア関連企業七社と提携

iCarbonXはヘルスケア関連企業七社と提携しこれら企業の技術を活用する (下の写真、米国企業を中心に構成されている)。これは「Digital Life Alliance」と呼ばれ医療データを遺伝子解析と結びつけ健康に関する新たな知見を得るための企業連合として機能する。具体的には提携企業は個人の健康や病気の状態を特定する指標を提供する。iCarbonXはこれら指標を活用してビッグデータからノイズを排除し高精度で有益な情報を検知できるシステムを開発する。

出典: iCarbonX  

ライフサイエンス先進国に転身  

Googleのライフサイエンス部門Verilyは健康な人体を定義する「Baseline Project」をスタートし1万人の参加者から個人の身体情報と医療情報を収集する。収集した情報と遺伝子情報をAIで解析し健康な人体を把握する。これに対しiCarbonXは100万人規模で実証実験を展開する。遺伝子配列などデータ量が格段に大きい情報を解析するためにはAIアルゴリズムの教育で大量のデータを必要とする。人口が多く遺伝子情報が使われることに対する抵抗感が柔らかい中国はライフサイエンスで大きく前進することが予想される。中国は世界のDNAシークエンシング工場からライフサイエンス先進国に転身しようとしている。

IBM Watsonの実力が問われている、 独自AIアーキテクチャはDeep Learningに勝てるのか

米国でIBM Watsonの実力を疑問視する声が出ている。大学病院との共同プロジェクトが失敗に終わりWatsonの機能を再評価する機運が高まっている。システムインテグレーションの観点からはWatsonを教育するために大規模なデータを必要とする。アーキテクチャの観点からはWatsonはDeep LearningやGPUを使わないでIBM独自の手法でAIを実装しCPUで実行する。Deep Learningが高度に進化し少ないデータでシステムを教育できる中、Watsonは約束通りの性能を出せるのか市場の関心が集まっている。

出典: IBM  

ライフサイエンスの分野で共同研究

IBMはWatson (上の写真) をライフサイエンスの分野で利用しガン治療で効果を上げると表明している。IBMはテキサス州立大学病院 (University of Texas MD Anderson Cancer Center) と共同でWatsonを使ったガン治療の研究を進めてきた。IBMは白血病を皮切りにガンを撲滅するMoon ShotプロジェクトでWatsonを展開している。Watsonが患者の医療データや医学文献を解析し医師に最適な治療法を示すことを目標としている。

プロジェクトは失敗

しかし2017年2月、テキサス州立大学病院はこのプロジェクトを中止すると発表した。大学はプロジェクト中止の理由は明らかにしていないが、4年間の研究開発で患者治療のためのツールを開発することができなかったと報じられている。プロジェクト管理の不備が原因とされるが、Watsonの技術的な問題もクローズアップされている。更に、IBMへの支払金額は3900万ドルで当初の予算を大幅に上回りシステム運用に費用がかかり過ぎることも要因とされている。

Watson教育のプロセスは複雑

Watsonの教育では大量の医療データを必要とする。このプロセスはDeep Learning (人間の脳を模した構造のネットワーク) の教育と同じで、答えが分かっているデータを入力しアルゴリズムを最適化する。しかし、WatsonのケースではDeep Learningと比べこのプロセスが格段に複雑になる。Deep Learningでは患部の写真を入力しアルゴリズムがガンであるかどうかを判定する。Watsonのケースでは患者のDNAを入力すると医療文献を参照し最適ながん治療方法を見つける (下の写真)。判定プロセスが格段に複雑になるだけでなく、そもそも遺伝子変異と病気の関係に関する教育データが存在しない。

出典: IBM

IBMは企業買収でデータを入手

このためIBMは新興企業を買収しWatson教育のための医療データを入手している。企業買収を繰り返しIBMは大規模な医療データベースを構築している。Explorysは医療データを保有し解析サービスをクラウドで提供しているベンチャー企業である。IBMはExplorysを買収し5000万人の患者データを入手し3150億件の医療データを得た。IBMはこれら医療データでWatsonを教育し患者治療や医療技術開発に役立てている。

Watsonのアーキテクチャ

Watsonを教育するプロセスが複雑な理由はそのアーキテクチャに起因する。Watsonの技法はAIの中でMachine Learningとして区分される。人間の脳を模したDeep Learningの手法とは大きく異なる。Watsonのこの技法は「DeepQA」と呼ばれ、これがクイズ番組Jeopardyで人間のチャンピオン二人を破る基礎技術となった。

DeepQAの構造

DeepQAは質問から答えを検出するシステムであるがGoogleのような検索エンジンとは構造が大きく異なる。DeepQAは質問の意味を解し、「Hypothesis」(仮説・解答候補) を生成し、仮説が正しいかどうかを評価する「Scoring」から構成される (下の写真)。仮説の生成やその評価には収集した大量のデータを使用する。このスレッドを大量に生成し大規模並列に稼働させる。一つの質問に対してDeepQAは100万の評価スコアーを生成する。ここから最終回答を選定するプロセスでMachine Learningが使われる。DeepQAは単純な検索ではなく、解答候補を評価して信頼度の高い解を導く手法に特徴がある。

出典: IBM

Deep Learningが高度に進化  

Watsonは自然言語での複雑な質問を理解し、数多くの情報源を参照し、答えの候補を生成し、そこから正しい解を高精度で選ぶことができる。しかし、Watsonが開発されて以来Deep Learningが高度に進化している。画像認識、音声認識、音声生成、機械翻訳などに優れ、自動運転車やデジタルヘルスで活用されている。Deep Learningが普及することでWatsonの機能が相対的に地盤沈下している。

WatsonはDeep Learning機能を採用       

このためIBMはDeep Learningを採用しWatsonの機能を強化している。IBMはクラウドBlueMixにDeep Learningによる画像認識と音声認識機能を追加した。またIBMはベンチャー企業AlchemyAPIを買収した。AlchemyAPIはDeep Learningベースのテキスト解析とイメージの解析を提供しておりWatsonはこれらの機能を搭載している。更に、IBMはPowerAI Platformを投入した。GPUを基盤とする処理システムでここでDeep Learningフレームワークを提供する。

Watsonの将来    

WatsonはDeep Learning技法が登場する前に開発されたシステムであるが、IBMは最新技法をシステムに組み込み定常的に機能を強化している。また、ヘルスケア関連では企業買収を重ねWatsonの教育で活用している。テキサス州立大学病院のプロジェクトは失敗に終わったが、ガン診断や治療の研究で米国の主要病院と提携し共同研究を進めている。Watsonはガン治療で大きな効果を上げると期待されている。ただ、研究開発はIBMが示した当初のスケジュールから大きく遅れておりAIでガンを撲滅する技術の難しさを再認識させられる。