月別アーカイブ: 2018年9月

血液一滴でガンを超早期に検知する技術、 臨床試験で好成績をマーク

血液検査でガンを早期に発見する技術「Liquid Biopsy」の技術開発が進み実用段階に入ってきた。ガンを早期に発見できると生存率が格段に向上する。後期ステージに比べ生存率が5倍から10倍向上し、ガンは治療できる病気となる。この技術の背後にはDeep Learningがあり、アルゴリズムがガンのシグナルを検知する。

出典: VentureClef

会社概要

GrailはMenlo Park(カリフォルニア州)に拠点を置くベンチャー企業で、Liquid Biopsy技術で業界のトップを走る。Grailは高精度のDNAシークエンシング技術を使い、血液中を流れる遺伝子の断片を検出する。検知した遺伝子断片をAIで解析し、それがガンであるかどうかを判定する。血液中を流れるガン遺伝子断片の数は希少で、また、その種類は膨大で、検知に高度な技術を要す。シークエンシングではIlluminaのDeep Sequencingが、ガン判定のプロセスではDeep Learningの手法が使われる。

ベンチャーキャピタル

GrailはIlluminaからスピオンオフし独立企業として運営している。ベンチャーキャピタルから注目され、大規模な投資を受けている。また、Bill GatesやJeff Bezosが出資していることでも話題となっている。今年Grailは香港に拠点を置くベンチャーキャピタルから大規模な投資を受け、この資金を元にアジアでの事業展開を進めている。Grailは香港で今年から、咽頭ガン(nasopharyngeal cancer)検知の医療サービスを始める。

大規模な臨床試験

これに先立ち、Grailは開発した技術を検証するために、大規模な臨床試験を実施した。臨床試験の目的は、大規模データを使いAIアルゴリズムを教育することと、教育したアルゴリズムが正しくガンを判定できることを確認することにある。実際に、血液サンプルからガン遺伝子の組織を検出し、高精度でガンをスクリーニングできるかを検証した。

ガンのシグナル

Grailは15,000人の被験者を対象に臨床試験を実施した。このうち70%がガン患者で、被験者から血液サンプルを採取し、cfDNAの手法でDNA断片を解析する(後述)。DNA断片の特徴を抽出し、ガンであるシグナルを把握する。同時に、ガンでないシグナルも把握する。これがガンを特定するデータベースとなり、製品開発の基礎技術となる。

臨床試験の結果

臨床試験では19種類のガンについて検知精度(Sensitivity)が測定された。検知精度は特異性(Specificity)が98%のポイントで測定された。この中で肺ガンについて、前期ステージのガンを51%の精度で検知できた。これは業界トップレベルの検知精度で、Liquid Biopsyの実用化が視界に入ってきた。一方、製品として提供するには、更に精度を向上させる必要があり、今後も開発は続く。

出典: Sysmex  

解析手法

Grailはcell-free DNA (cfDNA) と呼ばれる手法を使っている。これは血液中のがん細胞遺伝子(ctDNA、circulating tumor DNA、上の写真、赤色のらせん構造)を検知することでガンを特定する手法である。ctDNAはガン細胞から血管中にリリースされたDNAで、これを検出してガン発症をつかむ。膨大な数のDNA断片の中から数少ないctDNAを検出するために大規模データをDeep Learningの技法で解析する。

Deep Sequencing

血液サンプルはDeep Sequencingと呼ばれる高度なシークエンシング技術で処理される。シークエンサーはIlluminaのNGS (Next-Generation Sequencing、下の写真) が使われる。シークエンシングされたデータの量は膨大でこれをAIで解析する。Grailは大規模データを取り扱うIT企業でもある。

出典: Illumina  

事業開始時期

膨大な数のcfDNAからガン細胞から排出されたctDNAを検出するため、Deep Sequencingの手法でシークエンシングする。このため検査コストは高く一回の検査で1万ドル近くかかる。このためGrailは保険会社などと交渉し、スクリーニング試験に保険を適用することを計画している。Grailは2018年から香港で事業を開始するが、米国での事業時期は明らかにしていない。

ガンによる病死を激減させる

GrailはLiquid Biopsy研究でトップを走っている。Grailの特徴は血液検査で異なる種類のガンを検知でき、初期ステージのガンの検知精度が高いこと。市場に出ているLiquid Biopsyは特定のガン(大腸がん等)に特化し、後期ステージのガンの検知で使われる。Grailは初期ステージのガン検知を目指し、スクリーニング技術を一般に幅広く普及させ、ガンによる病死を激減させることを目標としている。

Googleは家庭向けロボットを開発!? 先行するAmazonを追随する

Amazonは家庭向けロボットを開発していると噂されている。Googleはこれに対抗して、同じく、家庭向けロボットの開発に乗り出した。Googleは五年前、ベンチャー企業を買収してロボット開発を始めたが、このプロジェクトは頓挫した。GoogleはAmazonに刺激され、ロボット開発を再開し、高度なAIを武器にインテリジェントなシステムを開発している。

出典: Dmitry Kalashnikov et al.

ロボット開発の経緯

Googleは2013年、プロジェクト「Replicant」を発足し、ロボット開発に乗り出した。ロボット開発は「X」(当時のGoogle X)が担い、Andy Rubinが指揮を取っていた。Rubinは「Android Inc.」創業者で、2005年にGoogleが買収し、スマホ事業の基礎を築いた。Rubinはインテリジェント・マシンに興味を持っており、ドイツの製造会社でロボットエンジニアとして働いていた。

ベンチャー企業買収

Googleはロボット企業8社を相次いで買収した。最大規模の買収はBoston Dynamicsで、同社は、軍事支援ロボットとヒューマノイドを開発していた。日本企業でヒューマノイドを開発しているSchaftも買収された。また、コンピュータビジョンをロボットに応用したIndustrial Perceptionや次世代ロボットアームを開発していたRedwood Roboticsも含まれ、Googleはロボット市場に本格的に参入すると見られていた。

開発を中止

しかし、Googleは突然ロボット開発を中止した。Andy Rubinは2014年にGoogleを離れ、その直後、Replicantは活動を停止した。Googleは買収したBoston Dynamicsの買い手を探していたが、2017年、SoftBankが同社を買収することで合意した。これに先立ち、SoftBankは2012年にAldebaran Roboticsを買収し、ロボット事業を開始した。

中止の理由

Googleがロボット開発を中止した理由はロボットを事業化するのが難しいと判断したため。ロボットは配送センターや組み立て工場使われる工業ロボットが中心で、一般社会で使われるサービスロボットの開発には時間がかかる。Rubinは2020年頃に製品を投入する予定でいたが、Google幹部は短期間で成果を求めており、この意識の相違が中止に繋がった。

ロボット基礎研究

Replicant中止の後も、Googleは高度なAIをロボットに適用する研究を進めてきた。Googleはコモディティハードウェアに最新のAI技法を取り込み、インテリジェントなロボットを開発している。具体的には、Deep LearningとReinforcement Learningをロボットの頭脳として使う。Googleのロボット研究施設は「Arm Farm」と呼ばれ(先頭の写真)、10台超のロボットアームが並列に稼働しスキルを学ぶ。

AI研究内容

研究ではロボットアームでドアのノブを回し、それを手間に引いてドアを開けるタスクが実行された (下の写真)。それぞれのロボットはニューラルネットワークのコピーを搭載し、Reinforcement Learningの手法で教育された。行動(Action)を実行するとき、与えられた環境(Sate)で値(Value)を算定し、ロボットはValueを最大にする方向でActionを決定する。ロボットがタスクを実行するときにノイズを加え、それぞれのロボットは異なる環境でタスクを実行する環境を構築する。

出典: Google  

ロボットクラウド

これらのデータはクラウドに収集されネットワークを最適化する。アルゴリズムは収集されたデータからうまく処理できたケースとそうでないケースを検証し、Actionとタスク完遂の関係を把握し、ネットワークを改良していく。このサイクルを繰り返し、ロボットの性能を向上する。ロボットは数時間の教育でドアを開けることができるようになった。

最新のAI研究

Googleは最新のAI技法「QT-Opt(Q-function Targets via Optimization)」を開発した。Arm FarmにQT-Optを搭載するとオブジェクトをつかむ(Grasp)精度が飛躍的に向上する。QT-Optとは分散型Q-Learning(Reinforcement Learningの一つのモデル)で、連続したアクション(Continuous Action)を安定的に処理できる点に特徴がある。

ロボットでモノをつかむ

ロボットはカメラのRGB画像からオブジェクトを把握し、アーム先端のグリップを開きそれをつかむ。ロボットが複雑な形状のオブジェクトを正確につかむためには高度な技法が要求される。これは「Picking Challenge」と呼ばれ、多くの企業や研究機関がこのテーマに挑戦している。いかに正確にかつ高速にモノをつかめるかがロボットの商品価値を決める。

アルゴリズム教育

アルゴリズムはカメラの画像を読み込み、ロボットアームの動きと、グリッパーの開閉を出力する(下の写真、左側)。最初にオフラインでアルゴリズムを教育し、次に、ロボットを稼働させオンラインで教育する。オフライン教育では1000種類のオブジェクトが使われ(下の写真、右側)、ロボットはこれらを580,000回つかむ試験が実施された。完成したアルゴリズムを使い、ロボットの性能を検証したところ、オブジェクトをつかむ成功率は96%と好成績をマークした。

出典: Dmitry Kalashnikov et al.  

研究の意義

アルゴリズムはオブジェクトを正確に掴むことができるほか、操作をインテリジェントに理解する。アルゴリズムは上手く掴めなかったときには、異なる掴み方を自動で学習する。また、オブジェクトを掴む手法を長期レンジで把握する。(下の写真上段:オブジェクトが纏まっているときはそれを崩す(Singulation)ことを自律的に学習する。中段:立っているローソクはつかみにくいのでそれを倒して実行する。下段:軽くてつかみにくいボールはトレイの端に寄せてつかむ。上の写真右側:煩雑な環境でもオブジェクトをつかむことができる。)

出典: Dmitry Kalashnikov et al.  

実社会への応用

Googleのロボット開発はGoogle BrainとXで進められている。GoogleのArm Farmで開発された技術は、ロボットアームだけでなく、ロボットの基礎技術として応用される。実社会には様々な形状のオブジェクトがあり、それに触れた時、オブジェクトの物理挙動も異なる。ロボットを実社会で使うためには多くの課題を解決する必要があるが、これらの研究がその手掛かりとなる。

家庭向けのロボット

Googleは家庭向けロボットの開発を進めていると噂されている。AIスピーカー「Google Home」は人気商品で、多くの家庭で使われている。GoogleはAIスピーカーを駆動型にしたロボットを開発しているとみられている。ロボットは家の中を自律的に走行し、タスクを実行することとなる。

Amazonに対抗

Amazonは「Vesta」という名前でロボットを開発している。これはAmazonの人気商品Amazon Echoを駆動型にしたモデルである。GoogleはVestaに刺激を受け、ロボット開発を再開したとみられる。AIスピーカー市場ではAmazon EchoとGoogle Homeが競い合っているが、今度はロボットで両社が鎬を削る。両社ともロボット技術はまだまだ未成熟であるが、商品化に向けての開発が進み、大きなブレークスルーが期待される。

Drive.aiは未成熟なAIで安全な自動運転車を開発、テキサス州で実証試験を展開中

Drive.aiはシリコンバレーに拠点を置くベンチャー企業で、社名が示す通り、AIを基軸に自動運転技術を開発している。スタンフォード大学人工知能研究所発のベンチャー企業で、元所長Andrew Ngが役員として経営に参画している。Drive.aiはステルスモードでの開発を終え、2018年7月からテキサス州で実証実験を開始した。

出典: Drive.ai

開発コンセプト

当初、Drive.aiはAIをフル実装した”AI Car”の開発を目指していたが、AIの限界を把握し、AIの弱点を補完するクルマを開発した。業界最先端のAIとDeep Learning技法を実装しているが、AIだけでは安全なクルマを開発できない。このため、クルマと人間とのインターフェイスを工夫した安全なクルマをデザインした。

テクノロジー

自動運転車はミニバン「Nissan NV200」にセンサー(Lidar、カメラ、レーダー)を搭載した構成(上の写真)となる。Drive.aiはオープンソースを最大限に活用して自動運転ソフトウェアを開発した。ソフトウェアは「Robot Operating System」 (ROS、ロボットや自動運転車制御ソフト)をベースに構築され、画像認識システムは「Director」を使っている。Directorとはロボット向けのコンピュータビジョン開発環境で、DARPA Robotics Challengeでマサチューセッツ工科大学により開発された。

実証試験

Drive.aiはテキサス州フリスコ市と提携して、自動運転車の試験走行を進めている。街中のオフィス街で、事前に定めた経路を走行する自動運転シャトルとして運行している。Drive.aiはクルマが安全に走行するだけでなく、周りのクルマや歩行者も安全に移動できるよう工夫を凝らしている。自動運転車は人間とは違い特異な挙動をするため、クルマは目立つようデザインされ、周囲に注意を喚起している。同時に、セミナーなどを通じて、地域住人に自動運転車について教育を実施している。

インターフェイス

自動運転車はソーシャルインタラクション(社会とのコミュニケーション)の問題を抱えている。ドライバーは他のドライバーや歩行者と視線を交わし意図を伝達する。自動運転車は視線を交わす代わりに、車両前後にディスプレイを搭載し、クルマの意思を表示する。例えば、横断歩道では「Waiting for You to Cross」と表示し(下の写真)、歩行者が横断するために停止していることを示す。

出典: Drive.ai

遠隔監視

自動運転車は自律的に走行するが、監視センターで運行状態をモニターする。クルマは自動運転中に問題が発生すると、監視センターに連絡し、人間の支援を仰ぐ。これを「Tele-Choice」と呼び、自動で運行できない際は、クルマは安全な場所に停車し、オペレーターが走行方法を指示する。AIはこれらの情報を学習し、アルゴリズムは運転テクニックを向上させる。

オブジェクト認識

クルマは周囲のオブジェクトを把握し、経路を選択し、自動で走行する。Lidarで捉えたイメージは3Dポイントクラウドで、また、カメラで捉えたイメージはビデオ画像として車内のディスプレイに表示される(下の写真)。乗客はこの画面で、クルマは周囲をどう理解しているかが分かり、安心して乗ることができる。

出典: Drive.ai  

走行データを解析

走行状態を可視化したデータはAIソフトウェア開発や教育でも利用される。走行データは人間による運転とAIによる運転で収集される。これらのデータを早送りしたり、巻き戻したりしながら、走行状態を検証する。問題が発生すると可視化データで走行状態を再生し、原因を究明する手順となる。

自動運転シャトル利用法

クルマを利用する時は、スマホアプリで配車をリクエストし、指定された場所で乗車する。クルマに乗りドアを閉めて、スタートボタンを押すと発進する。クルマは指定されたコースを走行し、目的地まで乗客を運ぶ。クルマが走行するルートは事前に3Dマップが製作され、これをベースに自動走行する。

ロードマップ

当初、Drive.aiは高価なLidarを使わないで、低価格な光学カメラを使った自動運転車の開発を進めていた。カメラで撮影したイメージをDeep Learningの技法で処理し、オブジェクトを識別する。また、オブジェクト認識からクルマの経路計算までをAIで実装する予定であった。今回の発表では、高度なAIを実装したAI Carは登場しなかったが、背後で開発は継続していると思われる。次はどんなクルマが登場するのか、注視していく必要がある。

AIがeスポーツにデビュー、5台のAIが5人の人間と戦闘ゲームで対戦

AIは囲碁のチャンピオンを破り、次の目標をeスポーツに定め、開発が進んでいる。eスポーツとはビデオゲームを使った対戦で、スポーツのように試合が実況中継される。いまeスポーツファンの数が急増し、日本のプロ野球に匹敵する規模のビジネスとなっている。OpenAIは「Five」というAIを開発し、eスポーツのトップチームと対戦した。

出典: OpenAI

OpenAIとは

OpenAIとはAI研究の非営利団体で、Elon Muskらにより2015年に設立された。Muskらが10億ドルを拠出し、最初の数年間でその一部が使われる。OpenAIは他の研究機関と連携し、特許や研究結果を公開し、オープンな手法でAI開発を進めている。高度なAIが社会及ぼす危険性を回避するため、安全なAIを開発する。研究テーマの中心は深層強化学習(Deep Reinforcement Learning)で、安全なインテリジェンスの開発を目指す。

ゲームをプレーする「Five」

OpenAIはビデオゲーム「Dota 2」をプレーするAI「Five」を開発した。Dota 2とは、五人のチームが森の中で戦闘を繰り返し、陣取り争いをするゲーム (上の写真)。Fiveは五人の人間を五セットのAIで置き換え、AI同士が連携しながらプレーする。Fiveは国際ゲームイベントで人間のトップチームと対戦し好成績を収めた。

Dota2とは

Dota 2は米国Valve社が開発したビデオゲームで、MOBA(Multiplayer Online Battle Arena)に区分される。MOBAとは、チームメンバーがキャラクターを操作し、相手のチームと対戦する形式を指す。Dota2では、二つのチーム(「Radiant」と「Dire」)が対戦し、相手のタワー「Ancient」を崩壊させたほうが勝ちとなる。チームは五人で構成され、それぞれがキャラクター(Heroと呼ばれる、下の写真、その一部)を操作し、相手のキャラクターを攻撃する。対戦では戦略やチームプレーが求められ、AIにとって極めて複雑なゲームとなる。

eスポーツとは

Dota 2はeスポーツ(eSports)で最も人気のあるゲーム。eスポーツとはビデオゲームを使った対戦で、有名チームの試合が放映され、ファンがそれを観戦する構造となる。eスポーツファンの数が急増し、2018年には2億人を超え、2021年には3億人になると予想されている。eスポーツの収入は2018年は$905.6Mと予想され、巨大ビジネスとなっている。(ゲームの対戦をスポーツと呼ぶには違和感を感じる人も多いが、実際にプレーを見ると激しい格闘技で、デジタル時代のプロレスと言える。)

出典: Dota2 Wiki

The International

eスポーツの最高峰がDota 2のワールドカップともいえる「The International」(下の写真)。今年はカナダ・バンクーバーで開催され、18チームがトーナメント形式で対戦した。特設会場のステージで競技が行われ、ゲーム画面が大型モニターに映し出される。今年は、欧州チーム「OG」が中国チーム「PSG.LGD」を3対2で破り優勝。対戦の模様はYouTubeなどで中継され、観戦者数は6679万人に上った。これはゴルフ「Masters」の観戦者数に匹敵し、世界中で人気が広まっている。

Fiveの対戦結果

The Internationalという晴れの舞台で、Fiveはエグジビションゲームとして、プロチームと対戦した。Fiveはブラジルチーム「paiN Gaming」及び中国チーム「rOtK」と対戦したが、どちらも1対0で敗戦した。paiN Gamingとの対戦で、序盤は人間チームが優勢であったが、中盤はAIチームが形勢を逆転した。しかし、終盤で人間チームの戦略的な攻撃をうけ敗戦を期した。人間の技には及ばなかったが、対戦時間は51分と長く(平均は45分)、接戦の末の敗戦となった。

出典: Dota2 Wiki  

Fiveの概要

Fiveはニューラルネットワーク(Long Short Term Memory、LSTM)で構成され、深層強化学習の手法で教育された。LSTMはRecurrent Neural Network方式のネットワークで、記憶機能があり、長期間にわたる相関関係を処理するのに適している。アルゴリズムはAI同士の対戦を通じて、Dota2のプレーの仕方を学習した。

ゲームをプレーする理由

OpenAIがDota 2をプレーするAIを開発する理由は、ゲーム環境が実社会によく似ているため。Dota 2は、森林の中で敵味方が入り乱れ、攻撃と防御を繰り返す。勝つためには作戦を立て、AI同士のチームワークが要求される。Fiveはゲームという仮想社会で技術を習得するが、ここで培った技法は実社会に応用できる。ロボットや自動運転車が家庭や街中で稼働するとき、Fiveで習得した技術が役に立つ。

囲碁の次はeスポーツ

Google DeepMindはAlphaGoで囲碁のチャンピオンを破り世界を驚かせた。囲碁は複雑なゲームであるが、Dota 2はそれよりはるかに複雑なゲームとなる。囲碁は150手ほどで勝敗が決まるが、Dota 2は2万手と長い。また、囲碁は正規化された空間でプレーするが、Dota2は人間社会を模したカオスな環境で実行される。囲碁を制したAIは、次はeスポーツでトップチームと対戦し、勝利することを目標に据えている。