月別アーカイブ: 2017年9月

AIのブラックボックスを開き自動運転のメカニズムを解明、信頼できる完全自動運転車の研究が進む

我々はAIを信用していいのかという大きな命題に直面している。AI Carは車載カメラの画像から特徴量を高精度で検出し、人間のドライバーよりはるかに安全に走行する。しかし、AIの中身はブラックボックスで、運転テクニックは開発者ではなくAI Carだけが知っている。我々はなぜAI Carが安全に走行できるのかが分からない。この問題を解決するため、AIのブラックボックスを開きそのロジックを解明する研究が進んでいる。

出典: Nvidia  

NvidiaのAI Car

AI Carとは入力 (カメラ画像の読み込み) から出力 (ステアリング操作) まですべてAIで実行する完全自動運転車を指す。NvidiaがAI Carの開発に力を注いでおり、そのプロトタイプ「BB8」 (上の写真) を開発し市街地で走行試験を実施した。クルマはハイウェーや一般道路を完全自動で運転する。クルマは道路というコンセプトを理解でき、車線が無くても人間のように運転できる。

AIが人間の運転を見て学ぶ

BB8は人間の運転を見てドライブテクニックを学ぶ。BB8はニューラルネットワーク「PilotNet」を搭載し、車載カメラの画像とそれに対応する運転手のハンドル操作を読み込み、ネットワークが運転技術を学習する。学習したPilotNetはカメラの画像を見るだけでステアリング操作ができるようになる。エンジニアが自動運転のためのルールをプログラムする必要はなく、PilotNetが人間のように運転テクニックを短時間で学ぶ。

AIが学習した内容を出力する研究

しかし、問題はPilotNetが学習したドライブテクニックを人間が理解できないことだ。なぜBB8は車線が描かれていない道路を安全に走れるのかそのロジックが分からない。このためNvidiaはPilotNetが学習した内容を出力するシステムの研究を始めた。AIが学習したことを可視化する研究である。具体的には、PilotNetはどこに着目して運転しているのかを出力する技術を開発した。この研究成果は「Explaining How a Deep Neural Network Trained with End-to-End Learning Steers a Car」として公開された。

BB8が着目している部分

研究ではBB8が運転する際に着目している部分を実際のカメラ画像にオーバーレイして表示した (下の写真、緑色で表示されている部分)。これを見るとPilotNetは他のクルマの下半分に着目していることが分かる (下の写真、上段)。更に、路面に描かれている実線(路肩)や破線(車線)にも着目している。一方、横方向に引かれている線(横断歩道)には注意を払っていない。

出典: Urs Muller et al.

AIが人間のように学習する

車線が描かれていない道路ではPilotNetは駐車しているクルマの側面に着目している (上の写真、中段)。AIはこれを道路の端と理解していることが伺える。砂利道の場合ではPilotNetは道路と草地の境界部分に着目している (上の写真、下段)。人間と同じ考え方で道路の部分を把握していることが読み取れる。これらはエンジニアが運転ルールとしてコーディングしたのではなく、PilotNetが運転の練習を通じで独自で学んだものである。

アルゴリズムを人間が視覚的に理解

PilotNetが着目している部分を見ることでブラックボックスであったアルゴリズムを人間が視覚的に理解できるようになった。PilotNetは何を規準に運転しているかが分かり、システム開発が大きく進むことになる。また、問題が発生すればその原因を表示できトラブルシューティングの効率も上がる。

研究は緒に就いたばかり

しかし、研究はこれで完成というわけではない。この研究はPilotNetの各レイヤの情報を出力したもので、ネットワークが判断基準を説明したわけではない。人間のドライバーであれば、例えば急ハンドルをきるとその理由を言葉で説明するが、PilotNetはまだその段階までには到達していない。更に、これから自動運転車の運転倫理など様々な規約が制定されることになる。AI Carは定められた運行規約にどういう方式で準拠するのかも問われる。AI Carのブラックボックスを解明する研究は緒に就いたばかりである。

Apple Face IDの発表で顔認証技術がブレークする兆し、同時にAIを悪用した攻撃への対応が求められる

AppleはiPhone Xで顔認証技術「Face ID」を発表した。カメラに顔を向けるだけで認証でき、安全性と手軽さが評価され顔認証サービスが普及する勢いとなってきた。スマートフォンや金融サービスで顔認証の導入が一気に進む可能性がある。同時に、顔認証技術はAIを悪用した高度な攻撃に対する備えが求められている。

出典: Apple  

顔認証技術は早くから登場していたが

顔認証技術は1960年代に登場した技術であるが、その精度に問題があり特殊な分野に限定して使われ、一般に普及することは無かった。近年では、AIの進化により顔認証技術の精度が向上し、ベンチャー企業が製品化を進めオンラインバンキングなどで試験的な導入が始まった。同時に、スマートフォンでの展開も始まり、SamsungはハイエンドモデルGalaxy Note 8で顔認証技術を導入した。

Samsung Galaxy Note8の顔認証技術

Galaxy Note 8は2017年9月に出荷されたが、発売直後に顔認証機能が破られる事件が発生した。写真をGalaxy Note 8にかざすとロック画面が解除されることが判明した。利用者は別のスマホで自身の顔を撮影し、それをGalaxy Note 8の顔認証画面に向けるとロック画面が解除さる。Samsungは見解を発表していないが、製品説明を読むと「顔認証は指紋認証やPINなどに比べ安全性が低い」と記載されている。Galaxy Note 8の顔認証機能はセキュリティではなく利便性を重視したデザインとなっている。

Apple Face IDのメカニズム

これに対してApple Face IDはセキュリティ機能を格段に強化し安全に使えるデザインとなっている。Face IDは3Dで顔を識別するため写真や動画で認証されることは無い。iPhone Xは「TrueDepth Camera」と呼ばれる特殊なカメラを搭載しセンサーが顔を3Dで認識する。ここに内蔵されているプロジェクター (Dot Projector、下の写真右端のデバイス) から3万個のドットが顔に照射され、これを赤外線カメラ (Infrared Camera、下の写真左端のデバイス) で読み込み顔の3Dマップ (先頭の写真) を作成する。この情報がプロセッサのストレージ (Secure Enclave) に暗号化して格納される。

出典: Apple  

顔認証精度が高い理由

Face IDを使うときは光源 (Flood Illuminator、上の写真左から二番目のデバイス) から赤外線が照射され、反射波を赤外線カメラで読み込み、登録した顔のマップと比較して認証を実行する。光源が赤外線であるため外部の光の条件に関わらず、暗がりの中でも正確に認証できる。また、髪を伸ばしたり眼鏡をかけると登録した顔のイメージと異なり本人確認が難しくなる。このためAppleは機械学習 (Machine Learning) の手法を使ってアルゴリズムを教育し両者を正確に比較判定できる技術を開発した。同時に、顔認証への攻撃では映画で登場するフェイスマスクが使われる。本人の顔を3Dでコピーしこれをフェイスマスクで再構築する。Appleは実際にハリウッドでフェイスマスクを作りFace IDの認証精度をベンチマークしたと述べている。この背後にも機械学習の手法が使われており人間の顔とフェイスマスクを見分けることができる。

顔写真から顔の仮想現実を生成

顔認証に関して気になる研究成果が報告されている。昨年、University of North Carolinaの研究者はFacebookやInstagramに掲載されている写真から顔を3Dで構築する手法を公開した (下の写真)。対象者の顔写真を複数枚集め、これらの写真から顔の構造を3Dで再構築する。3D構造に肌の色や質感を加え、更に、様々な表情を追加しVRとしてディスプレイに表示する。

出典: Yi Xu et al.

生成した顔のVRが顔認証を破る

研究論文は生成した顔のVRを顔認証システムに入力し認証に成功したと報告している。市販されている五つの顔認証アプリで試験が実施された。顔認証アプリ名と認証成功率は次の通り;KeyLemon (85%), Mobius (80%), True Key (70%), BioID (55%), 1U App (0%)。これらの顔認証アプリはスマホのセキュリティで使われており、1U Appを除いて四つのアプリで認証技術が破られた。この論文は顔認証のメカニズムを改善する必要があると訴えている。

顔の3Dイメージを3Dプリンターで生成

顔のVRはFace IDで試験されていないが、TrueDepth Cameraは顔を3Dで検知きるため、iPhone Xに不正にアクセスすることはできないと思われる。一方、顔のVRを3Dプリンターに出力すると状況は変わるかもしれない。顔の3Dイメージを3Dプリンターで生成して顔認証システムを試験する研究が進んでいる。Security Research Labsはドイツ・ベルリンに拠点を置く企業でセキュリティ研究所として位置づけられる。同社は被験者の顔型を取りMicrosoftの顔認証システム「Hello」で認証を受けることに成功した。iPhone Xが発売になるとSecurity Research Labs などがFace IDの安全性を検証する作業を始めることになる。

1枚の写真から顔を3Dで構成

英国の大学University of Nottingham とKingston Universityの研究者は1枚の顔写真からAIを使って顔を3Dで構成する技術を発表した。Computer Visionにとって顔を3Dで把握するのは非常に難しい技術となる。上述の通り、数多くの写真を入力しこれらから3Dイメージを再構築するのが一般的な手法となっている。これに対し、CNN (イメージを判定するネットワーク) を顔写真と本人の3Dイメージで教育することで、アルゴリズムは1枚の顔写真からその3Dイメージを再構築できるようになった。(下の写真、Alan Turingの写真 (左側) を入力するとアルゴリズムは3Dイメージ (右側) を生成する。) 研究成果を使って顔認証システムの試験が実施されたわけではないが、今後はAIを悪用した認証システムへの攻撃が急増することを示している。iPhone Xが発売になるとFace IDのハッキングレースが始まりAppleは様々な挑戦を受けることになる。

出典: Aaron S. Jackson et al.

バイオメトリック認証のトレンド

バイオメトリック認証の中で顔認証が注目されているのは訳がある。声による認証はコールセンターなどで使われているが複製されやすいとして普及は限定的である。一方、Amazon Echoなどは認証ではなく利用者を特定するために声を使っている。バイオメトリック認証の中で指紋認証が一番幅広く利用されているが小さなセンサーで指紋を正確に読む技術が難しい。更に、指紋は複製しやすく安全性に関する懸念もある。

Appleは虹彩認証に進むのか

虹彩認識 (Iris Recognition) は精度が高く注目されている方式であるがが赤外線センサーなど専用機器が必要となるため普及が進んでいない。但し、Samsung Galaxy Note 7やNote 8はこの機能を既に搭載しているが認証精度や安全性についてはまだ評価結果が固まっていない。一方、iPhone Xは既に赤外線センサーを搭載しており虹彩認証に進むのではと噂されている。

顔認証がバイオメトリック認証の中心となる

色々なバイオメトリック認証方式がある中、顔認証方式は精度が高く使い勝手がいいことから、今後はこの方式が大きく広がると見られている。3年から5年後には認証技術の半分以上が顔認証になるとの予測もある。Apple iPhone Xの出荷はまだ始まっていないが、Face IDが市場に与えた影響は大きく顔認証方式の動向に注視していく必要がある。

Apple iPhone Xは顔認証を導入し写真をドラマチックに仕上げる、AIチップで画像認識を強化

Appleは新本社で次世代ハイエンドモデル「iPhone X」を発表した。iPhone Xは顔認証方式「Face ID」を導入し、カメラに顔を向けるだけで認証ができる。顔認証は指紋認証より安全性が高く、Appleが導入したことで一気に普及が進む可能性を秘めている。

出典: Apple  

次世代モデル三機種を発表

AppleはiPhone次世代モデル三機種を発表した。最上位機種はiPhone X (上の写真、左端) で、デバイスの前面が全てディスプレイ (Super Retina HD Display) となりホームボタンが無くなった。iPhone 7の後継モデルとしてiPhone 8 (上の写真、右端) とiPhone 8 Plus (上の写真、中央) が発表された。三機種とも新型プロセッサ「A11 Bionic」を搭載しAIとグラフィック機能を強化している。

Face IDとは

iPhone Xは顔認証機能「Face ID」を備えており、デバイスのロックを解除するには顔をカメラにかざすだけ (下の写真)。顔がパスワードになりデバイスをオープンできる。また、Apple Payで支払いをする際も顔をカメラに向けるだけで認証が完了する。指をホームボタンに押し付ける操作は不要で、安全なだけでなく使いやすくなった。

出典: Apple  

顔認証のメカニズム

Face IDを使うためには事前に顔を登録する必要がある。システムの指示に従って顔をカメラに向け、ディスプレイに示された円に沿って顔を回す (下の写真)。iPhone Xは「TrueDepth Camera」と呼ばれる特殊なカメラを搭載している (先頭の写真左側、ディスプレイ最上部の黒いバーの部分)。顔を登録する時はTrueDepth Cameraのプロジェクター (Dot Projector) から3万個のドットが顔に照射され、これを赤外線カメラ (Infrared Camera) で読み込み顔の3Dマップを作成する。

出典: Apple  

この情報がプロセッサのストレージ (Secure Enclave) に暗号化して格納される。Face IDを使うときは光源 (Flood Illuminator) から赤外線が照射されこれを赤外線カメラで読み込み、登録した顔のマップと比較して認証を実行する。

利用者の風貌が変わると

顔認証では利用者の状態が変わるという課題を抱えている。髪を伸ばしたり眼鏡をかけると登録した顔のイメージと異なり本人確認が難しくなる。このためAppleは機械学習 (Machine Learning) の手法を使って両者のイメージを比較する方式を採用した。アルゴリズムは登録した顔が髪を伸ばし眼鏡をかけるとどう変化するかを機械学習の手法で学習する。様々な条件を事前に学習しておき利用者の外観が変わっても高精度に判定できる。また、顔を3Dで比較するので写真を使って不正に認証を受けることはできない。

カメラの特殊効果

TrueDepth Cameraは自撮り (Selfie) する際に特殊効果を出すために使われる。これは「Portrait Lighting」という機能でスタジオで撮影する時のように、あたかも光を調整したかのように特殊効果を出す。Natural Lightというオプションを選択すると自然光のもとで撮影したように写る (下の写真、左側)。Studio Lightを選択するとスタジオの明るい環境で撮影した効果が出る。Contour Lightは顔の凹凸を際立たせ (下の写真、中央) ドラマチックな仕上がりとなる。Stage Lightは背景を黒色にして顔を浮き上がらせる (下の写真、右側)。

出典: Apple  

カメラの性能はAIで決まる

TrueDepth Cameraはステレオカメラでオブジェクトを3Dで把握する。カメラが人物と背景を区別し、更に、AIが人物の顔を把握しここに光を当てて特殊効果を生み出す。メインカメラにもPortrait Lighting機能が搭載されており上述の機能を使うことができる。カメラは光学センサーが差別化の要因になっていたが、今ではキャプチャしたイメージをAIで如何に綺麗に処理できるかが問われている。iPhoneカメラはSoftware-Defined Cameraと呼ばれソフトウェアが機能を決定する。

絵文字を動画にしてメッセージを送る

TrueDepth Cameraを使うと絵文字の動画「Animoji」を生成して送信できる。カメラは顔の50のポイントの動きを把握し、これを絵文字キャラクターにマッピングする。笑顔を作るとキャラクターも笑顔になる (下の写真)。ビデオメッセージを作る要領で録画すると、キャラクターがその表情を作り出し音声と共にiMessageで相手に送信される。猫の他にブタやニワトリなど12のキャラクターが揃っている。

出典: Apple  

AIプロセッサ

これら機械学習や画像処理を支えているのがAIチップA11 Bionicだ。名前が示しているようにAI処理に特化したエンジン「Neural Engine」を搭載している。Neural Engineは機械学習処理専用のエンジンで人や物や場所などを高速で把握する機能を持つ。このエンジンがFace IDやAnimojiの処理を支えている。またAR (拡張現実) における画像処理もこのエンジンにより高速化されている。

価格と出荷時期 (米国)

ハイエンドのiPhone Xの価格は999ドルからで11月3日から出荷が始まる。また、iPhone 8 Plusの価格は799ドルからでiPhone 8は699ドルからとなっている。両モデルとも9月22日から出荷が始まる。

iPhone発売から10周年

発表イベントは新設されたApple本社 (下の写真、左奥) に隣接するSteve Jobs Theater (下の写真、中央) で開催された。イベントの模様はライブでストリーミングされた。これはSteve Jobsを記念して建設されたシアターで円形のアーキテクチャになっている。一階部分は円盤状のロビーで、シアターは地階部分に設けられている。今年はiPhone発売から10周年の区切りの年になり、これを象徴してiPhone X (10) が登場した。

出典: Apple  

ATMに顔をかざしてお金を引き出す、中国で顔認証サービスがブレーク

中国で顔認証システムの導入が異常な速さで進んでいる。ATMに顔をかざすと本人の確認ができお金を引き出すことができる。空港の搭乗ゲートでは顔が搭乗券となり飛行機に乗ることができる。中国のAI技術レベルは欧米と同等といわれるが、それを応用したビジネスでは中国が先行している。顔認証サービスが中国でブームになっているが、その背後にはプライバシー保護に関し寛容な国民性がある。

出典: Alizila  

顔認証で支払いをする

中国最大手のEコマース企業AlibabaはAIを活用した顔認証システムに着目している。同社金融部門Ant Financialは2015年、ベンチャー企業と共同で顔認証で支払ができるシステム「Smile to Pay」を開発した。これをモバイルアプリAlipayに適用し、顔認証を使ったスマホ決済を運用してきた。

Alibabaは2017年9月、Smile to PayをKFCなどレストランにおける支払いに導入した。消費者は入り口に設置されたキオスクで料理を注文し顔認証で支払いをする (上の写真)。カメラに向かって顔をかざし電話番号を入力すると会計処理が完了する。ステレオカメラが3Dで顔を識別し、アルゴリズムは被写体が写真ではなく人間であることを把握する。将来は電話番号の入力は不要で、顔認証だけで買い物ができるシステムとなる。

顔認証でお金を引き下ろす

中国大手銀行China UnionPayはATMに顔認証システムを導入した (下の写真)。このATMはマカオに設置され、顔をかざすだけでお金を引き出すことができる。このサービスを利用するためには事前に顔写真を登録しておく。ATMにバンクカードを挿入しPINを入力し、中国政府が発行するIDカードを読み込ませ、最後に顔の写真を撮影する。顔の登録の全プロセスをATMで実行する。

出典: Bloomberg  

China UnionPayがATMに顔認証システムを導入したのは訳がある。お金の引き出しを便利にするためだけでなく、中国政府の政策と関連する。中国で人民元 (Renminbi) の海外流出が拡大しており、この多くがマカオのカジノからとされる。一般市民や政府関係者が複数の口座を開き、お金を限度額以上に引き出している。ATMに顔認証システムを導入することで個人を特定でき金の流れをトラックする目的がある。このATMはNCR製で顔認証のためのアルゴリズムが組み込まれている。

観光スポットへの入場は顔パス

Baiduは中国のGoogleともいわれAIで世界をリードしている。BaiduはAIによる顔認証技術の開発を進め多くの企業で利用されている。中国・烏鎮 (Wuzhen) は人気の観光地で、街の中を運河が流れ東のベニスと呼ばれる。この地区でBaiduが開発した顔認証システムが使われている。景観地区に入場する時に受付で顔を登録し支払いを済ませる (下の写真)。入口にはゲートが設けられ、そこに設置されているタブレットに顔をかざし顔認証を受ける。本人と確認されるとゲートが開き中に入ることができる。

出典: Financial Times  

空港の登場ゲート

Baiduの顔認証技術は空港の搭乗ゲートでも使われている。中国の大手航空会社Southern Airlinesは空港の搭乗ゲートに顔認証システムを導入した。乗客は搭乗ゲートのタブレットに顔をかざし飛行機に乗ることができる。このサービスは2017年6月から、Nanyang Jiangying Airportで運用が始まった。利用者はチェックインの際に身分証明写真と顔写真をスマホアプリで登録しておく。ゲートでは読み込んだ搭乗者の顔をこれらの写真と照合して認証する。

出典: South China Morning Post  

顔が従業員カード

Baiduは自社でもこの技術を展開しており、オフィスエントランスに顔認証システムを導入した。社員は入館ゲートに備え付けてあるタブレットに顔をかざすと、顔認証システムはリアルタイムでその人物の名前を認識しゲートが開く (下の写真、元Baidu研究所長Andrew Ngがデモのモデル)。本人の代わりに写真をかざしても認証を受けることはできない。

出典: Baidu  

トイレにも顔認証システムが     

北京の天壇 (Temple of Heaven、下の写真) は園内にあるトイレに顔認証システムを設置している。カメラに向かって3秒間顔をかざすとトイレットペーパーが出る。追加でトイレットペーパーを出すには9分間待つ必要がある。これはトイレットペーパーの盗難を防ぐための措置として導入された。顔認証システムの設置費用や維持経費はトイレットペーパーより高そうに思えるが、何か訳があるのかもしれない。このトイレが顔認証アルゴリズム教育のための顔データを集める特殊任務を負っているのかもしれない。

出典: Google Street View  

プライバシー保護に寛容な国民性

中国が顔認証システム普及で他国を大きくリードしているが、これは教育データが豊富でバイオメトリック情報を収集しやすい環境にあるためだ。中国の人口は世界最大で、多くの人が顔認証サービスを利用している。また、中国社会はプライバシー保護に関し寛容な態度を示し、顔データが収集されることに対し大きな反対運動は起こっていない。このため大規模な顔データを集めることができる。収集したデータをDeep Learningアルゴリズムにフィードバックし認証精度を向上させる。顔イメージという生体情報がシステムに保管されることに対する懸念より、中国社会は顔認証サービスの利便性を歓迎しているようにも見受けられる。顔認証システムの導入では中国が欧米や日本より数歩先を進んでいる。