作成者別アーカイブ: nad00251

Googleは人工知能スピーカー「Home」を出荷、スマホの会話型AIが家庭に入ってきた

Googleは人工知能スピーカー「Google Home」の出荷を開始した。会話型AI「Google Assistant」を実装し、言葉で質問すると音声で答える。AssistantはGoogle独自のスマートフォン「Google Pixel」で使われている。Googleは同じアシスタント機能をスマホと家電で展開する。Homeを使うと家の中が一気にインテリジェントになり、AI家電に大きな将来性を感じる。

出典: VentureClef

音声で操作するスピーカー

Googleは2016年11月、AIを搭載したスピーカー「Google Home」 (上の写真) の出荷を開始した。Homeは会話型AI「Google Assistant」を搭載し、音声がインターフェイスとなる。Homeは丸みを帯びた円柱形のデバイスで家庭内に置いて利用する。HomeはAmazonのヒット商品「Amazon Echo」のアイディアを踏襲している。先行しているEchoをHomeが追う展開となっている。

HomeにOk Googleと語り掛ける

Homeの上部はタッチスクリーンで、ここにLEDライトが埋め込まれている。LEDライトは利用者の声に反応して点滅する。LEDライトの様々な動きでHomeの状態を示す。タッチパネルに指で円を描くように動かすと音量を調整できる。背後にはマイクをオンオフするボタンがある。Homeは常に周囲の声を聞いており、ボタンを押すとこれがオフとなる。Homeに話しかけるときは「Ok Google」と言えば、これに続く言葉を認識する。

複雑な質問に答える

Homeは情報検索で威力を発揮する。ここが他社に比べ大きな優位点となる。例えば「what time will the sun rise」と聞くと、「the sun will rise 6:39 AM」と答える。これは簡単な質問だが、複雑なクエリーにも的確に答える。「What was the US population when NASA was established」と尋ねるとHomeは「174.9 million」とズバリ回答する。(下の写真左側はHomeに問いかけた内容で、右側はAssistantが答えた内容。)

出典: VentureClef

幅広い知識を持つ

Homeは幅広い知識を持ち、スポーツの試合結果を回答する。「who won the world series」と聞くと「the world series was won by Chicago Cubs」と答える。翻訳機能もあり、「what’s good morning in Spanish」と聞くと「Buenos días」と答える。健康管理では食事の時に食物のカロリー量を知ることができる。「how many calories in an apple」と聞くと、「there is 95 calories in one medium apple」と答える。

会社の秘書のように働く

HomeはGoogle Calendarとリンクし筆者の予定を把握している。このためHomeに「what’s my next event」と質問すると、次の打ち合わせ予定などを回答する。出張などで飛行機を予約している時は、フライトスケジュールを教えてくれる。「is my flight on time」と質問すると、飛行機が予定通りに出発するかどうかを回答する。Homeは会社の秘書のように働いてくれる。

中心機能はエンターテイメント

Homeの中心機能はエンターテイメントで、音楽やニュースをスピーカーで聞くことができる。Homeに「play music by Lady Gaga」と指示するとレディー・ガガの音楽を再生する。聞きたい音楽の題名を指定する時は「play Poker Face by Lady Gaga」と語り掛けるとポーカーフェイスを流す。ラジオ放送を聞きたいときは「Play KCSM」と放送局を指定する。この他に、CNNなどのニュース放送やNFLなどスポーツ番組もそろっている。

テレビを音声で操作する

Homeを使って圧倒的に便利だと感じるのがテレビを音声で操作する機能だ。HomeはGoogleのストリーミングデバイス「Chromecast」経由でビデオや音楽コンテンツをテレビに配信する。音楽を聴きたいときは「play music by Beyoncé on my TV」と指示すると、Google Play Musicからビヨンセの音楽がテレビで再生される (下の写真)。当然だがテレビのスピーカーで聞く音楽はHomeで聞くより迫力がある。

出典: VentureClef

テレビでビデオをみる

見たい番組を指示すると、HomeはそのコンテンツをYouTubeから探し出し、テレビにストリーミングする。Homeに「play CNN News on my TV」と指示すると、この番組がYouTubeからChromecastを経由してテレビにストリーミングされる (下の写真)。今まではスマホを操作して番組をテレビにストリーミングしていたが、音声操作で格段に便利になった。

まだ複雑な指定はできないが

YouTubeには幅広いコンテンツが揃っていて、人気チャンネル「History Channel」や「National Geographic」などをテレビにストリーミングできる。「trending videos…」と言えばいま人気上昇中のビデオが配信される。但し、見たい番組を細かく指示するのは難しい。例えば、CNBC放送でElon Muskの会見の模様を見るために「play Elon Musk on CNBC on my TV」とHomeに指示するが上手くいかない。まだ、複雑な指定はできないが、これからの機能拡張を期待する。

出典: VentureClef

検索結果をテレビで見る

Homeを使うと検索結果をテレビに表示することができる。例えば「can you show me Hubble Telescope on my TV」と指示すると、ハッブル望遠鏡についてのビデオをテレビに配信する。知りたい情報をテレビで見ることができ、Homeはエンターテイメントだけでなく教育ツールとしても使えそうだ。

Chromecastをテレビにセット

この機能を使うためには、テレビ側にChromecast挿入しておく (下の写真、円形のデバイス)。ChromecastはAndroidやブラウザーからコンテンツをテレビにストリームングするために開発された。Homeはこの仕組みを利用して、音声でChromecastを操作する。

その際、Chromecastに名前を付けておけば (筆者のケースでは「TV」)、Homeに対して「play CNN on TV」と指示するとストリーミングが始まる。Homeの機能は多彩だが、音声でのストリーミング機能は予想外に便利だ。テレビを含む家電のインターフェイスが会話型AIに進化するのは間違いない。

出典: VentureClef

スマートホームのハブ

Homeはスマートホームのハブとなり、電灯や空調などを操作する。Homeをスマートライト「Philips Hue」とリンクすると音声でLEDライトをオンオフできる。例えば「turn on living light」と指示すると、リビングルームの電灯が点灯する。HomeがサポートしているスマートデバイスはPhilips Hueの他に、NestやSmartThingsなどがある。

Homeのエコシステムは拡大中

登場したばかりのHomeで使える第三者サービスの数は限られている。音楽ではSpotifyとPandoraを、ラジオではTuneInを利用できる。配車サービスではHomeでUberを呼ぶことができる。Googleの自社サービスではGoogle Play Music とYouTube Musicを使える。ビデオではYouTubeを使うことができるが、前述の通りChromecastをテレビに接続しておく必要がある。

Amazon Echoの優位点はスキル

Google Home (下の写真左側) とAmazon Echo (同右側) はAIスピーカーとして開発され両者の機能はよく似ている。一方、先行しているEchoは幅広い第三者サービス (Skillと呼ばれる) を備えている。今では2000本近いSkillがあり、病気の診断やスマートホームのハブとして使われている。Echoに指示すれば焼き立てのピザが届く。幅広いタスクを実行できる点でEchoがHomeに差をつけている。

出典: VentureClef

Google Homeの優位点は情報検索

Google Homeは複雑な質問を理解し情報検索できる点が大きな優位点となる。更に、Homeは利用者の個人情報を幅広く把握している。HomeはGoogle CalendarやGoogle Keepと連携し、予定や備忘録を管理する。気の利く秘書のように一日の予定や出張を手助けしてくれる。また、Chromecastとリンクすることで結果をテレビに出力できる。Google Pixelのコア技術であるAssistantを家庭に展開した構造で、Google Homeに大きな将来性を感じる。

Google PixelはApple iPhoneを超えた！スマホがAIで構成される

Googleは独自に開発したスマホ「Pixel」を投入した。ハードウェア機能が格段に向上しただけでなく、AIが利用者とのインターフェイスとなる。PixelはGoogleが運営するMVNO (仮想モバイルネットワーク) で利用できる。Googleモバイル事業はAndroidとハードウェアとネットワークを垂直に統合したモデルに進化した。Pixelを使ってみると先進的な機能に感銘を受け、これが近未来のスマホの姿を示していると実感した。

出典: Google

独自ブランドのスマートフォン

Googleは2016年10月、Googleブランドのスマートフォン「Pixel」 (上の写真) の販売を開始した。手に取ってみるとPixelはiPhoneと見間違うほど似ている。よく見るとPixelの表面にはホームボタンはなく、背後に円形の指紋センサー (Pixel Imprint) が搭載されている。ここに指をあててデバイスをアンロックする。PixelはGoogleがゼロから開発したスマホで、台湾HTCが製造する。AppleのようにGoogleがスマホ全体を開発して製品を販売する。

PixelはAIスマートフォン

Pixelは最新基本ソフト「Android 7.1」を搭載し、そこには会話型AI「Assistant」が組み込まれている。AssistantはApple Siriに相当する機能で、言葉で指示するとコンシェルジュのように応えてくれる。AIがスマホ機能の中心となり、Pixelはソフトウェアと人工知能の交点として位置づけられる。

ハードウェアの完成度が格段に向上

Pixelはハードウェアとしての完成度が格段に向上した。iPhoneのような形状となり、薄くて軽くて快適に使える。Nexusシリーズと比較すると数世代分を一気に成長した感がある。ディスプレはAMOLEDでカメラは12.3MPの解像度とf/2.0の口径を持つ。Pixelカメラは「Software-Defined Camera」と呼ばれ、ソフトウェアが驚くほどきれいな画像を創りだす。Pixelカメラの性能はiPhone 7を超えたと評価されている。

Assistantが会話を通して生活をサポート

PixelはAIスマホとして位置づけられ、Assistantはコンシェルジュのように会話を通して生活をサポートする。Pixelに対し「Ok Google」と語り掛けるとAssistantが立ち上がり、これに続く言葉を認識する。「When does the San Francisco Moma close」と質問すると、「Moma is open now, it closes at 5 pm」と答える。美術館は5時に閉館するのでまだ開いていることが分かる (下の写真左側)。Assistantは声を聞き分ける生体認証機能があり、筆者のPixelに対して他人が「Ok Google」と呼びかけれも反応しない。

出典: VentureClef

Assistantで撮影した写真を探す

Assistantは写真検索で威力を発揮する。「Show me my photos in the rain」と指示すれば、雨の日に撮影した写真を表示する (上の写真中央上段)。「Show me my pictures taken at Google campus」と指示すると、Googoleキャンパスで撮影した写真を表示する (上の写真中央下段)。音声で操作できるのでスマホでサクサク検索できる。Pixelで撮影した写真はオリジナルサイズで写真アルバム「Google Photos」に格納される。ストレージ容量の制限は無く何枚でも格納できる。

Assistantでレストランを予約する

Assistantは情報検索だけでなく指示されたタスクを実行する。レストランを予約する時はAssistantと対話しながら場所や時間などを決めていく。最後に確認画面が表示され、Yesと答えるとレストランアプリ「OpenTable」で予約が完了する。電話で話すように驚くほど簡単にレストランの予約ができる。また、Assistantは一日のスケジュールを管理する。「What’s next on my calendar」と質問するとAssistantは次の予定を回答する。ここでは予約したレストランの概要が示された (上の写真右側)。

Assistantでアプリを操作する

AssistantはPixelアプリを操作できる。つまり、搭載しているアプリを音声で利用できる。Assistantに「Katy Perry on Instagram」と指示すると、インスタグラムのPerryのページを開く (下の写真左側)。また、「Open Snapchat」と指示すると、スナップチャットが起動してメッセージを読むことができる (下の写真中央)。Assistantに「Play music by Beyoncé」と指示すると、音楽アプリ「Google Music」が起動しビヨンセの音楽を再生する (下の写真右側)。Assistantの音声認識精度は高く、言葉でスマホを操作できるのはとても便利だ。

出典: VentureClef

カメラの性能が業界トップ

Pixelの最大の特長はカメラの性能が業界トップであることだ。カメラの性能は「DxOMark」のベンチマーク指標が使われる。これによるとPixelカメラは89ポイントをマークし、Apple iPhone 7の86ポイントを上回った。今までのトップはSamsung Galaxy S7 Edgeなどで88ポイントをマークしているがPixelがこれを追い越した。DxOMarkはカメラ、レンズ、スマホカメラの性能を評価するサイトでDxO Labs.が運営している。同社は光学関連のソフトウェアやデバイスを開発するフランス企業。

イメージング処理ソフトウェアの威力

Pixelカメラの性能がトップとなった理由はイメージング処理ソフトウェアのアルゴリズムにある。カメラはGoogle独自のハイダイナミックレンジイメージング機能「HDR+」を搭載する。この機能によりダイナミックレンジが広がり、明るい箇所から暗い箇所までバランスよく撮影できる。下の写真はその事例で、厳しい逆光のもとGoogle本社ビルを撮影したもの。肉眼では真っ黒に見えたガラス張りのビルが内部まで写っている。同時に、背後の青空とまぶしい雲がちゃんと写っている。HDR+の威力を感じる一枚となった。

出典: VentureClef

HDRとは

HDR (High Dynamic Range) イメージングとは、異なる露出の複数枚の写真を組み合わせて一枚の写真を生成する技術を指す。一般にHDRは被写体に対して三枚の写真を使う。Underexposure (露出アンダー)、Overexposure (露出オーバー)、及びBalanced (適正露出) の三枚の写真を撮影し、ここから最適な部分を抽出し、これをつなぎ合わせて一枚の写真を生成する。

HDR＋とは

これに対してPixelのHDR+は同じ露出の写真を多数枚組み合わせて一枚の写真を生成する。Pixelはカメラアプリを開いた時から撮影を始め、シャッターが押されたポイントを撮りたいシーンと理解する。露出を上げないので暗い部分はノイズが乗ることになる。しかし、暗い部分の写真を数多く重ね合わせることで数学的にノイズを減らす。この手法により、重ね合わせがシンプルになり、ゴーストが発生しないという特徴がある。下の写真はまぶしい雲を背景に星条旗が風にたなびいているが、ゴーストは発生していなく細部まで写っている。

出典: VentureClef

Software-Defined Camera

Pixelカメラは特殊なハードウェア機構は備えていない。Googleはコモディティカメラを使いソフトウェアでイメージング技術を向上させるアプローチを取る。これは「Software-Defined Camera」と呼ばれソフトウェアがカメラの性能や特性を決定する。一眼レフカメラは高価なハードウェアで1枚だけ撮影する。これに対しGoogleは安価なカメラで大量の写真を撮影してソフトウェアで最適化する。イメージング技術はAIを含むアルゴリズムが勝敗を決める。

音声で写真撮影

Pixelカメラは音声で写真を撮影できる。これはAssistantの一部で、フロントカメラで自撮りする時は、「Ok Google, take a selfie」と語るとシャッターが下りる。腕を伸ばして難しい姿勢でシャッターを押す必要はない。メインカメラで写真撮影をするときも、「Ok Google, take a picture」と言えばシャッターが下りる。タイマーを使う代わりに音声で集合写真を撮影できる。メインカメラからフロントカメラに切り替えるときは、Pixelを縦に持ち二回ひねる。

指紋センサー

Pixelをアンロックする時には指紋認証を使う。上述の通りPixelにはホームボタンはなく、背後の指紋センサーに指をかざす。片手で操作でき、かつ、スリープ状態から直接アンロックできるのでとても便利。Pixelは指紋認証の認識率が非常に高く、殆どのケースで１～２回程度でアンロックできる。指紋で認証できないときはPINなど従来方式の認証を行う。

Googleが独自のネットワークを運営

Pixelは米国最大のキャリアVerizonが販売している。また、Google独自のネットワーク「Fi Network」を使うこともできる。Fi NetworkはMVNO (仮想モバイルネットワーク) 方式のネットワークで、背後でSprintとT-Mobile USの4G LTEが使われている。Fi Networkを利用する時は専用のSIM Cardを挿入する。PixelはGoogleオリジナルのスマホをGoogleネットワークで運用する構造となっている。

Fi Networkの特徴

Fi Networkは単に通信網を提供するだけでなく、両者のうち電波強度の強いネットワークに自動で接続する。また、LTEやWiFiなど異なるネットワーク間で最適な通信網を選択し、サービスを途切れなく利用できる。屋内では通話やテキストメッセージはWiFi経由で交信する。屋外に出るとGoogleの移動体ネットワークFi Networkに接続される。

ネットワーク間での自動切換え

このためネットワーク間で途切れなくサービスを利用できる。自宅でWiFi経由で電話している時、屋外に出るとネットワークがLTEに切り替わる (下の写真左側)。通話は途切れることなくシームレスにハンドオーバーされる。通話だけでなくデータ通信でも自動でネットワークが切り替わる。自宅のWiFiでGoogleの音楽ストリーミングを聞きながらクルマで屋外に出るとFi Networkに切り替わる (下の写真中央)。

出典: VentureClef

クルマの中でAssistantが大活躍

クルマの中では言葉でAssistantに指示して好みの音楽を聴ける。電話やメッセージもAssistantに言葉で指示して発信する。ナビゲーションもAssistantに言葉で語り掛けて使う。少し大きめの声で語り掛ける必要はあるが、Assistantは運転中に絶大な威力を発揮する。今ではPixelはドライブに必須のインフォテイメントデバイスとなった。

シンプルで良心的な料金体系

Fi Networkの料金体系はシンプルで基本料金とデータ料金の組み合わせで構成される。基本料金は月額20ドルで、ここに通話、テキストなどが含まれる。データ通信は月額10ドル／GBで、例えば2GBで契約すると月額20ドルとなる。制限量まで使っていない場合は、翌月分の料金から差し引かれる、良心的な料金体系となっている。またデータ通信料はグラフで示され (上の写真右側) 使用量を明確に把握できる。(ロックスクリーン左上にFi Networkと表示される、下の写真左側。アイコンは小さめの円形になりホームスクリーンのデザインがすっきりした、下の写真右側。)

出典: VentureClef

Samsungとの関係は微妙

Googleのモバイル事業はAndroidを開発しこれをパートナー企業に提供することで成り立っている。SamsungなどがAndroidを利用してスマホを販売している。このためスマホ事業はSamsungなどに依存しているだけでなく、Googleの収益構造が問われてきた。事業が拡大するのはSamsungでGoogleは大きな収益を上げることが難しい状態が続いている。GoogleがPixelでスマホ事業に乗り出すことで、Appleのような垂直統合型となり、収益構造も改善すると期待される。一方、Android陣営内でGalaxy顧客がPixelに乗り換えることも予想され、Samsungなどパートナー企業との関係が難しくなる。

ソフトウェア＋デバイス＋ネットワーク

Googleは基本ソフト (Android) とデバイス (Pixel) だけでなく、ネットワーク (Fi Network) を含めた垂直統合システムでモバイル事業を始めた。Appleのようにスマホを販売するだけでなく、それを運用するネットワークも提供する。キャリアが提供するネットワーク単体では技術進化が停滞している。Googleはデバイスとそれをつなぐネットワークを統合することでイノベーションを起こせるとしている。AIスマホを独自のネットワークで結び、Googleはスマホ事業の近未来の姿を示している。

無人カーでのレースが開幕、人工知能がF1ドライバーを超える？

ドライバーが搭乗しないレーシングカーによるレースが始まった。これは「Roborace」と呼ばれ、AIレーシングカーがFormula Oneのようなバトルを展開する。レーシングカーにはコックピットはなく、Deep Learningが操縦する完全自動運転車だ。アルゴリズムがLewis Hamiltonを超えるのかファンの注目を集めている。

Roboraceとは

RoboraceはEVのF1といわれる「Formula E」シリーズの一部として位置づけられる。Roboraceは10チームで構成され、各チームは二台の無人レーシングカー (上の写真) で勝負する。レーシングカーの車体は同じものが使われるが、各チームは独自にソフトウェアを開発し、レーシングカー制御と自動運転技術の戦いとなる。

EVと自動運転技術の交差点

高速で走行するレーシングカーからリアルタイムで大量のデータが収集される。これを如何に高速で処理できるかがポイントになる。これらのデータを解析し自動運転するAI技術が競われる。クルマの将来はEVと自動運転技術で、Roboraceの意義はこの構想をレースの形で世界に示すことにある。Roboraceは再生可能エネルギー技術と自動運転技術を結び付け、未来のモビリティを示している。

未来的なデザイン

Roboraceで使うレーシングカーはKinetikが開発し供給する。Kinetikとは英国のベンチャーキャピタルで、配下のRoborace社が車体の設計と製造を担う。レーシングカーのデザインはDaniel Simonが手掛けた。同氏はディズニー映画「Tron Legacy」で登場する二輪車「Light Cycle」をデザインした。RobocarはLight Cycleをほうふつさせる未来的な形状と色彩となっている。

レーシングカーの形状はシンプル

レーシングカーは無人で走行することを前提にゼロから設計された。ドライバーが搭乗しないのでコックピットはなくシンプルな形状となっている。機能面からは床面の形状でダウンフォースを得る。レーシングカー底部を高速で流れる空気を利用して車体を路面に押し付ける。このダウンフォースを利用して高速でコーナーを回ることができる。ちなみにF1ではダウンフォースを得るためにFront WingとRear Wingを車体に付けている。

多数のセンサーを搭載

レーシングカーは自動運転のための様々なセンサーを搭載している。Lidar (レーザーレーダー) を5台搭載している。前面に二台、側面に二台、後部に一台搭載し、周囲のオブジェクトを把握する。AIカメラは前面に二台とPole (車体上部に設置されたポール) に一台設置される。名前が示すように、AIと連動しインテリジェントなセンサーとなる。この他に、レーダー、超音波センサー、GPSアンテナを搭載する。

Deep Learningを使った運転技術

レーシングカーは処理装置としてNvidiaの車載スーパーコンピューター「Drive PX 2」を搭載している。Drive PX 2はセンサーからのデータを処理し周囲のオブジェクトを把握する。更に、Deep Learningの技法でクルマが運転技術を学ぶ。試合を重ねるにつれレーステクニックを習得し人間のドライバーに近づいていく。将来はF1ドライバーを凌駕するのではとの声も聞かれる。

香港グランプリでデビュー

Roboraceは2015年11月に計画が発表され、今シリーズからレースを始めるとしていた。実際には、10月に開催された香港グランプリでRoboraceの試験車両「DevBot」が公開された (上の写真)。試験車両はドライバーが搭乗できるコックピットが備え付けられているが自動で走行する。グランプリではそれをデモする予定であったが、バッテリーの問題で残念ながら中止となった。Roboraceは2016年をシーズンゼロと位置づけDevBotの開発を続け、来年度からRoboraceでレースが始まる。

Formula Eとは

Roboraceが属するFormula Eとは2014年に創設されたモータースポーツイベントで、バッテリーで駆動するレーシングカーが速さを競い合う。Formula EはFIA (国際自動車連盟) が管轄する。FIAはFormula OneやWorld Rallyなど世界のトップレースを運営している。３シーズン目となる2016年はスポーツファンの数が増え人気が急上昇している。

中国を舞台にシーズンがスタート

今シーズンのFormula Eは香港グランプリから始まり、2017年7月まで世界10都市で12レースを開催する。香港グランプリは市街地にレースコースが設定され10チーム20台が競った (下の写真)。レースは事故が続発する波乱の展開となり、昨年度のチャンピオンe.Dams (RenaultのFormula Eチーム) のSébastien Buemiが優勝した。昨年までは北京で開催され、毎年中国を舞台にシーズンがスタートする。

F1に性能では劣るが

Formula Eは外観はF1に似ているが電気モーターで駆動するレーシングカー。レース時間は50分で一人が二台のマシンを使って競技する。F1は燃料が少なくなるとピットインして給油するが、Formula Eは電気残量が少なくなるともう一台のマシンに乗り換えてレースを続ける。Formula Eの最高速度は時速220キロであるがF1は時速340キロと大きく上回る。最高速度や加速性能でF1が上回るが、Formula EはEV技術が高速に進化し、その将来性に期待が集まっている。

レースはバッテリーの勝負

EV技術の中心がバッテリー開発となる。Formula Eのバッテリー重量は200kgで、バスの電圧は1000Vに制限されている。更に、モーター出力は200 kW (270馬力) だが、レース中は170 kWに制限されている。バッテリーからの電力使用量は28kWhに制限される。レースはエネルギー管理の戦いでもあり、多くの制限のもとで最新技術が磨かれる。

ファン投票でエネルギーを得る

レースは速さを競うだけでなく、楽しく観戦できる仕組みが随所にみられる。ファンは応援しているドライバーに投票しマシンの出力を上げることができる。これは「FanBoost」と呼ばれ、投票数の多いドライバーは100キロジュール (100kW x 秒) を受ける。5秒間で20kWの追加エネルギーを得ることができ12%の出力アップとなる。これでライバルを追い抜くシーンが見られ、ファンはレースに参戦した気分になる。

中国企業がFormula Eに参戦

Formula Eの特徴は多くの中国企業がレースに参戦している点だ。「NextEV」は中国企業が運営するレーシングチームでFormula E創設以来参戦している。昨年度は9位の成績で不調に終わったが、今年は巻き返しを狙っている。3シーズン目にあたる今年は「Techeetah」というチームが参戦した。このチームは日本のFormula Eチーム「Team Aguri」を買収してレースに加わった。

Faraday Futureも参戦

今シーズンは「Faraday Future」がスポンサーとしてFormula Eに参戦した (下の写真)。Faraday FutureとはLos Angelesに拠点を置くEVメーカーでTeslaに対抗するEVや自動運転技術を開発している。Faraday Futureは米国籍の企業であるが、中国大手IT企業「LeEco」が出資している。Faraday Futureは米国の名門レーシングチーム「Dragon Racing」のスポンサーとなる。資金を出すだけではなくパワートレイン制御のソフトウェアを提供する。Faraday FutureがFormula Eに参戦したことで中国系企業は3社となり、EVや自動運転技術にかける中国企業の意気込みが感じられる。

Mercedes-BenzがFormula Eに参戦

Mercedes-Benzは2018年シーズンからFormula Eに参戦することを発表した。5シーズン目にあたるこの年から2チーム増え12チームでレースが展開される。このシーズンから1台のレーシングカーで最初から最後まで走り切るだけのバッテリーを搭載する。Renault、Audi、Jaguar (下の写真)、BMWなどがすでに参戦しており、Mercedesの発表でFormula Eへの流れが鮮明になった。

EVへの流れが鮮明になる

MercedesはF1でエースドライバーLewis Hamiltonを抱え、昨シーズンは総合優勝を飾り、今年もチームが連勝する勢いである。F1で破竹の勢いのMercedesが敢てFormula Eに参戦することで、EVレースが一挙に注目を集めることとなった。自動車産業の流れがEVに向かっていることを象徴する出来事となり、NissanやPorscheがこれに続くと噂されている。

F1人気が低迷している

いまF1の人気が低迷している。F1は機能が成熟し大きな技術進化が期待できないという事情がある。そのため多くの自動車メーカーはここへの投資をためらっている。技術進化が停滞しているF1からスポンサーが離れている。かつてはクルマの新技術がF1レースで開発されたが、F1はその役割を終えようとしている。

Formula EでEV技術や自動運転技術が磨かれる

これに対しFormula Eは次世代技術開発のプラットフォームとして位置づけられ、大手自動車メーカーの参戦が相次いでいる。ここが次世代モータースポーツの場であり、高度な自動運転技術を磨く場でもある。モータースポーツファンは進化が止まったF1から、次世代レーシングFormula Eに乗り換えている。Formula Eで磨かれたEV技術や自動運転技術が次世代のクルマ産業を支えることになる。

NvidiaはAI自動運転車を公開、Deep Learningが人間の運転テクニックを模倣する

Nvidiaは半導体製造から自動運転車開発に軸足を移している。NvidiaはAIで構成される自動運転車の試験走行を公開した。Googleなどは自動運転技術の一部をAIで実装するが、NvidiaはこれをすべてDeep Learningで処理する。AI自動運転車は人間の運転を見るだけでドライブテクニックを学ぶ。

出典: Nvidia

自律走行のデモ

Nvidiaは2016年9月、自動運転車が自律走行する模様をビデオで公開した (上の写真、右側手前の車両)。このクルマは「BB8」と命名され、テストコースや市街地で走行試験が実施された。クルマはハイウェーを自動運転で走行できる。ハイウェーは自動運転車にとって走りやすい場所である。しかし、クルマは路面にペイントされている車線が消えているところも自動走行できる。

道路というコンセプトを理解

自動運転車の多くはペイントを頼りにレーンをキープするが、BB8は道路というコンセプトを理解でき、車線が無くても人間のように運転できる。このためBB8は道路が舗装されていない砂利道でも走行できる。路肩は明確ではなく道路の両側には草が生えている。この状況でもクルマは道路の部分を認識して自律的に走行する。

ニュージャージー州で路上試験を展開

クルマは工事現場に差し掛かると、そこに設置されているロードコーンに従って走行する。ドライバーが搭乗しないでクルマが無人で走行するデモも示された。BB8はカリフォルニア州で運転技術を習得した。一方、路上試験は全てニュージャージー州で実施された。クルマは学習した運転技術を異なる州で使うことができることを示した。ちなみにNvidiaはカリフォルニア州では路上試験の認可を受けていない。

Deep Learningを使った運転技術

これに先立ちNvidiaは自動運転技術に関する論文「End to End Learning for Self-Driving Cars」を発表した。この論文でDeep Learningを使った運転技術を示した。自動運転システムは「DAVE-2」と呼ばれ、ニューラルネットワークで構成される。システムはクルマに搭載されているカメラの画像を読み込み、それを解析しステアリングを操作する。

出典: Nvidia

データ入力から出力までをニューラルネットワークで処理

システムの最大の特徴はデータ入力から出力までをニューラルネットワークで処理することだ。カメラのイメージをネットワークが読み込み、それを解析しステアリング操作を出力する。システムが自律的に運転技術を学ぶので、教育プロセスがシンプルになる。カメラで捉えた走行シーンとドライバーのステアリング操作が手本となり、ネットワークがこれを学ぶ。このため、道路に車線がペイントされていなくても人間のように走行できる。また、駐車場で走行路が明示されていなくても、クルマは走ることができる (上の写真)。

ドライバーの運転データを収集して教育

このためドライバーの運転データを収集しネットワークを教育する。具体的には、カメラで撮影したイメージとそれに同期したステアリング操作を収集する。収集した運転データでニューラルネットワークを教育する。ネットワークを構成するConvolutional Neural Network (CNN) にカメラの映像を入力し、ステアリング操作を出力する。この出力を人間のドライバーが運転したときのステアリング操作と比較する。差分を補正することでCNNは人間のドライバーに近づく。

クルマが遭遇するすべての条件を再現

教育データは様々な明るさの状況のもと、また、異なる天候で収集された。データの多くがニュージャージー州で収集された。道路の種別としては二車線道路、路肩にクルマが駐車している生活道路、トンネル内、舗装していない道路が対象となった。気象状況としては、晴れの日だけでなく、雨、霧、雪の条件で走行データが集められた。また、昼間だけでなく夜間の走行データが使われた。つまり、クルマが遭遇するすべての条件が再現された。テスト車両はLincoln MKZとFord Focusが使われた。

車載スーパーコンピューター

教育したネットワークを車載スーパーコンピューター「Drive PX 2」(下の写真)にインストールすると自動運転車が完成する。Drive PX 2は自動運転車向けのAI基盤で自動車メーカーや部品メーカーに提供される。Drive PXはカメラ、Lidar、レーダー、ソナーなどのセンサーで捉えた情報を処理し、クルマ周囲の状況を理解する。これはSensor Fusionと呼ばれ、上述のConvolutional Neural Networkで処理する。ただし、Nvidiaの自動運転車はセンサーとしてカメラだけを使っている。定番技術であるLidarを使わないため、アルゴリズム側で高度な手法が求められる。

出典: Nvidia

アルゴリズムの安全性を確認

システムを教育した後は、路上で試験する前にシミュレータでアルゴリズムを検証する。教育データを入力し、シミュレータでクルマが自動運転できる割合を計算する。このケースでは600秒の運転で10回運転を補正する必要があった。自動運転車がレーンの中心をそれると、仮想ドライバーが元に戻す操作をする。実際の路上試験ではHolmdelからAtlantic Highlands (ニュージャージー州) まで自動運転で走行し、その98%を自動運転モードで運行できた。

AIがルールを学習する

この手法は人間がアルゴリズムに走行のためのルールを教えるのではなく、CNNが画像からそれを読み取る。例えば、CNNはカーブしている道路のイメージを読むと、そこから運転に必要な道路の特徴を把握する (下の写真)。上段がカメラが捉えた画像で、下段がCNNが把握した道路の特徴 (Feature Maps) を示している。CNNは運転に必要な道路の境界部分を捉えていることが分かる。これは人間が教えたものではなくCNNが自律的に学習した成果だ。100時間程度の運転データでCNNを教育すると様々な環境で運転できるようになる。

出典: Mariusz Bojarski et al.

ルールベースの自動運転車

これに対して、自動運転車の多くは画像を解析しルールに従って特徴を抽出する。アルゴリズムは車線ペイントなど道路の特徴や周囲のオブジェクトを把握し、進行経路を計算し、実際にクルマを操作する。これらは事前にプログラムのロジックで定義される。クルマは常に想定外の事象に遭遇するので、それらをIF-THENでプログラミングする。この条件の複雑さ (Curse of Dimensionalityと呼ばれる) が自動運転やロボット開発のネックとなっている。

自動運転技術のロードマップ

Nvidiaの自動運転技術開発は始まったばかりで、次のステップはアルゴリズムの精度を改良する。現在98%を自動運転できるが、この精度を向上させる。また、アルゴリズムの精度をどう検証するかが大きな課題となる。実際に試験運転して精度を測定するだけでなく、これを検証するシステムが必要になる。更にAI自動運転車で問題が発生するとその原因探求が難しい。AIというブラックボックスが周囲の状況を把握し運転する。このため、CNNが把握しているイメージの可視化精度を上げる必要がある。実際にCNNが認識しているイメージを人間が見ることでAIのロジックを理解する。これを手掛かりに問題を解決しアルゴリズムを改良する。

自動運転車はAIアルゴリズムの勝負

NvidiaはDeep Learning向けハードウェアや開発環境を提供する。自動運転車を重点市場としてDrive PXなどをメーカーに提供する。更に、上述のDeep Learningを駆使したソフトウェアも自動運転車開発キットとして提供する。既に80社以上がNvidia技術を使っており、自動運転車のエコシステムが拡大している。多くのメーカーがNvidiaプラットフォームを採用する中、AIアルゴリズムが自動運転市場での勝ち組を決める。

自動運転シャトルがシリコンバレーで営業開始、都市交通のラストマイルを担う

自動運転シャトルに試乗したが次世代モビリティを担うクルマだと感じた。シャトルは大学構内を巡回し、キャンパス内の移動手段として使われる。今はドライバーが搭乗しているが、無人シャトルとなる計画だ。無人シャトルは近距離を移動する車両としてデザインされている。高齢化が進む日本社会に向いているのかもしれない。

Driverless Shuttle

このシャトル (上の写真) は「Driverless Shuttle」と呼ばれ、シリコンバレーに拠点を置く新興企業Auro Roboticsが開発している。シャトルはクルマとカートの中間領域の車両で、ここに自動運転技術を搭載している。シャトルは先月からSanta Clara University (サンタクララ大学) 構内で営業運転を開始した。

シャトルに試乗

大学構内でこのシャトルに試乗した。シャトルはキャンパス内のルートを自動で走行するが、今は専任ドライバーが搭乗し運転を補助する。Auro RoboticsのEric Weberが運転席に座り、Driverless Shuttleの説明を聞きながらルートを周回した。自動運転技術の完成度は高くほぼ自動で走行できた。

3DマップとGPS

シャトルは事前に設定されたルートに沿って自動で走行した。キャンパス内の3DマップとGPSの位置情報を使い自律走行する。経路上で噴水のあるロータリーに差し掛かったが、シャトルはそれを迂回して問題なく走行した (下の写真)。

ジョイスティックで操作

別の場所では路上に大型容器が置かれていたがシャトルはこれを認識した (下の写真)。シャトルは自分で障害物を避けて走行できるが、Weberがジョイスティックを使って手動で操作した。大学との取り決めで、シャトルは事前に設定したコースだけを自動走行するよう定められている。経路を逸脱する際はドライバーがマニュアルで操作する規定となっている。厳しいとも思えるが、安全性に配慮された運行ルールとなっている。

Deep Learningでインテリジェンスな走行

路上には道路標識があり、一時停止標識でシャトルは停止し、安全を確認して発進した (下の写真)。シャトルはプログラムされたルールに従ってこの一連の操作を実行した。しかし、シャトルの自動走行技術はAIで強化されつつある。Auro RoboticsはDeep Learningの技法で自動運転技術を開発している。事前にプログラムするのではなく、AIが自ら道路標識の意味を学習する。更に、Deep Learningの手法で障害物を把握し、その動きを予想する。例えば、シャトルの前を人が横切ると、アルゴリズムは人であると判定するだけでなく、人の次の動きを予想する。シャトルは人間のドライバーのようにインテリジェントになる。

Lidarを中心としたセンサー

シャトルにはLidar、カメラ、GPSが搭載され、クルマの周り360度のオブジェクトを把握する。測定できる距離は100メートルで様々な明るさの元で動作する。二種類のLidarを使っており、屋根の上にはVerodyne社製を、バンパーの下にはLeddarTech社製を搭載している。バンパーの下にLidarを設置しているのですぐ前を子犬が横切っても検知できる。カメラはフロントグラスの内側にマウントされている。今はLidarがクルマの眼となっているが、Deep Learningの開発が進むとカメラがセンサーの中心となる。

スマホアプリで無人シャトルを利用

定められたコースを巡回する方式に加え、利用者がオンデマンドでシャトルを利用する方式が開発されている。利用者はスマホアプリで無人シャトルを呼び、向かっているシャトルの位置はアプリに表示される。無人シャトルに乗ると備えつけのタブレットで降車場所を指定する。無人タクシーのように、スマホアプリで無人シャトルを利用する。

工場や空港やテーマパークに導入

シャトルはミニバスの代替手段となり、大学キャンパスだけでなく工場敷地内や空港などでの利用が計画されている。更に、ディズニーランドのようなテーマパークでも需要があるとみられている。米国では退職者のコミュニティが各地にあり、ここでの利用も検討されている。これらは私有地で道路交通法が適用されないため、無人シャトルの運行では自由度が高い。自動運転技術の導入の最初のステップとなる。

大企業に先んじて自動運転車を運行

Auro Robotics創業者たちはインドの大学で無人シャトルの基礎技術を研究した。その後、Y Combinatorを経て、2016年5月、大手ベンチャーから200万ドルの出資を受けた。大学での人気の科目は自動運転技術で、今では高校でこの教育が始まり話題となっている。Auro Roboticsはその魁で、大学での研究がDriverless Shuttleとして結実した。大手企業から製品が登場していない中、新興企業が自動運転シャトルを運行していることの意義は大きい。

生活のラストマイル

生活に密着し小回りの利く無人シャトルはむしろ日本社会に向いているのかもしれない。試乗してそう感じた。高齢化が進む中、自分で運転する代わりに無人シャトルで移動する。政府の観点からは公共交通網を無人シャトルで補完するという選択肢がある。道路整備や安全性の確保など多くの課題はあるが、無人シャトルは生活のラストマイルで活躍が期待される。

Emerging Technology Review

シリコンバレーからの最新技術レポート

作成者別アーカイブ: nad00251

Googleは人工知能スピーカー「Home」を出荷、スマホの会話型AIが家庭に入ってきた

Google PixelはApple iPhoneを超えた！スマホがAIで構成される

無人カーでのレースが開幕、人工知能がF1ドライバーを超える？

NvidiaはAI自動運転車を公開、Deep Learningが人間の運転テクニックを模倣する

自動運転シャトルがシリコンバレーで営業開始、都市交通のラストマイルを担う