カテゴリー別アーカイブ: 人工知能

GoogleはHome Hubの出荷を開始、AIスピーカーがAIタブレットに進化

Googleはディスプレイ付きAIスピーカー「Google Home Hub」の販売を開始した。早速使ってみたがAIスピーカーの新しい可能性を感じる。GoogleはHome Hubをスマートホームを管理するハブと位置付けている。Home HubはAIタブレットという印象で、AIアシスタントが次の次元にアップグレードされたことを感じる。

出典: VentureClef

マクロコマンド

Home Hubに「おはよう」と語りかけると、一日の予定をブリーフィングする。天気予報に始まり、今日のスケジュールや道路の渋滞情報をディスプレイに示す(下の写真)。また、ニュースを登録しておくと、それらが順次ディスプレイで再生される。これは「Routines」という機能で、一言指示すると、登録している複数のコマンドが順次実行される。

出典: VentureClef

ニュース

当初、ニュースはポッドキャスト(音声配信)であったが、今ではビデオ形式に進化した。朝食を食べながらHome Hubで最新ニュースを見るのが日課となった。ニュースの種類も大幅に増えた。CNNなど大手メディアから(下の写真)、地元サンフランシスコのテレビ局のニュースも配信される。CNBCはビジネスに、TechCrunchはテクノロジーに特化したニュースを配信する。

出典: VentureClef

コントロール

Home Hubは名前が示す通り、スマートホームのハブで、家の中のデバイスを制御する(下の写真)。インターフェイスはタッチで、画面のアイコンに触って操作する。「Lights」はスマートライトを制御する機能で、電灯をオンオフしたり、光量を変えることができる。「Broadcast」を使うとHome Hubがインターコムになり、他のHomeと通話できる。「Camera」にタッチすると玄関先のビデオ画像が配信される。

出典: VentureClef

調理方法

Home Hubに質問すると回答をディスプレイでビジュアルに表示する。Home Hubをキッチンに置いているので、調理方法を質問することが多い。例えば、野菜の煮込み料理「ラタトゥイユ」の作り方を聞くとそのレシピをステップごとに示す。また、パイナップルの皮のむき方を尋ねると、ビデオでそれを表示する(下の写真)。ここではアプリ「Allrecipes」が使われている。

出典: VentureClef

検索

会話の中で議論となったことをHome Hubに尋ねると、ディスプレイにその答えが示される。女優Ariana Grandeのアイメイク「Cat Eye」について尋ねると、メイクの手順がYouTubeに示される。また、話題のお菓子「Unicorn Cake」とは何かと尋ねると、その写真がディスプレイに示される(下の写真)。スマホを取り出さなくても手軽に回答を得ることができるし、その結果をみんなで見ることができる。

出典: VentureClef

音楽

Homeと同様に、Home HubでGoogle MusicやPandoraなど音楽配信サービスを通して音楽を聴くことができる。ディスプレイには演奏中の音楽のタイトルやアーティストの名前が示される(下の写真)。今まではAIスピーカーからテレビに音楽を配信して聴いていた。このために配信デバイス「Chromecast」が必要で、これをテレビに装着する。Home HubではChromecastは不要で、そのまま手軽に音楽やビデオを再生できる。

出典: VentureClef

Ambient Mode

Home Hubを使っていないときはディスプレイがアートギャラリーになり作品が表示される。ここには名画の他に、印象的な写真やストリートアートが表示される(下の写真)。また、「Fullscreen Clock」を選ぶと、スクリーン全体が時計になる。ディスプレイの輝度は周りの光量に応じて自動で調整される。夜になり周りが暗くなると自動でスリープモードとなり、デジタル時計が表示される。

出典: VentureClef

写真アルバム

Home Hubで便利な機能が撮影した写真を表示できること。Ambient Modeで「Google Photos」を選択すると写真アルバムが表示される。「Family & Friends」のオプションを選択すると家族や友人やペットが写った写真を表示する。音声で指示するとその写真を表示することもできる。例えば「サンフランシスコで撮った写真」と指示すると、それらが画面に表示される(下の写真)。

出典: VentureClef

監視カメラ

Home Hubは監視カメラと連携し、玄関先の様子をストリーミングする。ドアベル「Nest Hello」と連携すると、チャイムが押されると自動で玄関先のビデオ画像を表示する(下の写真)。ビデオで来訪者を確認してドアを開けることができるので安心感が格段に向上する。ちなみに、知人が訪ねてくるとHome Hubは来訪者の名前を告げる。

出典: VentureClef

タッチか言葉か

GoogleはHome Hubをスマートホームを制御するデバイスと位置付ける。操作はタッチインターフェイスで画面に触りながら操作する。実際に使ってみるとタッチより言葉のほうが便利で、Home Hubへの指示はほとんど言葉でする。つまり、Home Hubをハブとしてでなく、AIディスプレイとして利用している。ちなみに、指示した言葉はディスプレイに示され(下の写真)、どう聞こえているかが分かり会話がしっくりくる。

出典: VentureClef

競争が激化

ディスプレイ付きAIスピーカーは対話が言葉だけでなく、グラフィカルに示され、コミュニケーションの質がリッチになる。この市場ではAmazonが先駆者で2017年6月に「Echo Show」を出荷。Facebookは2018年11月、AIスピーカー「Portal」を投入したが、ここにはディスプレイが付いている。AIスピーカーはAIタブレットに進化を遂げ、この市場で競合が激しくなっている。

AI融資審査はブラックボックスで安全に使えない、いま判定結果を説明できるExplainable AIが登場

AIで融資を審査する手法は銀行業務を自動化する切り札として注目されている。しかし、金融機関はAI融資審査の導入をためらっている。これはアルゴリズムがブラックボックスで、審査したロジックが明らかでなく、銀行は消費者に判定理由を説明でいないため。いま融資審査の内容を説明できるAIが登場し注目を集めている。

出典: Google

説明できるAI融資審査

ZestFinanceはロサンジェルスに拠点を置くベンチャー企業で、融資サービスのAIプラットフォームを開発している(上の写真)。この製品は「Zest Automated Machine Learning (ZAML)」と呼ばれ、融資申込者のリスクを機械学習の手法で査定する。ZAMLの特長はアルゴリズムが導いた結果を説明できること。これは一般に「Explainable AI(説明できるAI)」と呼ばれ、政府法令に準拠してAIが融資審査を実行する。

融資審査と説明責任

機械学習モデルを使うと融資判定を高精度に実施できるが、この手法はAIが抱える根本的な問題を抱えている。これはAIがブラックボックスであることで、機械学習モデルは審査結果を説明できない。融資審査では応募者がローンを受けることができなかった場合、その理由の説明が求められる。また、金融機関はアルゴリズムが法令に準拠していることを立証する責任がある。これらの要件を満たすことができないため、金融機関はAI融資審査の導入を敬遠している。

融資審査で問題発生

実際に、機械学習による融資審査で問題が発生している。アルゴリズムは人種や性別にバイアスしている事例が数多く報告されている。アルゴリズムは黒人など特定人種に対し評価が厳しいケースが多く、AIの公正さが問われている。金融機関が意図的に特定人種を締め出すことを意図しているのではなく、アルゴリズムの判定方式が不透明なため起きているケースが多い。

Explainable AIの機能

これに対してZAMLは融資審査結果のプロセスを説明することができる。ただし、ZestFinanceはその詳細を公表していないが、Explainable AIを使うと、モデルが特定の判断を下したとき、そのイベントが起こる確率を計算するとともに、その判定と入力データの関係を示す。例えば、融資審査で不合格となった場合(イベントの発生確率が低い)、申込者の入力データ(信用履歴など)を出力する。

潜在需要を掘り起こす

更に、ZAMLは機械学習の手法でクレジットスコアーは低いが返済能力のある応募者を見つけ出す。ZAMLは応募者を数百から数千の変数で定義しクレジットリスクを査定する。従来手法では融資を受けることができなかったグループを解析しリスクを再評価する。(下のグラフィック、現行方式の査定でリスクが高いと判定された応募者をZAMLで再評価するとリスクが低い応募者が数多くいるのが分かる。これらのグループが新規顧客となる。)

出典: ZestFinance  

現行の融資審査方法

ちなみに、現行の融資審査はFICOスコアーに従って応募者を10ほどのグループに区分して可否を決める。FICOスコアーとは個人の信用度を示す指標で、支払い履歴、負債の状況、負債の種類などを入力して算定する。このためクレジット履歴のない応募者は融資を受けることができない。例えば、米国に移民したばかりの医師は、返済能力はあるが融資を受けることができない。

ZAMLシステム構成

ZAMLは融資審査のためのプラットフォームで、金融機関はこの上で機械学習モデルを生成し、自社で所有している顧客データを使ってモデルを最適化する。また、外部の信用調査会社のデータを使ってモデルを強化する。ZestFinanceはプラットフォームを提供するだけでなく、システムインテグレータとしてシステム開発を支援する。完成したモデルは性能を検証し、業務システムに組み込む。ZAMLはオンプレミスまたはクラウド上に展開され、金融機関が運用しているシステムと連携して稼働する。

Microsoftとの提携

ZestFinanceは2018年12月、Microsoftと共同で融資審査向けにZAMLを提供することを発表した。この提携によりMicrosoftの機械学習クラウド「Azure and Machine Learning Server」(下の写真)でZAMLを利用できる。金融機関はクラウドで機械学習モデルを容易に開発でき、法令に準拠したAI融資審査システムを運用できる。

出典: Microsoft  

AI融資審査の導入に弾みがつく

金融機関はAIによる融資審査を導入したいが、アルゴリズムがブラックボックスで、これを躊躇している。米国では4000万人がクレジット履歴が無くローンを受けることができない。ZAMLを使うと多くの消費者を救済でき、金融機関としても法令に準拠してAI融資事業を拡大できる。Explainable AIをMicrosoft Azureで使えるようになり、AI融資審査の導入に弾みがつくと期待されている。

Google Duplexは本当に便利!! 人間に代わりAIが電話してレストランを予約

人間過ぎるAI「Google Duplex」がリリースされた。Duplexは人間のように会話できるAIで、レストランの店員と話して席を予約する。仮想アシスタント「Google Assistant」に予約を指示すると、背後でDuplexが働いてタスクを完遂する。Duplexを使い始めたが予想以上に便利な機能だ。

出典: VentureClef

レストランを予約

レストランを予約するにはGoogle Assistantにその旨を指示する。「Okay Google」と呼びかけるとGoogle Assistantが起動し、対話を通してレストラン名や日時や人数を告げる(上の写真、左側)。最後に、Google Assistantは予約内容を示し、これを確認して「Yes」というだけで予約プロセスが完了する(上の写真、右側)。

Duplexが電話を掛ける

この直後、Duplexが起動しレストランに電話をする。上記のケースでは開店前で、まだ店は空いてなかった。このため、Google Assistantは「今は営業時間外なので15分後に電話する」とのメッセージを表示し、待機している旨を伝えてきた。その後しばらくすると、「予約が完了した」とのメッセージがスマホのロックスクリーンに示された(下の写真、左側)。このメッセージに従って、Google Assistantをオープンすると予約画面が示され、予約が完了したことを確認できた(下の写真、右側)。ここには、その場所までの道順も表示される。

出典: VentureClef

店員さんの反応

予約時間にレストランに行き、店員さんに名前を告げると、予約を確認してテーブルに案内してくれた。店員さんに、この予約は私ではなくAIがしましたと説明したが、気に留めている様子はなかった。話していくうちに、店員さんは人間と話して予約を受け付けたと思っていたことが分かった。Google Duplexは最初に自分は仮想アシスタントであることを名乗るが、忙しい店員さんは気付かなかったのかもしれない。

小さなレストラン

この日はネパール料理のレストラン「Aroma House」を予約した(下の写真、右端の店)。レストランというよりは小さな食堂で、ネパールの本場の料理が揃っている。このように小さな店はOpenTableなどの予約サービスは扱っていない。予約するには電話しか手段はなく、ここでGoogle Duplexが役に立つ。因みに、ここはネパール人の交流の場となっているのか、狭い店内で多くの家族がひしめき、団欒を楽しんでいるようだった。

出典: VentureClef

Duplexが便利な理由

レストラン予約はOpenTableが定番アプリで、いつでも簡単に予約できる。しかし、OpenTableなどの予約サービスを使っていないレストランは少なくない。Aroma Houseのような小さな食堂だけでなく、腕に自信のあるグルメレストランなども、予約は電話で受け付ける。電話だと、このケースのように営業時間以外だと繋がらない。また、開店中であっても店内が忙しい時には、電話してもつながらない。このような時でもGoogle Duplexは実直にタスクを実行し、そのありがたみを実感する。

Duplexの仕組み

DuplexはGoogle Assistantのバックエンド機能として実装される(下のグラフィックス)。Google Assistantにレストランの予約を指示すると、その背後でDuplexが稼働しこれを実行する。実際に、Duplexが店舗に電話を発信し、相手と対話しながらテーブルの予約を入れる。予約が済むとその内容はGoogle Assistantから利用者に示される。

出典: Google

人間に近づき過ぎたAIの評価

Duplexはレストラン予約の他にヘアサロンの予約もできる。このサービスはサンフランシスコやニューヨークなど地域を限定し、また、Googleブランドのスマホ「Pixel」だけで展開している。一般にリリースされたが、まだ使える範囲は限られている。Duplexは人間過ぎるAIとの批判もあり、その機能を市場がどう受け止めるのか、Googleはそれを検証しながら慎重に展開しているように思える。

Amazon Goがサンフランシスコにオープン、レジ無し店舗が全米に広がる

Amazonは2018年10月、サンフランシスコでレジ無し店舗「Amazon Go」をオープンした(下の写真)。Amazon Goはシアトルで3店舗とシカゴで2店舗が運営されており、サンフランシスコ店は6番目の店舗となる。Amazonは2021年までに3000店舗を開設すると報道されており、全米で急速にレジ無し店舗が普及する勢いだ。

出典: VentureClef  

近未来のショッピング

オープンしたばかりのAmazon Goで買い物をしたが、近未来のショッピングを体験できる。店舗内は高級コンビニという嗜好で、食料品を中心に品ぞろえされていた。Amazon Goにはレジはなく、取り上げた商品を持ってそのまま店を出ることができる。店舗を出てしばらくすると、購入した商品の代金が登録しているクレジットカードから引き落とされた。

QRコードで入店する

Amazon Goは専用アプリで利用する。店舗に入る際にアプリを起動し、表示されたQRコードをリーダーにかざすとゲートのバーが開く(下の写真)。友人や家族と来店した際にも同じ手順であるが、QRコードをかざして同伴者を先に入店させる。(天井に設置されているカメラが利用者だけでなく同伴者も把握する。)

出典: VentureClef  

買いたいものを手に取る

店舗内では、商品を手に取り、買いたいものを自分のバッグに入れたり、手に持って買い物をする(下の写真)。品物を取り上げた時点で利用者の「Virtual Cart(仮想カート)」に商品が入る。気が変わり、取り上げた商品を棚に戻すと、Virtual Cartから取り出される。同伴者も同じ方式で買い物ができる。しかし、商品を取り上げて同伴者に手渡すことは禁止されている。(AIアルゴリズムの教育ができていないためか。)

出典: VentureClef  

買い物が終わると

店舗にはレジはなく、買い物が終わると出口専用のゲートを通るだけで支払い処理が完了する(下の写真)。購入した商品の代金は登録しているクレジットカードから引き落とされる。ゲートの横でAmazon Goスタッフが顧客の質問に答えていたが、万引きなどの不正をチェックしている様子はなかった。(万引きすると売り上げ処理されるので不正行為はできない仕組み。)

出典: VentureClef  

品揃えに特徴あり

Amazon Goはコンビニのように食料品や飲料水を中心に品ぞろえをしている。デリのコーナーもあり、サラダやサンドイッチなどが並んでいる。入口近くの棚には様々な種類のランチボックスが陳列されていた(下の写真)。ランチボックスは日本のお弁当のように、調理された食材が綺麗に配置されている。他に、フルーツやスープやデザートなどもそろっている。出口そばにはテーブルと椅子が用意されており、買ったものをその場で食べることができる。

出典: VentureClef  

ロケーション

Amazon GoはサンフランシスコのFinancial Districtと言われる金融街にオープンした(下の写真、正面ビルの角)。ここに大企業のオフィスが集中しており、周辺にはレストランやデリなどが立ち並ぶ。Amazon Goは忙しい社員のために、食料品やランチボックスを販売する。短い昼休みであるが、レジ待ちの時間が無くなり、ゆっくり食事をすることができる。一方、周囲のデリやファーストフードは売り上げが減る可能性がある。  

出典: VentureClef  

大規模に展開

AmazonはAmazon Goを2018年末までに10店舗開設する。2019年までに50店舗を、2021年までに3000店舗を開設すると報道されている。当初、Amazonはレジ無し店舗の技術を他社にライセンスすると噂されていたが、自ら店舗を運営する戦略であることが明らかになった。この市場ではAmazon Goに刺激され競争が激しくなっている。ベンチャー企業からAIを駆使したレジ無し店舗技術が登場し、店舗での実証実験が進んでいる。

Amazonが小売店舗をつぶしたのか

Amazon.comの登場で多くの小売店舗が売り上げを減らし、また、廃業に追い込まれている。先月、全米で最大規模のデパートであったSearsが130年の歴史に幕を閉じ、会社更生法の適用を受けた。AmazonがSearsを殺したという解釈があるが、小売店舗は進化の努力をしていないとの意見もある。Amazonは小売店舗をテクノロジーで改良し、消費者に快適な買い物環境を提供する戦略を取る。その一つがAmazon Goで消費者はレジ待ちの苦痛から解放される。Amazon Goは小売店舗が成長できる方向を示しているとみることもできる。

Amazon Goの仕組み】

カメラで顧客と商品を認識

天井には数多くのボックスが設置され、ここにカメラが実装されている(下の写真)。ボックスはプロセッサーで、カメラが捉えたイメージの基礎的な解析を実行する。具体的には、人の存在の認識、顧客の特定と追跡、顧客の動作の意味の把握を実行する。顧客が移動すると、別のカメラがこれをフォローする。更に、カメラは棚の商品を認識し、取り上げられた商品の名前を特定する。

出典: VentureClef  

センサーの情報

商品棚には重量計が搭載されている。重量計が棚の重さを計測し、重量が減ると商品が取り上げられたと認識する。カメラが捉えたデータと重量計のデータから、取り上げられた商品を特定する。Amazonはこの方式をSensor Fusionと呼んでいる。

Deep Learningで意味を把握

これら一連のデータはサーバーに送信され、Deep Learningが売り上げを推定する。天井のカメラは顧客の位置を追跡し、特定の商品棚の前にいることを認識し、その挙動 (手を伸ばすなど) を捉える。その棚の商品が取り上げられたことをカメラと重量計で認識する。これら一連の情報をDeep Learningで解析し、特定の顧客が特定の商品を取り上げたことを判定する。

AIがeスポーツにデビュー、5台のAIが5人の人間と戦闘ゲームで対戦

AIは囲碁のチャンピオンを破り、次の目標をeスポーツに定め、開発が進んでいる。eスポーツとはビデオゲームを使った対戦で、スポーツのように試合が実況中継される。いまeスポーツファンの数が急増し、日本のプロ野球に匹敵する規模のビジネスとなっている。OpenAIは「Five」というAIを開発し、eスポーツのトップチームと対戦した。

出典: OpenAI

OpenAIとは

OpenAIとはAI研究の非営利団体で、Elon Muskらにより2015年に設立された。Muskらが10億ドルを拠出し、最初の数年間でその一部が使われる。OpenAIは他の研究機関と連携し、特許や研究結果を公開し、オープンな手法でAI開発を進めている。高度なAIが社会及ぼす危険性を回避するため、安全なAIを開発する。研究テーマの中心は深層強化学習(Deep Reinforcement Learning)で、安全なインテリジェンスの開発を目指す。

ゲームをプレーする「Five」

OpenAIはビデオゲーム「Dota 2」をプレーするAI「Five」を開発した。Dota 2とは、五人のチームが森の中で戦闘を繰り返し、陣取り争いをするゲーム (上の写真)。Fiveは五人の人間を五セットのAIで置き換え、AI同士が連携しながらプレーする。Fiveは国際ゲームイベントで人間のトップチームと対戦し好成績を収めた。

Dota2とは

Dota 2は米国Valve社が開発したビデオゲームで、MOBA(Multiplayer Online Battle Arena)に区分される。MOBAとは、チームメンバーがキャラクターを操作し、相手のチームと対戦する形式を指す。Dota2では、二つのチーム(「Radiant」と「Dire」)が対戦し、相手のタワー「Ancient」を崩壊させたほうが勝ちとなる。チームは五人で構成され、それぞれがキャラクター(Heroと呼ばれる、下の写真、その一部)を操作し、相手のキャラクターを攻撃する。対戦では戦略やチームプレーが求められ、AIにとって極めて複雑なゲームとなる。

eスポーツとは

Dota 2はeスポーツ(eSports)で最も人気のあるゲーム。eスポーツとはビデオゲームを使った対戦で、有名チームの試合が放映され、ファンがそれを観戦する構造となる。eスポーツファンの数が急増し、2018年には2億人を超え、2021年には3億人になると予想されている。eスポーツの収入は2018年は$905.6Mと予想され、巨大ビジネスとなっている。(ゲームの対戦をスポーツと呼ぶには違和感を感じる人も多いが、実際にプレーを見ると激しい格闘技で、デジタル時代のプロレスと言える。)

出典: Dota2 Wiki

The International

eスポーツの最高峰がDota 2のワールドカップともいえる「The International」(下の写真)。今年はカナダ・バンクーバーで開催され、18チームがトーナメント形式で対戦した。特設会場のステージで競技が行われ、ゲーム画面が大型モニターに映し出される。今年は、欧州チーム「OG」が中国チーム「PSG.LGD」を3対2で破り優勝。対戦の模様はYouTubeなどで中継され、観戦者数は6679万人に上った。これはゴルフ「Masters」の観戦者数に匹敵し、世界中で人気が広まっている。

Fiveの対戦結果

The Internationalという晴れの舞台で、Fiveはエグジビションゲームとして、プロチームと対戦した。Fiveはブラジルチーム「paiN Gaming」及び中国チーム「rOtK」と対戦したが、どちらも1対0で敗戦した。paiN Gamingとの対戦で、序盤は人間チームが優勢であったが、中盤はAIチームが形勢を逆転した。しかし、終盤で人間チームの戦略的な攻撃をうけ敗戦を期した。人間の技には及ばなかったが、対戦時間は51分と長く(平均は45分)、接戦の末の敗戦となった。

出典: Dota2 Wiki  

Fiveの概要

Fiveはニューラルネットワーク(Long Short Term Memory、LSTM)で構成され、深層強化学習の手法で教育された。LSTMはRecurrent Neural Network方式のネットワークで、記憶機能があり、長期間にわたる相関関係を処理するのに適している。アルゴリズムはAI同士の対戦を通じて、Dota2のプレーの仕方を学習した。

ゲームをプレーする理由

OpenAIがDota 2をプレーするAIを開発する理由は、ゲーム環境が実社会によく似ているため。Dota 2は、森林の中で敵味方が入り乱れ、攻撃と防御を繰り返す。勝つためには作戦を立て、AI同士のチームワークが要求される。Fiveはゲームという仮想社会で技術を習得するが、ここで培った技法は実社会に応用できる。ロボットや自動運転車が家庭や街中で稼働するとき、Fiveで習得した技術が役に立つ。

囲碁の次はeスポーツ

Google DeepMindはAlphaGoで囲碁のチャンピオンを破り世界を驚かせた。囲碁は複雑なゲームであるが、Dota 2はそれよりはるかに複雑なゲームとなる。囲碁は150手ほどで勝敗が決まるが、Dota 2は2万手と長い。また、囲碁は正規化された空間でプレーするが、Dota2は人間社会を模したカオスな環境で実行される。囲碁を制したAIは、次はeスポーツでトップチームと対戦し、勝利することを目標に据えている。