カテゴリー別アーカイブ: 人工知能

GANは極めて精巧なフェイクイメージを生成、作画メカニズムが分かりExplainable AIの研究が進展

AIは社会生活に多大な恩恵をもたらすが、その中身はブラックボックスで処理のプロセスが見えない。このためAIを安心して利用することができず、普及の足かせになっている。今年は説明責任を果たせるAIの研究が進む年となる。MITの研究チームはGenerative Adversarial Network (GAN)のアルゴリズムを解明し、AIの思考プロセスを明らかにした。

出典: Karras et al. (2017)

フェイクのセレブ

GANは写真撮影したように架空のオブジェクトをリアルに描き出すことで注目を受けている。例えば、セレブの写真をGANに入力しネットワークを教育すると、アルゴリズムは仮想のセレブを描き出す(上の写真)。どこかで見かけた顔のように思えるがこれらは実在の人物ではない。GANがセレブというコンセプトを学び想像で描いたもので、これらのイメージを検索しても該当する人物はでてこない。リアルとフェイクを見分けることができずGANに対して気味悪さを感じるが、AI研究の主要テーマとなっている。

AIアートが高値で売れる

GANが芸術作品を生み出し、それが高値で落札されたことで、一躍その手法に関心が集まった。フランスのAI芸術家集団「Obvious」はGANで絵画を生成する手法で芸術の普及に貢献している。その代表作「Edmond De Belamy」がChristie’sのオークションで$435,000で落札された(下の写真)。AIが生成した絵画に高値が付き市場を驚かせた。作品はある家族(Belamy Family)を描いたもので11点が制作され、その一点がこのEdmond De Belamy である。

出典: Christie’s

AIアートの著作権

AIが描いた絵画にどれだけの芸術的価値があるかが議論になっているが、同時に、AIが制作した作品の著作権は誰に帰属するかも問題となっている。このAIアートを制作したのはObvious社で、GANに古典的な肖像画15,000点を読み込ませアルゴリズムを教育した。GANは肖像画というコンセプトを学びアルゴリズムは新しい作品を創作した。

アルゴリズム開発者か利用者か

Obvious社が使用したGANはRobbie Barratという人物が開発し、オープンソースとしてGitHubに登録されている。誰でも自由にこのGANを使うことができるが、Obvious社はGAN開発者には触れず、ルール違反が指摘されている。そもそも、生成された絵画の著作権はアルゴリズム開発者にあるのか、それともアルゴリズム利用者にあるのか、議論となっている。

MIT-IBM Watson AI Lab

GANに関する多くの問題が未解決であるが、時代を変える技術として注目されている。また、GANのアルゴリズムはブラックボックスで、作画の仕組みを解明する動きが広がっている。MITの研究グループ「MIT-IBM Watson AI Lab」はGANのアルゴリズムの解明を進め、GANの思考メカニズムを明らかにした。GANはどのように学習し、どのように判断するかが特定でき、この研究がAIのブラックボックスを解明する大きな第一歩となった。

研究成果

研究成果は「GAN Dissection: Visualizing and Understanding Generative Adversarial Networks」として発表された。この研究でGANがオブジェクトを把握するメカニズムを解析し、それを可視化して示した。具体的には、ニューラルネットワークの中で、どのレイヤーのどのニューロン(ユニットと呼ぶ)が特定のオブジェクト(木や雲など)の生成に関係しているかを突き止めた。

ユニットの機能をオン・オフ

更に、特定したユニットの機能をオン・オフさせ、その効果を検証した。特定のユニットの機能を停止させることで、オブジェクトを取り去ることができることを示した。反対に、そのユニットの機能を強化することで、オブジェクトを追加できることも示した。(下の写真がその事例、左端がオリジナルのイメージで、木に関連するユニットの機能をオフ・オンすることで、木を削除(中央)したり、追加(右端)できる。)

出典: MIT-IBM Watson AI Lab

アルゴリズムは常識を学ぶ

特定されたユニットはオブジェクトを生成するだけでなく、オブジェクトに関する常識も学んでいる。例えば、ドアを追加する際には、建物のスタイルにマッチしたドアを生成する。更に、ドアを建物以外のオブジェクト(例えば空)に追加しようとしても、アルゴリズムはこれを拒否する(下の写真)。アルゴリズムは教育の過程で人間のように常識を得ることが示された。

出典: MIT-IBM Watson AI Lab  

応用事例

この技法を使うとイメージを容易に変更することができる。ユニットと家具や人物の関係を把握することで、イメージの品質を向上することができる。例えば、GANが生成した寝室(下の写真、左側上段)から家具や小物を削除することで綺麗なイメージ(下の写真、左側下段)が出来上がる。また、GANが生成した会議室(下の写真、右側上段)から人物や窓を取り除き新しいイメージの会議室(下の写真、右側下段)を生成できる。これらはピクセルを変換するのではなく、ニューラルネットワークの特定ユニットを操作することでイメージを変換する。

出典: David Bau et al

Explainable AIの研究が進展

このようにニューラルネットワークのユニットを操作することで、アルゴリズムがイメージを生成する仕組みの解明につながる。ニューラルネットワークは学習を積むことで、特定のオブジェクトを描くユニットを構成することが分かった。ドアを描くニューロンのグループを形成し、このユニットはドアの意味も理解し、背景にマッチしたドアを描く。高値で売れるAIアートを生成するアリゴリズムの開発に結び付くのか、ブラックボックスに光があたり、Explainable AIの研究が進み始めた。

GoogleはHome Hubの出荷を開始、AIスピーカーがAIタブレットに進化

Googleはディスプレイ付きAIスピーカー「Google Home Hub」の販売を開始した。早速使ってみたがAIスピーカーの新しい可能性を感じる。GoogleはHome Hubをスマートホームを管理するハブと位置付けている。Home HubはAIタブレットという印象で、AIアシスタントが次の次元にアップグレードされたことを感じる。

出典: VentureClef

マクロコマンド

Home Hubに「おはよう」と語りかけると、一日の予定をブリーフィングする。天気予報に始まり、今日のスケジュールや道路の渋滞情報をディスプレイに示す(下の写真)。また、ニュースを登録しておくと、それらが順次ディスプレイで再生される。これは「Routines」という機能で、一言指示すると、登録している複数のコマンドが順次実行される。

出典: VentureClef

ニュース

当初、ニュースはポッドキャスト(音声配信)であったが、今ではビデオ形式に進化した。朝食を食べながらHome Hubで最新ニュースを見るのが日課となった。ニュースの種類も大幅に増えた。CNNなど大手メディアから(下の写真)、地元サンフランシスコのテレビ局のニュースも配信される。CNBCはビジネスに、TechCrunchはテクノロジーに特化したニュースを配信する。

出典: VentureClef

コントロール

Home Hubは名前が示す通り、スマートホームのハブで、家の中のデバイスを制御する(下の写真)。インターフェイスはタッチで、画面のアイコンに触って操作する。「Lights」はスマートライトを制御する機能で、電灯をオンオフしたり、光量を変えることができる。「Broadcast」を使うとHome Hubがインターコムになり、他のHomeと通話できる。「Camera」にタッチすると玄関先のビデオ画像が配信される。

出典: VentureClef

調理方法

Home Hubに質問すると回答をディスプレイでビジュアルに表示する。Home Hubをキッチンに置いているので、調理方法を質問することが多い。例えば、野菜の煮込み料理「ラタトゥイユ」の作り方を聞くとそのレシピをステップごとに示す。また、パイナップルの皮のむき方を尋ねると、ビデオでそれを表示する(下の写真)。ここではアプリ「Allrecipes」が使われている。

出典: VentureClef

検索

会話の中で議論となったことをHome Hubに尋ねると、ディスプレイにその答えが示される。女優Ariana Grandeのアイメイク「Cat Eye」について尋ねると、メイクの手順がYouTubeに示される。また、話題のお菓子「Unicorn Cake」とは何かと尋ねると、その写真がディスプレイに示される(下の写真)。スマホを取り出さなくても手軽に回答を得ることができるし、その結果をみんなで見ることができる。

出典: VentureClef

音楽

Homeと同様に、Home HubでGoogle MusicやPandoraなど音楽配信サービスを通して音楽を聴くことができる。ディスプレイには演奏中の音楽のタイトルやアーティストの名前が示される(下の写真)。今まではAIスピーカーからテレビに音楽を配信して聴いていた。このために配信デバイス「Chromecast」が必要で、これをテレビに装着する。Home HubではChromecastは不要で、そのまま手軽に音楽やビデオを再生できる。

出典: VentureClef

Ambient Mode

Home Hubを使っていないときはディスプレイがアートギャラリーになり作品が表示される。ここには名画の他に、印象的な写真やストリートアートが表示される(下の写真)。また、「Fullscreen Clock」を選ぶと、スクリーン全体が時計になる。ディスプレイの輝度は周りの光量に応じて自動で調整される。夜になり周りが暗くなると自動でスリープモードとなり、デジタル時計が表示される。

出典: VentureClef

写真アルバム

Home Hubで便利な機能が撮影した写真を表示できること。Ambient Modeで「Google Photos」を選択すると写真アルバムが表示される。「Family & Friends」のオプションを選択すると家族や友人やペットが写った写真を表示する。音声で指示するとその写真を表示することもできる。例えば「サンフランシスコで撮った写真」と指示すると、それらが画面に表示される(下の写真)。

出典: VentureClef

監視カメラ

Home Hubは監視カメラと連携し、玄関先の様子をストリーミングする。ドアベル「Nest Hello」と連携すると、チャイムが押されると自動で玄関先のビデオ画像を表示する(下の写真)。ビデオで来訪者を確認してドアを開けることができるので安心感が格段に向上する。ちなみに、知人が訪ねてくるとHome Hubは来訪者の名前を告げる。

出典: VentureClef

タッチか言葉か

GoogleはHome Hubをスマートホームを制御するデバイスと位置付ける。操作はタッチインターフェイスで画面に触りながら操作する。実際に使ってみるとタッチより言葉のほうが便利で、Home Hubへの指示はほとんど言葉でする。つまり、Home Hubをハブとしてでなく、AIディスプレイとして利用している。ちなみに、指示した言葉はディスプレイに示され(下の写真)、どう聞こえているかが分かり会話がしっくりくる。

出典: VentureClef

競争が激化

ディスプレイ付きAIスピーカーは対話が言葉だけでなく、グラフィカルに示され、コミュニケーションの質がリッチになる。この市場ではAmazonが先駆者で2017年6月に「Echo Show」を出荷。Facebookは2018年11月、AIスピーカー「Portal」を投入したが、ここにはディスプレイが付いている。AIスピーカーはAIタブレットに進化を遂げ、この市場で競合が激しくなっている。

AI融資審査はブラックボックスで安全に使えない、いま判定結果を説明できるExplainable AIが登場

AIで融資を審査する手法は銀行業務を自動化する切り札として注目されている。しかし、金融機関はAI融資審査の導入をためらっている。これはアルゴリズムがブラックボックスで、審査したロジックが明らかでなく、銀行は消費者に判定理由を説明でいないため。いま融資審査の内容を説明できるAIが登場し注目を集めている。

出典: Google

説明できるAI融資審査

ZestFinanceはロサンジェルスに拠点を置くベンチャー企業で、融資サービスのAIプラットフォームを開発している(上の写真)。この製品は「Zest Automated Machine Learning (ZAML)」と呼ばれ、融資申込者のリスクを機械学習の手法で査定する。ZAMLの特長はアルゴリズムが導いた結果を説明できること。これは一般に「Explainable AI(説明できるAI)」と呼ばれ、政府法令に準拠してAIが融資審査を実行する。

融資審査と説明責任

機械学習モデルを使うと融資判定を高精度に実施できるが、この手法はAIが抱える根本的な問題を抱えている。これはAIがブラックボックスであることで、機械学習モデルは審査結果を説明できない。融資審査では応募者がローンを受けることができなかった場合、その理由の説明が求められる。また、金融機関はアルゴリズムが法令に準拠していることを立証する責任がある。これらの要件を満たすことができないため、金融機関はAI融資審査の導入を敬遠している。

融資審査で問題発生

実際に、機械学習による融資審査で問題が発生している。アルゴリズムは人種や性別にバイアスしている事例が数多く報告されている。アルゴリズムは黒人など特定人種に対し評価が厳しいケースが多く、AIの公正さが問われている。金融機関が意図的に特定人種を締め出すことを意図しているのではなく、アルゴリズムの判定方式が不透明なため起きているケースが多い。

Explainable AIの機能

これに対してZAMLは融資審査結果のプロセスを説明することができる。ただし、ZestFinanceはその詳細を公表していないが、Explainable AIを使うと、モデルが特定の判断を下したとき、そのイベントが起こる確率を計算するとともに、その判定と入力データの関係を示す。例えば、融資審査で不合格となった場合(イベントの発生確率が低い)、申込者の入力データ(信用履歴など)を出力する。

潜在需要を掘り起こす

更に、ZAMLは機械学習の手法でクレジットスコアーは低いが返済能力のある応募者を見つけ出す。ZAMLは応募者を数百から数千の変数で定義しクレジットリスクを査定する。従来手法では融資を受けることができなかったグループを解析しリスクを再評価する。(下のグラフィック、現行方式の査定でリスクが高いと判定された応募者をZAMLで再評価するとリスクが低い応募者が数多くいるのが分かる。これらのグループが新規顧客となる。)

出典: ZestFinance  

現行の融資審査方法

ちなみに、現行の融資審査はFICOスコアーに従って応募者を10ほどのグループに区分して可否を決める。FICOスコアーとは個人の信用度を示す指標で、支払い履歴、負債の状況、負債の種類などを入力して算定する。このためクレジット履歴のない応募者は融資を受けることができない。例えば、米国に移民したばかりの医師は、返済能力はあるが融資を受けることができない。

ZAMLシステム構成

ZAMLは融資審査のためのプラットフォームで、金融機関はこの上で機械学習モデルを生成し、自社で所有している顧客データを使ってモデルを最適化する。また、外部の信用調査会社のデータを使ってモデルを強化する。ZestFinanceはプラットフォームを提供するだけでなく、システムインテグレータとしてシステム開発を支援する。完成したモデルは性能を検証し、業務システムに組み込む。ZAMLはオンプレミスまたはクラウド上に展開され、金融機関が運用しているシステムと連携して稼働する。

Microsoftとの提携

ZestFinanceは2018年12月、Microsoftと共同で融資審査向けにZAMLを提供することを発表した。この提携によりMicrosoftの機械学習クラウド「Azure and Machine Learning Server」(下の写真)でZAMLを利用できる。金融機関はクラウドで機械学習モデルを容易に開発でき、法令に準拠したAI融資審査システムを運用できる。

出典: Microsoft  

AI融資審査の導入に弾みがつく

金融機関はAIによる融資審査を導入したいが、アルゴリズムがブラックボックスで、これを躊躇している。米国では4000万人がクレジット履歴が無くローンを受けることができない。ZAMLを使うと多くの消費者を救済でき、金融機関としても法令に準拠してAI融資事業を拡大できる。Explainable AIをMicrosoft Azureで使えるようになり、AI融資審査の導入に弾みがつくと期待されている。

Google Duplexは本当に便利!! 人間に代わりAIが電話してレストランを予約

人間過ぎるAI「Google Duplex」がリリースされた。Duplexは人間のように会話できるAIで、レストランの店員と話して席を予約する。仮想アシスタント「Google Assistant」に予約を指示すると、背後でDuplexが働いてタスクを完遂する。Duplexを使い始めたが予想以上に便利な機能だ。

出典: VentureClef

レストランを予約

レストランを予約するにはGoogle Assistantにその旨を指示する。「Okay Google」と呼びかけるとGoogle Assistantが起動し、対話を通してレストラン名や日時や人数を告げる(上の写真、左側)。最後に、Google Assistantは予約内容を示し、これを確認して「Yes」というだけで予約プロセスが完了する(上の写真、右側)。

Duplexが電話を掛ける

この直後、Duplexが起動しレストランに電話をする。上記のケースでは開店前で、まだ店は空いてなかった。このため、Google Assistantは「今は営業時間外なので15分後に電話する」とのメッセージを表示し、待機している旨を伝えてきた。その後しばらくすると、「予約が完了した」とのメッセージがスマホのロックスクリーンに示された(下の写真、左側)。このメッセージに従って、Google Assistantをオープンすると予約画面が示され、予約が完了したことを確認できた(下の写真、右側)。ここには、その場所までの道順も表示される。

出典: VentureClef

店員さんの反応

予約時間にレストランに行き、店員さんに名前を告げると、予約を確認してテーブルに案内してくれた。店員さんに、この予約は私ではなくAIがしましたと説明したが、気に留めている様子はなかった。話していくうちに、店員さんは人間と話して予約を受け付けたと思っていたことが分かった。Google Duplexは最初に自分は仮想アシスタントであることを名乗るが、忙しい店員さんは気付かなかったのかもしれない。

小さなレストラン

この日はネパール料理のレストラン「Aroma House」を予約した(下の写真、右端の店)。レストランというよりは小さな食堂で、ネパールの本場の料理が揃っている。このように小さな店はOpenTableなどの予約サービスは扱っていない。予約するには電話しか手段はなく、ここでGoogle Duplexが役に立つ。因みに、ここはネパール人の交流の場となっているのか、狭い店内で多くの家族がひしめき、団欒を楽しんでいるようだった。

出典: VentureClef

Duplexが便利な理由

レストラン予約はOpenTableが定番アプリで、いつでも簡単に予約できる。しかし、OpenTableなどの予約サービスを使っていないレストランは少なくない。Aroma Houseのような小さな食堂だけでなく、腕に自信のあるグルメレストランなども、予約は電話で受け付ける。電話だと、このケースのように営業時間以外だと繋がらない。また、開店中であっても店内が忙しい時には、電話してもつながらない。このような時でもGoogle Duplexは実直にタスクを実行し、そのありがたみを実感する。

Duplexの仕組み

DuplexはGoogle Assistantのバックエンド機能として実装される(下のグラフィックス)。Google Assistantにレストランの予約を指示すると、その背後でDuplexが稼働しこれを実行する。実際に、Duplexが店舗に電話を発信し、相手と対話しながらテーブルの予約を入れる。予約が済むとその内容はGoogle Assistantから利用者に示される。

出典: Google

人間に近づき過ぎたAIの評価

Duplexはレストラン予約の他にヘアサロンの予約もできる。このサービスはサンフランシスコやニューヨークなど地域を限定し、また、Googleブランドのスマホ「Pixel」だけで展開している。一般にリリースされたが、まだ使える範囲は限られている。Duplexは人間過ぎるAIとの批判もあり、その機能を市場がどう受け止めるのか、Googleはそれを検証しながら慎重に展開しているように思える。

Amazon Goがサンフランシスコにオープン、レジ無し店舗が全米に広がる

Amazonは2018年10月、サンフランシスコでレジ無し店舗「Amazon Go」をオープンした(下の写真)。Amazon Goはシアトルで3店舗とシカゴで2店舗が運営されており、サンフランシスコ店は6番目の店舗となる。Amazonは2021年までに3000店舗を開設すると報道されており、全米で急速にレジ無し店舗が普及する勢いだ。

出典: VentureClef  

近未来のショッピング

オープンしたばかりのAmazon Goで買い物をしたが、近未来のショッピングを体験できる。店舗内は高級コンビニという嗜好で、食料品を中心に品ぞろえされていた。Amazon Goにはレジはなく、取り上げた商品を持ってそのまま店を出ることができる。店舗を出てしばらくすると、購入した商品の代金が登録しているクレジットカードから引き落とされた。

QRコードで入店する

Amazon Goは専用アプリで利用する。店舗に入る際にアプリを起動し、表示されたQRコードをリーダーにかざすとゲートのバーが開く(下の写真)。友人や家族と来店した際にも同じ手順であるが、QRコードをかざして同伴者を先に入店させる。(天井に設置されているカメラが利用者だけでなく同伴者も把握する。)

出典: VentureClef  

買いたいものを手に取る

店舗内では、商品を手に取り、買いたいものを自分のバッグに入れたり、手に持って買い物をする(下の写真)。品物を取り上げた時点で利用者の「Virtual Cart(仮想カート)」に商品が入る。気が変わり、取り上げた商品を棚に戻すと、Virtual Cartから取り出される。同伴者も同じ方式で買い物ができる。しかし、商品を取り上げて同伴者に手渡すことは禁止されている。(AIアルゴリズムの教育ができていないためか。)

出典: VentureClef  

買い物が終わると

店舗にはレジはなく、買い物が終わると出口専用のゲートを通るだけで支払い処理が完了する(下の写真)。購入した商品の代金は登録しているクレジットカードから引き落とされる。ゲートの横でAmazon Goスタッフが顧客の質問に答えていたが、万引きなどの不正をチェックしている様子はなかった。(万引きすると売り上げ処理されるので不正行為はできない仕組み。)

出典: VentureClef  

品揃えに特徴あり

Amazon Goはコンビニのように食料品や飲料水を中心に品ぞろえをしている。デリのコーナーもあり、サラダやサンドイッチなどが並んでいる。入口近くの棚には様々な種類のランチボックスが陳列されていた(下の写真)。ランチボックスは日本のお弁当のように、調理された食材が綺麗に配置されている。他に、フルーツやスープやデザートなどもそろっている。出口そばにはテーブルと椅子が用意されており、買ったものをその場で食べることができる。

出典: VentureClef  

ロケーション

Amazon GoはサンフランシスコのFinancial Districtと言われる金融街にオープンした(下の写真、正面ビルの角)。ここに大企業のオフィスが集中しており、周辺にはレストランやデリなどが立ち並ぶ。Amazon Goは忙しい社員のために、食料品やランチボックスを販売する。短い昼休みであるが、レジ待ちの時間が無くなり、ゆっくり食事をすることができる。一方、周囲のデリやファーストフードは売り上げが減る可能性がある。  

出典: VentureClef  

大規模に展開

AmazonはAmazon Goを2018年末までに10店舗開設する。2019年までに50店舗を、2021年までに3000店舗を開設すると報道されている。当初、Amazonはレジ無し店舗の技術を他社にライセンスすると噂されていたが、自ら店舗を運営する戦略であることが明らかになった。この市場ではAmazon Goに刺激され競争が激しくなっている。ベンチャー企業からAIを駆使したレジ無し店舗技術が登場し、店舗での実証実験が進んでいる。

Amazonが小売店舗をつぶしたのか

Amazon.comの登場で多くの小売店舗が売り上げを減らし、また、廃業に追い込まれている。先月、全米で最大規模のデパートであったSearsが130年の歴史に幕を閉じ、会社更生法の適用を受けた。AmazonがSearsを殺したという解釈があるが、小売店舗は進化の努力をしていないとの意見もある。Amazonは小売店舗をテクノロジーで改良し、消費者に快適な買い物環境を提供する戦略を取る。その一つがAmazon Goで消費者はレジ待ちの苦痛から解放される。Amazon Goは小売店舗が成長できる方向を示しているとみることもできる。

Amazon Goの仕組み】

カメラで顧客と商品を認識

天井には数多くのボックスが設置され、ここにカメラが実装されている(下の写真)。ボックスはプロセッサーで、カメラが捉えたイメージの基礎的な解析を実行する。具体的には、人の存在の認識、顧客の特定と追跡、顧客の動作の意味の把握を実行する。顧客が移動すると、別のカメラがこれをフォローする。更に、カメラは棚の商品を認識し、取り上げられた商品の名前を特定する。

出典: VentureClef  

センサーの情報

商品棚には重量計が搭載されている。重量計が棚の重さを計測し、重量が減ると商品が取り上げられたと認識する。カメラが捉えたデータと重量計のデータから、取り上げられた商品を特定する。Amazonはこの方式をSensor Fusionと呼んでいる。

Deep Learningで意味を把握

これら一連のデータはサーバーに送信され、Deep Learningが売り上げを推定する。天井のカメラは顧客の位置を追跡し、特定の商品棚の前にいることを認識し、その挙動 (手を伸ばすなど) を捉える。その棚の商品が取り上げられたことをカメラと重量計で認識する。これら一連の情報をDeep Learningで解析し、特定の顧客が特定の商品を取り上げたことを判定する。