月別アーカイブ: 2021年10月

Facebookは社名を「Meta」に変更しメタバース企業となる、3D仮想空間で人々が交流するプラットフォームを開発する

Facebookは、開発者会議「Connect 2021」で、ソーシャルメディア企業からメタバース(Metaverse)企業になることを発表した。CEOのMark Zuckerbergがメタバース空間で明らかにしたもので(下の写真)、これに伴い、社名も「Facebook」から「Meta」に変更する。Facebookは創設以来最大の危機に直面しており、社名を変えることで、新生企業として再出発する。一方、Metaが開発しているメタバースは、従来の技法から大きく進化したもので、スマホの次のプラットフォームになる可能性を秘めている。

出典: Meta

メタバースとは

メタバースとは、インターネットに構築された3D仮想社会で、ここに人々が集い交流する。従来のVR空間とは異なり、メタバースでは利用者が仮想社会と連動し、そこに存在している感覚「Social Presence」を覚える。次世代のソーシャルネットワークはメタバースに構築される。Facebookは、メタバースをモバイル・インターネットの次のプラットフォームとして位置付け、技術的に大きな飛躍となる。但し、メタバースは今すぐに使えるサービスではなく、完成までに時間を要すことも明らかにした。Facebookはそのビジョンを示したもので、これに向かって技術開発が進んでいる。 (下の写真、メタバースの事例、無重力空間で友人同士がアバターを介して交流している様子。)

出典: Meta

家庭向けのメタバース

Zuckerbergは基調講演で、メタバースの様々な利用方法を紹介した。その一つが家庭向けのメタバースで、「Horizon Home」と呼ばれる。これはVRヘッドセット「Oculus」を着装して利用するサービスで、複数の友人がメタバースに集い、それぞれのアバターを介して交流する(下の写真)。お互いに会話するだけでなく、グループでゲームをプレーするなど、アバター同士がインタラクションできることに特徴がある。

出典: Meta

企業向けのメタバース

今回の発表に先立ち、Facebookは企業向けのメタバースを発表している。これは、「Horizon Workrooms」と呼ばれ、遠隔勤務向けのコラボレーションシステムとなる。社員はアバターを介してビデオ会議に出席し、他の社員とインタラクションしながら、会議を進める(下の写真)。ホワイトボードに説明資料を表示するなど、リアルのオフィスを仮想空間に構築する。

出典: Meta

メタバースでゲームをプレー

ゲームはメタバースの重要なアプリケーションで、既に数多くのコンテンツが開発されている。ARグラスを着装すると、海外に住む友人とチェスを対戦することができる(下の写真)。また、VRヘッドセットを着装すると、没入型のゲームを体験できる。OculusはVRゲームを数多く開発しおり、ヒット商品は「Beat Saber」で、飛んでくる物体を刀で切り落とす。

出典: Meta

メタバースでフィットネス

近年は、ジムでエクササイズをする代わりに、自宅でVRヘッドセットを着装してトレーニングする人が増えた。フィットネスバイクは、仮想のスタジオで、インストラクターの指示に従ってペダルを漕ぐ(下の写真)。また、「Supernatural Boxing」シリーズは、VRボクシングを通したエクササイズで、巨大なモンスターと対戦する。

出典: Meta

仮想空間で教育

メタバースは教育プラットフォームとして使われる。ARグラスを着装して土星を見ると、目の前にその構造が描写される。土星の環の中に入ると、無数の氷の塊で構成されていることが分かる。また、VRヘッドセットを着装すると、古代ローマの都市に降り立つことができる(下の写真)。市場で売られている魚や果物を見て、街の賑わいを感じる。また、建造物のアーキテクチャや建設方法を学ぶことができる。

出典: Meta

社名の変更

Zuckerbergは、社名を「Facebook」から「Meta」に変更したことを明らかにし、その理由をメタバース企業に転身するためと説明した。Metaはギリシャ語で「Beyond」という意味で、ソーシャルネット―ワークの次の章が始まることを示している。既存サービスの名称はそのままで、Metaの配下でFacebook、Instagram、WhatsAppがビジネスユニットとして事業を継続する。(下の写真、本社の前のパネルは新しいロゴに置き換わっている。)

出典: Meta

Facebook Papers

いま、Facebookは創業以来最大の危機に直面している。Facebookの元社員が、社内資料を公開し、会社は利用者の安全を犠牲に利益を上げていると告発した。持ち出された大量の社内資料は「Facebook Papers」と呼ばれ、Facebookのアルゴリズムやビジネス慣行が記載されている。Zuckerbergはこの危機を乗り越えるため、社名をMetaとし、新生企業として出直しを図り、社会からの批判を避ける思惑もある。

Facebookは人間の日常生活でAIを教育、ARグラスに搭載しアルゴリズムが利用者の視覚や聴覚をエンハンス

Facebookは人間の視線で周囲の状況を把握するAIの研究を開始した。このプロジェクトは「Ego4D」と呼ばれ、人間の視線で捉えたデータ(下の写真)でアルゴリズム教育することで、AIは実社会でインテリジェントな能力を発揮する。これをARグラスやVRヘッドセットに搭載することで、AIがアシスタントとなり利用者の視覚や聴覚をエンハンスする。また、これをロボットに搭載すると、実社会で自律的に稼働する機能を得ることができる。

出典: Facebook

当事者の視点で環境を理解

コンピュータビジョンの進化でAIはオブジェクトを認識しその種別を正確に判定する。しかし、これらのAIは第三者視点(third-person perspective、下の写真左側)で開発されたもので、傍観者としてオブジェクトを判定する。これに対し、Facebookは第一者視点(first-person perspective、右側)でアルゴリズムを教育する研究を開始した。この技法は「Egocentric Perception」と呼ばれ、開発されたAIは当事者の視点でオブジェクトを判定できるようになる。これをARグラスやVRヘッドセットに搭載すると、AIがアシスタントとして周囲の状況を把握し最適な助言を行う。また、ロボットへ適用すると、AIが視覚となり実社会の中を自律的に稼働するシステムにつながる。(下の写真はサイクリングに関する画像認識の判定結果。第三者視点で開発されたAIの判定精度は高いが(左側)、第一者視点で開発されたAIの判定精度はまだ低い(右側)。)

出典: Facebook

開発したAIの利用方法

FacebookはARグラスの開発を進めており、その第一弾としてスマートグラス「Ray-Ban Stories」を発表した。これから製品化されるARグラスには第一者視点のAIが搭載され、インテリジェントなアシスタントとして使われる。AIが周囲のオブジェクトを見てその種別などを把握する。例えば、ARグラスで日常生活を録画しておくと、AIはこれを解析して利用者の質問に回答する。「祖母の腕時計をどこに片づけた」と質問すると、AIは過去のビデオを解析し、ARグラスにその場所を表示する(下の写真)。

出典: Facebook

大学との共同開発

利用者の視点でオブジェクトを判定するAIを開発するためには、アルゴリズムを教育するための大量のデータが必要になる。このため、Facebookは各国の大学と共同研究をすすめ、利用者視点のデータを集約して教育のためのデータセットを開発している(下の写真)。世界から13の大学が参加しているが、日本からは東京大学がこのプロジェクトに加わっている。

出典: Facebook

データセットの構成

開発者はスマートグラスなどを着装してカメラで日常生活を録画する。これら録画されたビデオにその意味を付加して、生活の中での動きとその説明文のペアを作る。これらのビデオを集約したデータセットを構築し、これらのデータを使ってAIを教育するプロセスとなる。日常生活の様式は国により異なり、Facebookは主要国の大学と共同でこれを進めている。(下の写真;皿洗いを撮影したビデオで、左からサウジアラビア、イタリア、ルワンダの事例となる。)

出典: Facebook

アルゴリズム教育

次は、生成したデータセットを使ってアルゴリズムを教育するステップとなる。ここがAI開発のコアで、Facebookはこれを研究課題として提示し、大学や研究機関の研究者がこれに挑戦する形式をとる。チャレンジは五つのテーマから構成される。

  • イベントの記憶(Episodic memory): AIはいつどこで何があったかを把握。(上述の事例の通り、祖母の腕時計をどこに格納したかを把握。)
  • 予測(Forecasting): AIはビデオをみて次のアクションを予測。
  • 手作業(Hand and object manipulation): AIは手の動きからどんな作業をしているかを把握。(ドラムを演奏する方法を把握し、それを教える(下の写真)。)
  • 音声映像の記録(Audio-visual diarization): AIはだれが何を言ったかを把握。
  • 人間関係(Social interaction): AIは誰と誰が会話しているかなど人間関係を把握。
出典: Facebook

AIビジョンの進化

AI開発でオブジェクトの形状を把握するコンピュータビジョンが急成長しているが、アルゴリズムを教育するためのデータセットが技術進化を支えている(下の写真)。AI開発の初期には手書き文字を判読するためのデータセット「MNIST」が開発された。コンピュータビジョンが急速に進化したのは、イメージのデータセット「ImageNet」の存在が大きい。ここには大量の写真とタグが格納され、これによりAIが人間の視覚を上回った。これらはすべて第三者視点のデータセットで、Ego4Dが第一者視点の最初のデータセットとなる。

出典: Facebook  

Microsoftは超リアルな3Dフェイスを生成、顔写真の代わりに合成メディアで顔認識AIを教育できることを実証

Microsoftは合成メディア(Synthetic Media)の手法で3Dフェイスを生成した(下の写真)。これは顔認識AIを教育するためのモデルで、実物と見分けのつかない超リアルな3Dフェイスが生成された。今まではセレブなど実在の人物の顔写真を使って顔認識AIを教育してきた。しかし、これらの写真は本人の了解を取らないで無断で使われ、個人のプライバシーを侵害するとして社会問題となっている。このため、Microsoftは、これらのデータセットを消去し、合成メディアの手法で3Dフェイスを作成し、これをアルゴリズム教育に活用できることを実証した。

出典: Erroll Wood et al.

研究の意義

倫理的に顔認識AIを教育するために、人工的に3Dフェイスを生成し、これでアルゴリズムを教育する手法が取られてきた。しかし、合成データで教育するとアルゴリズムの判定精度が落ちるという問題が発生する。しかし、Microsoftは高品質の合成データを生成し、教育したアルゴリズムは写真データで教育したものと精度が変わらないことを示した。つまり、顔認識AIを教育するために、ネット上の顔写真をスクレイピングすることは不要で、合成データで倫理的に開発できる道筋をつけた。

顔認識AIの精度

合成データで顔認識アルゴリズムを教育すると、判定精度は写真で教育した場合と同等であることが示された。顔認識アルゴリズムは顔のパーツを判定する機能(Face Pursing)があり、鼻や口や目やまつ毛などを識別して色で示す(下の写真左側)。実際にベンチマークすると、写真で教育したものとほぼ同等の精度となることが証明された。また、顔認識アルゴリズムは顔の特徴量(Landmarks)を特定する機能があり、合成データで教育すると10倍精密なランドマークを生成できる(右側)。

出典: Erroll Wood et al.

Dフェイスモデル

MicrosoftはAIの手法(Generative 3D Face Model)で人物の頭部を三次元で生成する。これは3Dフェイスモデルと呼ばれ、生成されたモデルは実在しない人物の顔を超リアルに生成する。この手法はハリウッドの映画スタジオで使われる特撮技術(Visual Effects (VFX))で、映画スターがデジタルに生成されている。しかし、Microsoftの場合は教育データを大量に生成する必要があり、超リアルな3Dフェイスモデルを数多く生成する技法を開発した。

モデル生成のプロセス

このため、Microsoftはテンプレートを基準にして、それを変形する手法で多数の3Dフェイスモデルを生成した。まず、AIはテンプレートとなる3Dフェイスモデル(下の写真左端)を生成する。これをベースに、このモデルに個性(左から二番目)、表情(三番目)、スキン(四番目)、頭髪(五番目)、衣服(六番目)、背景(右端)を付加する。これにより、リアルで多様性のある3Dフェイスモデルを生成することができた。

出典: Erroll Wood et al.

Dフェイスモデルの多様性

3Dフェイスモデルで教育された顔認識AIは特定の人種にバイアスすることなく公平に判定できることも示された。Microsoftは3Dフェイスモデルで教育した顔認識AIを多様性データセット「The MUCT Face Database」を使ってその判定精度を検証した(下の写真)。このデータセットは異なる性別や多様な人種で構成されており、多様性を検証するために使われる。また、光の状態も様々で、現実社会に近い環境で顔認識AIの精度を検証できる。教育した顔認識AIはこのデータセットで正しく判定し、多様性のある実社会で利用できることが示された。

出典: Erroll Wood et al.

データセットを公開

Microsoftは生成した3DフェイスモデルをGitHubに公開しており、研究開発の目的で自由に利用することができる。公開されているモデルの数は10万で、それぞれのモデルには70のアノテーションが付加されている(下の写真、フェイスモデルとアノテーション)。研究者はこのモデルを使うことで、倫理的に顔認識AIを開発できる。

出典: Microsoft

顔写真データセットを消去

これに先立ち、Microsoftは著名人の顔写真データセット「Microsoft Celeb (MS-Celeb-1M)」を開発し、これを公開していた。これは著名人の顔写真100万枚を格納したデータセットで、顔認識AIの教育で利用されてきた。しかし、Microsoftはデータセットに格納している顔写真について、本人の同意を得ていないとして、全てのデータを消去し公開サイト「MS Celeb 」を閉鎖することを決定した。顔写真収集に関する議論が広がる中、Microsoftは他社に先駆けてこれらを利用しない方針を打ち出した。

顔写真をスクレイピング

これとは対照的に、新興企業「Clearview」は顔認識AI開発するために、ソーシャルネットワークに掲載されている顔写真をスクレイピングしてアルゴリズムを教育した。写真の数は30億枚を超え、世界最大規模の顔写真データセットを構築した。Clearviewが開発した顔認識アルゴリズムは判定精度が高く、全米の警察で犯罪捜査に利用されている。これに対し、市民団体は、個人の顔写真を許可無く使用することは違法であるとして、Clearviewに対し集団訴訟を起こした。

出典: Erroll Wood et al.

合成メディアの手法で生成

フェイスブックなどに掲載している顔写真を収集し、これを顔認識AIの教育で使うことが社会問題となっているなか、倫理的な開発手法の模索が続いている。消費者の了解を得て顔写真を収集するのでは大量のデータを準備できない。Microsoftは高品質な3Dフェイスモデルを大量に生成することに成功し、教育データを合成メディアの手法で生成する方式に注目が集まっている。

Facebookは創設以来最大の危機に直面、安全より利益を選択、アルゴリズムが有害な情報を配信し閲覧数を増やす

Facebookは創業以来最大の危機に直面している。Facebookの内部告発者がアメリカ連邦議会公聴会で証言し、アルゴリズムの危険性を訴えた。Facebookは有害情報を発信すると閲覧回数が増えることを理解しており、利用者の安全を犠牲に利益を上げる手法を選択したと証言。一方、Facebookは、この解釈は正しくなく、アルゴリズムの改良で有害記事が減り、友人や家族からの記事が増えたと反論。連邦政府は、アルゴリズムの公開も含め、ソーシャルメディアに関するルールを制定する方向に動き始めた。

出典: C-SPAN

アメリカ連邦議会公聴会

10月5日、アメリカ連邦議会上院の公聴会「Senate Commerce Subcommittee on Consumer Protection」で元Facebook社員であるFrances HaugenがFacebookのビジネス手法について証言した(上の写真)。公聴会はインターネットから子供を守ることを目的に開催され、Haugenは、FacebookはInstagramが子供の健康を害していることを把握しているが、企業の利益を優先して有害なコンテンツを送り続けていると証言。このビジネス慣行は容認できるものではなく、ソーシャルネットワークを規制する法令の制定を訴えた。Haugenは議員からの質問に答える形で、Facebookの技術内容を説明し、子供をターゲットとする手法やアルゴリズムの概要などを明らかにした。

内部告発の背景

HaugenはFacebookでProduct Managerとしてアルゴリズムの開発に従事してきた。Haugenは退社する前に、大量の内部資料をコピーして報道機関Wall Street Journalに提供し、同紙がこれをベースに告発記事を書き、Facebookの問題が表面化した。更に、これら内部資料は米国証券取引委員会と米国連邦議会に提出されている。Haugenの証言はこれら大量の社内データに基づき、Facebookのビジネス慣行の詳細が明らかになった。

Instagramは少女に有害

HaugenはInstagramが若い女性に有害である点を中心に証言した。Facebookは内部調査でInstagramが子供の健康を害することを把握しているが、この事実を隠匿し、有害なコンテンツの配信を続けていると指摘した。具体的には、英国における調査で、女性ティーンエイジャーの13.5%はInstagramを使い始めてから自殺を考えるようになった、という問題が明らかになった。また、別の調査で、女性ティーンエイジャーの17%はInstagramを使い始めてから摂食障害を引き起こしたことも判明。更に、身体の容姿にコンプレックスがある少女の32%は、Instagramを見ると精神状態が悪化したことも報告されている。

出典: Instagram

アルゴリズムの危険性

これらの問題はコンテンツを配信するロジックを規定するアルゴリズムにある。Facebookはアルゴリズムを使って読者に最適なコンテンツを配信する方式を取る。このアルゴリズムは「Engagement Based Ranking」と呼ばれ、どのような内容のコンテンツを配信するかを決定する。Facebookは友人や家族間でコミュニケーションが増進するコンテンツを配信する方式を採用している。これは「Meaningful Social Interactions(MSI)」と呼ばれ、読者がコンテンツに対してリアクションするものを優先して配信する。具体的には、読者がクリックしたり、いいねボタンを押したり、他者と共有するコンテンツを配信する。アルゴリズムは読者がどんどんシェアしてくれるコンテンツを中心に配信する。

アルゴリズムの評価

つまり、アルゴリズムはMeaningful Social Interactions(MSI指標)が向上するよう設定されている。実際には、Facebookでは多数のアルゴリズムが稼働しており、それぞれのアルゴリズムの設定を変更して、コンテンツがシェアされる回数が増えるように調整される。アルゴリズムでMSI指標を上げると、より多くのコンテンツがシェアされ、ページビューが向上し、収益が上がる構造となる。つまり、FacebookとしてはMSI指標を向上することが究極のゴールで、これにより事業が拡大し収益があがる。

ヘイトスピーチが増える

しかし、Facebookは内部調査で、MSI指標を上げると、その副作用として、ヘイトスピーチや偽情報や暴力を扇動するコンテンツが増えるという事実を把握した。アルゴリズムがこれら有害なコンテンツを配信すると、利用者のインタラクションが増え、その結果MSI指標が向上する。利用者の観点からは、有害なコンテンツに惹きつけられ、これらをシェアする回数が増え、ソーシャルネットワークで拡散することになる。アルゴリズムが有害コンテンツの拡散機となることを意味する。

出典: Facebook

安全より利益を選択

Facebookはこれらの事実を把握していたにも拘わらず、これを隠匿してMSI指標を高めてきた。MSI指標を上げると利用者に有害なコンテンツが配信され危険であるが、企業としてはページビューが増え広告収入が増える。つまり、Facebookは危険性を隠匿し、利用者の安全より企業の収益を優先させることを選択した。

AIが未熟

同時に、Facebookはヘイトスピーチなど有害なコンテンツをAIで検知し、これらを削除する研究を進めているが、技術は未熟でこれらを正確に検知することができない。2021年の夏に、Facebookはコロナウイルスに関する偽情報をAIでフィルタリングする試験を実施した。その結果、検知精度は80%から90%で、多くのコンテンツがフィルターをすり抜けた。このAIは英語のコンテンツを対象とし、他の言語には対応できていない。

出典: Facebook

Facebookの反論

公聴会での証言を受けて、Mark Zuckerbergはメッセージを発信し、Haugenの主張は間違っていると反論した。議論の核心はFacebookが安全より利益を優先しているとの主張で、これは完全に間違いだと述べている。具体的には、FacebookはMSI指標を導入したが、その結果有害ビデオ(Viral Videos)が減り、友人や家族からのコンテンツが増えたと説明。また、Facebookは意図的に有害コンテンツを拡散しているとの主張に対し、Facebookは広告でビジネスを構築しており、企業は有害コンテンツには広告を掲載しないと反論した。Instagramに関しては、子供たちにスマホが普及しており、これを制限するのではなく、子供たちのニーズに沿って安全な機能を提供することがFacebookの役割と説明した。

ルールの制定

Haugenは公聴会で証言した目的は議会にソーシャルメディアに関するルールの設定を促すためと述べている。同様に、ZuckerbergはFacebookのような企業がコンテンツ選別に関す決定を下すのではなく、政府が法令を改定して新しい時代に沿ったルールを制定すべきと発言している。HaugenもZuckerbergも政府がソーシャルネットワークを規制する法令を制定すべきという点では共通の理解を持っている。

Facebookの転機

早くからソーシャルネットワークの危険性が指摘されてきたが、Haugenによる証言でアルゴリズムなどシステムの詳細が明らかになり、Facebookの問題の本質が見えてきた。Facebookはソーシャルネットワークでトップのシェアを持つが、利用者数は伸び悩み事業拡大が難しくなっている。Facebookは有害コンテンツの拡散を押さえ、事業を拡大するという難しいかじ取りを迫られる。

Amazonは家庭向けロボットを投入、高度なAIを搭載し家の中を自動走行するが機能は限定的、5年後を見据えた開発の最初のステップとなる

今週、Amazonは発表イベントで家庭向けのロボット「Astro」を公開した(下の写真)。ロボットは子犬ほどの大きさで、頭部にディスプレイが搭載され表情を表し情報を表示する。ロボットはカメラの映像をAIで解析し、家の中で障害物を避けて自動で走行する。ベーシックな機能だけを搭載したロボットで、Amazonはこれを「Day 1 Editions」と呼ぶ。完結した製品になるまでには5年程度の時間が必要で、Amazonはロボットの普及に向け第一歩を踏み出した。

出典: Amazon

Astroの利用方法

ロボットはエンターテイメントとセキュリティを目的に開発された。ロボットは”移動式AIスピーカー”という構成で、人間の言葉を理解してタスクを実行する。ロボットに指示するときは、「Astro」と呼びかける。「Astro, call Mom」と指示すると、ロボットはお母さんに電話してビデオで通話する(下の写真、左側)。ロボットは利用者をフォローする機能があり、家の中で移動しながら通話できる。また、「Astro, Take this to Alicia」と言えば、飲み物を指示した人物に届ける(中央)。ロボットは顔認識機能があり、人物を見分けることができる。更に、「Astro, remind Lucas…」と言えば、指示した人物にリマインダーを送信する(右側)。

出典: Amazon

セキュリティ機能

一方、住人が不在の時はロボットが警備員となり家の中をパトロールして安全を確認する。ロボットは潜望鏡を搭載しており、これを伸ばして先端のカメラで家の中を監視する(下の写真)。高い視点でモニターでき、キッチンのガスコンロがオフになっていることなどをモニターする。カメラが捉えた映像は利用者のスマホアプリに送信される。因みに、利用者はスマホアプリからロボットに監視する場所の指示を出す。

出典: Amazon

シニアの健康管理

ロボットの利用法で期待されているのがシニアの健康管理である。これは「Alexa Together」というサービスをロボットに適用したもので、離れて暮らす年老いた両親の健康状態をモニターする(下の写真)。異常があればロボットは遠隔地にいる管理者にアラートを送信する。また、本人にかわりショッピングリストを生成し、リマインダーを送信するなどの機能もある。ロボットが介護士となり家の中でシニアの健康状態をモニターする。

出典: Amazon

ナビゲーションシステム

ロボットは高度なAIを搭載しセンサーの情報を解析し部屋の中を自動で走行する。これは「Intelligent Motion」と呼ばれ、ロボットのナビゲーションシステムとなる。ロボットは三セットのセンサー「Navigation Sensors」、「Obstacle Sensors」、「Depth Sensors」を搭載し、これをAIで解析して移動ルートを算出する。また、ロボットはSimultaneous localization and mapping (SLAM)という技法で、家の中のマップを生成し、現在の位置を把握する。(下の写真、SLAMの手法で生成された3Dマップでロボットはこれをベースに走行ルートを決定する。)

出典: Amazon

多種類のセンサー

ロボットは三種類のセンサーを使い家の中を自律走行する。マップ生成においては「Navigation Sensors」が使われる。このセンサーは家の中のランドマーク(テーブルの角やドアのフレームなど)を把握し、マップにこの情報を組み込む。ロボットが家の中を移動する際の目印として利用する。一方、「Obstacle Sensors」はロボットの目の前のオブジェクトを把握し、近傍のマップを高精度で生成する。このほかに「Depth Sensors」は人物を把握するために使われる。(下の写真、Navigation SensorsとObstacle Sensorsはロボット本体正面に搭載されている。Depth Sensorsはディスプレイ上部に搭載されている。)

出典: Amazon

自動走行の仕組み

生成されたマップでロボットは目的地に移動するための最適なルールを算出する。アルゴリズムは数百のルートを検証し、そこから最適なものを選ぶ(下の写真)。AIは長期的な経路(下の写真、青色の線)と短期的な(2-3秒先の)経路(緑色の線)を算出する。更に、自動運転車とは異なり、家の中では決められたレーンは無く、また、床に物が置かれるなどして経路が塞がれる事象が発生する。周囲の状況は頻繁に変わり、その都度、アルゴリズムがルートを再計算し、新しい環境に適応する。

出典: Amazon

人間とのインタラクション

ロボットは人間とモノを見分けることができ、人間に対しては礼儀正しい対応をする。ロボットは人間に合わせた速度になり、また、社会的に適切なインタラクションを行う。具体的には、ロボットは人間に接するときは、正面からアプローチし、最適な距離を取って停止する。また、ソファに腰かけている時は、隣に停止するなどのアクションを取る(下の写真)。人間に接するときは、「Navigation Sensors」と「Depth Sensors」が使われ、優雅な動作で対応する。

出典: Amazon

Amazonがロボットを開発する理由

高度なAIで構成されるAstroであるが、その利用形態はエンターテイメントやセキュリティに限られる。ロボットはアームを搭載しておらず、冷蔵庫を開けてビールを届けるなどのタスクはできない。また、洗濯物をたたみ、部屋を掃除するなどの家事が出来るわけでもない。Astroはロボットとしての最小限の機能だけで、利用方法は限られる。Amazonはこれを認識したうえでAstroを投入し、これをDay 1 Editionsと呼び、ベータ版であることを強調している。Astroの販売価格は999.99ドル(導入価格)で年末から出荷が始まる。Amazonは5年から10年後には家庭にロボットが普及する時代になると予測しており、Astroの開発はこれに向けた第一歩となる。