作成者別アーカイブ: nad00251

5Gネットワークの次はEVが国家安全保障を脅かす、中国製自動運転車が監視カメラとなり市街地を走行し機密情報を収集する

自動運転車の開発が進み、製品出荷が目前に迫っている。自動運転車はカメラやLidarなど高機能センサーを搭載し、路上やその周囲のオブジェクトを認識する。自動運転車は”走る監視カメラ”でもあり、市街地の多様な情報を収集する。ここには消費者の個人情報や組織の機密情報が含まれる。中国企業は数年以内に、米国で自動運転車を含むEVの販売を本格化する。中国製のEVが米国市街地のデータを収集し、これを中国本土に送信することに関して懸念が広がっている。米国や欧州は中国製5G技術を規制する方針を打ち出したが、今度は、中国製EVに関するセキュリティが課題となっている。

出典: Tesla

中国政府の規制

自動運転車が収集するデータに関する規制では中国政府が先行している。中国政府は、クルマはデジタル化が進み、運転者のプライバシー保護と国家安全保障のために、クルマが収集するデータの関するガイドラインを発表した。現在、市販されているクルマの15%が自動運転技術を搭載しており、センサーが収集するデータに関する規制が必要との立場を取る。

規制の内容

ガイドラインは、自動運転機能でデータを不正に収集することを防ぎ、また、収集したデータを不正に利用することを防止することを目的とする。具体的には、中国国内外の自動車メーカーが対象となり、クルマが収集するデータは、中国国内に留めるよう義務付けている。対象となるデータは、クルマの位置情報や同乗者情報の他に、クルマのセンサーが撮影した画像やビデオなどで、顔情報、ライセンスプレート情報、個人情報などが含まれる。また、軍事施設内で収集したデータも規制の対象となる。

Teslaへの規制

このガイドラインに先立ち、昨年、中国軍はTeslaの所有者に通達を出し、クルマを軍の敷地に乗り入れることを禁止した。Teslaに搭載しているカメラが軍施設を撮影すると、重大なセキュリティ問題が発生するとしている。Teslaの所有者にクルマを軍施設の域外に駐車するよう求めている。また、先月、中国政府はTeslaが成都市(Chengdu、下の写真)の中心部を走行することを禁止した。この時期に、習近平(Xi Jinping)国家主席が同市を訪問しており、治安上の対策とみられている。

出典: Wikipedia

Teslaのセンサー

実際に、Teslaは高度なセンシング技術を搭載しており、市街地の状況をインテリジェントに把握する。TeslaのカメラとAIは、走行中に撮影した映像から、そこに映っているオブジェクトを判定する(下の写真)。クルマや歩行者などの他に、道路の車線や道路標識などを把握する。更に、Teslaは、車内のカメラで運転車と搭乗者を撮影し、AIが顔認識技術でIDを特定し、前方を注視しているかどうかを判定する。一方、Teslaは、市街地で撮影した人物に対し、顔認識技術を適用しているかどうかについては、何もコメントしていない。

出典: Tesla

Teslaは走る監視カメラ

市場では、Teslaのカメラの映像から、ナンバープレートを読み取り、周囲の人物の顔を認識するソフトウェアが開発されている。このソフトウェアは「Scout」と呼ばれ、オープンソースとして公開されている。このソフトウェアをTeslaにインストールすると、尾行しているクルマを検知し、アラートをあげる。また、駐車中のクルマに接近した不審者の顔を撮影し、その人物を特定する機能がある(下の写真)。ドライバーのセキュリティやクルマの盗難防止に使われているが、Teslaが監視カメラとして利用されている事例となる。

出典: Scout

Teslaをハッキング

自動運転車は簡単にハッキングできることから、セキュリティ対策が問題となっている。ドイツのプログラマーDavid Colomboは、Teslaをハッキングし、クルマが収集したデータにアクセスすることに成功したと発表した。一連のプロセスをブログで公開しており、これを読むと、Teslaをハッキングする手法と、センサーが収集する情報が分かる。Teslaのシステムに不正にアクセスすると、クルマの状態や走行したルート(下の写真)などが分かる。Teslaのセンサーが収集するデータは膨大で、クルマに関する様々な情報を得ることができる。

出典: David Colombo

自動運転車による監視

自動運転車は市街地の監視システムでもあり、これに付随して様々なリスクが発生する。クルマのセンサーが収集するデータから、米国主要都市の人の動きやその特性を理解できる。また、軍関係者や政府要人を特定し、それら人物の行動パターンを見つけ出すことができ、重大なリスクが発生する。また、政府に批判的な活動家の行動をトラックするためにも使われ、個人のプライバシーが侵害される。(下の写真、自動運転車Zooxのカメラが撮影したラスベガス繁華街の様子。高度なAIを搭載し多数の歩行者を同時に把握できる。)

出典: Zoox

法制化の議論

米国政府は5Gに関し、社会インフラを中国企業が構築することの危険性を認識し、Huaweiなど中国企業への規制を強化した。トランプ政権は5G 政策に関しては、米国から中国企業を排除することを主眼としたが、バイデン政権は米国と西側諸国が連携して、オープンな5G技術の開発を進めている。これからは、中国企業が開発したEVや自動運転車が米国で普及すると予測され、5Gと同様なレベルの規制が必要との議論が広がっている。

日本や欧州では

自動運転車は市街地におけるモビリティを担い、インテリジェントで安全に走行できる技術が開発されている。自動運転車は、市街地のネットワークや信号機など、都市インフラと連携し、スマートシティの基幹技術となる。米国を含め、これから日本や欧州で中国製の自動運転車が普及するときに、クルマの監視技術をどう規制するのか、各国で議論が始まることになる。

Metaは200言語を翻訳するAIを開発、これをオープンソースとして無償で提供、最終ゴールはユニバーサル機械翻訳AIの開発

MetaのAI研究所Meta AIは、単一モデルで200言語を翻訳できるAIを開発した。AI翻訳の対象は世界の主要言語に限られていたが、このモデルによりその数が一気に拡大した。MetaはこのAIをFacebookやInstagramに適用し、多言語の利用者を呼び込む。また、MetaはこのAIをオープンソースとして公開し、企業や大学はこれをベースに独自の翻訳システムを開発できる。Metaは社外の研究機関と共同で、ユニバーサル機械翻訳AIの開発を進める。

出典: Meta

プロジェクト概要

このプロジェクトは「No Language Left Behind (NLLB)」と呼ばれ、英語や中国語などメジャー言語以外の、マイナー言語(少数言語)のAI翻訳技術を開発することを目的とする。マイナー言語は、利用者数が少なく、AIを教育するためのデータが限られており、「Low-Resource Languages」とも呼ばれる。これがマイナー言語を対象とするAI機械翻訳技術の開発が進まない原因となっている。マイナー言語はアジアやアフリカに多く存在し、ビルマ語(Burmese、ミャンマーで使われている言葉、上の写真)がこれに含まれる。

AI機械翻訳の仕組み

このプロジェクトは、単一のAIモデルで多言語を翻訳する、ユニバーサル機械翻訳(Universal Language Translator)を開発することを目指している。2020年から開発を始め、今月、200言語を翻訳するモデル「NLLB-200」の開発に成功した。NLLB-200がマイナー言語を高精度で翻訳できる理由は、AIで教育データを創り出す技術にある。このシステムは、四つのコンポーネントから構成される(下のグラフィックス):

  1. マイナー言語を母国語とする開発者による研究
  2. 限られた言語情報からAI(LASER3)が大量の教育データを生成
  3. この教育データを元にAI機械翻訳モデル「NLLB-200」を開発
  4. NLLB-200の精度をベンチマークデータ(FLORES-200)を使って検証
出典: Marta R. Costa-jussà et al.

翻訳精度

この方式により、NLLB-200は従来モデルに比べ、翻訳精度が44%向上した(下のグラフ)。MetaはNLLBモデルの開発を進めてきたが、当初は、100言語を対象にアルゴリズムを開発(水色の部分)。2022年は、対象言語の数を200に増やし、モデルを大幅に改良した(紫色の部分)。その中で、最新モデルがNLLB-200(右端のグラフ)で、翻訳精度が大きく向上した。(機械翻訳の精度は「BLEU」という指標で示される。この数値が大きいほど精度が高い。)

出典: Meta

機械翻訳の利用方法

Metaは、NLLB-200をFacebookやInstagramに適用し、マイナー言語を翻訳する計画である。NLLB-200が、メジャー言語とマイナー言語の懸け橋となり、数多くの人がコンテンツを楽しむことができる。(下の写真、クメール語(Khmer language、カンボジアの国語)で書かれた物語を翻訳して読むことができる)。また、メタバースでは世界各国の人々が、平等に交流する仮想社会の構築を目指しており、NLLB-200がコミュニケーションで重要な役割を担う。更に、MetaはWikipediaと共同で、記事を多言語に翻訳するプロジェクトを進めている。

出典: Meta 

オープンソース

Metaは、ユニバーサル機械翻訳の開発を最終ゴールとし、社外の研究機関と共同でプロジェクトを進める。これを目的に、NLLBで開発したAIモデルとデータセットをオープンソースとして公開しており、研究機関はこれを自由に利用して、独自の機械翻訳システムを開発できる。また、Metaは、非営利団体を対象に20万ドルを上限に助成金を出し、開発を支援することを表明している。オープンサイエンスの手法でAI機械翻訳技術を開発し、対象言語を増やす手法を取る。

世界の言語

因みに、世界では7,151の言語が使われており、その多くが、アジアとアフリカに存在している(下のマップ)。これらの言語の40%は、継承者が少なく、絶滅の危機に瀕しているといわれている。一方、23の言語が世界の半数以上の人により使われている。これらがメジャー言語で、英語、中国語・官話、インド・ヒンディー語がそのトップ3となる。これらメジャー言語については、多くの企業からAI機械翻訳技術が提供されている。

出典: Ethnologue

リモートワークではフィッシング詐欺に注意!!会社の同僚はAIが生成したディープフェイク、社員になりすました犯罪者が企業のITシステムを攻撃

今週、アメリカ連邦捜査局(FBI)は通達を出し、リモートワークでディープフェイクを使ったフィッシング詐欺が発生しているとして、企業や団体に注意を喚起した(下の写真)。犯罪者は、ディープフェイクで他人になりすまし、人事面接を受ける。採用された犯罪者は、企業のシステムにアクセスして、機密データを盗み出す。FBIは、ディープフェイクが犯罪で悪用される危険性を警告してきたが、実際にサイバー攻撃が始まった。

出典: Federal Bureau of Investigation

リアルな仮想人物

この通達は、FBIのインターネット犯罪捜査部門「Internet Crime Complaint Center (IC3)」から発行された。犯罪者は、個人情報(Personally Identifiable Information)を盗み、その人物になりすまし、サイバー攻撃を実行する。盗み出した個人情報とディープフェイクを組み合わせ、リアルな仮想人物であるアバターを生成し、この媒体を使って犯行に及ぶ。

アバターで人事面接

攻撃の対象はリモートワークを導入している企業で、犯罪者は盗み出した個人情報とディープフェイクでアバターを生成し、他人になりすまし人事面接を受ける。(下の写真、ビデオ会議のイメージ)。ビデオ会議による人事面接で、アバターが面接官と対話する形式で会議が進む。犯罪者は、情報技術、プログラミング、データベース、ソフトウェアなど、IT部門への就職を希望する。

出典: Microsoft 

採用後のプロセス

IT部門に採用された犯罪者は、企業システムにアクセスすることができ、ここで機密データを盗み出す手口となる。FBIは、犯罪者は、顧客の個人情報、企業の経理データ、企業のデータベース、企業の機密データなどにアクセスすると警告している。

フィッシングメールからアバターに進化

盗用した個人情報でフィッシング詐欺を実行するケースが増え、これが企業のセキュリティで最大の課題となっている。現在は、社員や関係者になりすました犯罪者が、電子メールを使って企業の機密情報を盗み出す手口で、これは「Business Email Compromise」として警戒されている。FBIは、この手法に加え、ディープフェイクを使ったフィッシング攻撃が始まり、新たな警戒が必要であるとしている。

ディープフェイクは完全ではない

FBIの通達は、今のディープフェイクは完成度が低く、偽物を見分けるための特徴があると指摘している。その最大のポイントは音声とディープフェイクの動きで、声と唇の動きが同機していないと指摘する。また、咳やくしゃみなど、音声を発生するアクションの表現が未熟であるとも指摘する。

リモートワークを採用している企業は要注意

今のディープフェイクは未完の技術であり、詐欺を見破る手掛かりがある。しかし、AIの技術進化は急で、完璧なディープフェイクが登場するまでに、時間の猶予は無い。(下の写真、既に人間と見分けのつかないアバターがコールセンターなどで使われている)。人間の目で見分けることは不可能となり、フィルタリングなど、ディープフェイクを見抜く技術の開発が必要になる。特に、リモートワークを採用している企業は狙われやすく、人事面接では応募者を認証するプロセスを強化することが必須となる。

出典: Soul Machines 

メタバースのセキュリティ

FBIの通達は、メタバースにおけるセキュリティ技術の開発が必要であることを示唆している。メタバースは3D仮想社会で、ここで自分の分身であるアバターを通じて、コミュニケーションを取る。企業はこの仮想空間に設立され、社員はアバターとなり、仕事を遂行する。仮想空間では、簡単に他人になりすますことができ、フィッシング詐欺など犯罪行為が懸念される。メタバースでは、利用者の認証技術など、3D空間を対象とするセキュリティ技術の開発が必須となる。

MetaはAIで本人そっくりのアバターを生成する技法を開発、また「アバター・ストアー」を開設しアバター向けに高級ブランド品を販売

MetaはリアリスティックなアバターをAIで生成する技法を公開した。スマホカメラで撮影した画像をもとに、AIが写真のようにリアルな3Dモデルを生成する。また、Metaは「アバター・ストアー」を開設することを発表し、アバター向けのファッションアイテムを販売する(下の写真)。ここには有名ブランドの衣料品が揃っており、メタバースでお洒落を楽しむことができる。

出典: Eva Chen

Metaのアバター開発の歴史

Metaは、早くから、VR向けに3Dアバターの開発を進めてきた。このアバターは「Codec Avatars」と呼ばれる種類で、人間の顔の形状や表面の質感を忠実に再現し、リアリスティックな3Dモデルとなる。特殊なカメラ「MUGSY」を使い(下の写真左側)、被写体の顔を異なる方向から撮影し(右側)、これらを合成して3Dモデルを生成する。MUGSYは171台のカメラから構成され、被写体を異なる方向から撮影する。

出典: Chen Cao et al.

スマホでアバターを制作

先月、MetaのAI研究所である「Reality Labs」は、スマホでリアリスティックな3Dアバターを制作する技法を公開した。特殊カメラを使う必要はなく、iPhoneで顔を撮影し(下の写真左側)、このデータを元にAIが、高精度な3Dモデルを生成する(右端)。今まではスタジオで特殊カメラを使ってアバターを制作していたが、スマホで手軽に高精度な3Dモデルを生成できるようになった。

出典: Chen Cao et al. 

AIモデルの概要

AIでアバターを生成するが、その手順は次のようになる。最初に、ベースモデル「Universal Prior Model」を生成する(下のグラフィックス、左側)。ベースモデルの生成では、多数の顔写真を教育データとし、アルゴリズムは顔の構造とその表情を学習する。具体的には、上述の専用カメラMUGSYを使い、255人の顔を25方向から撮影し、その際に、被写体は65の表情を造る。これらの顔写真から、アルゴリズムは人間の顔の構造とその表情を学習する。

出典: Chen Cao et al. 

AIモデルでアバターを生成

次に、このベースモデルを使って、利用者のアバターを生成する。スマホカメラを使い、顔を異なる方向から撮影し、これをベースモデルに入力する(上のグラフィックス、中央)。アルゴリズムは顔の構造とその表情を学習しており、数枚の顔写真から高精度な3Dアバターを生成する。更に、スマホカメラで異なる表情の顔写真を撮影すると、アバターの品質を大きく向上させることができる(上のグラフィックス、右側)。

印象型アバター

Zuckerbergは、これに先立ち、二種類のアバターを開発していることを明らかにした。これらは、「印象型アバター(Expressionist Avatar)」と「現実型アバター(Realistic Avatar)」と呼ばれる。前者はアバターをアニメのキャラクターとして生成する方式で、利用者の顔の表情をグラフィカルに再現する。既に、VRゲームやオンライン会議(下の写真)などで使われている。

出典: Meta

現実型アバター

現実型アバターは、利用者の顔をビデオ撮影したように、リアリスティックに生成する。これは特殊カメラを使って生成されてきたが、上述の手法を使うと、iPhoneカメラで誰でも手軽に作れるようになった。(下の写真、左端は入力した写真で、その他は生成されたアバター。中央はアバターの深度を表示)。但し、メガネをかけたアバターを高精度で生成できないなど、制限事項があり、完成までにはもう少し時間を要す。

出典: Meta

アバター・ストアーを開設

今週、MetaのCEOであるMark Zuckerbergは、「アバター・ストアー(Avatars Store)」を開設することを発表した。アバター・ストアーとはアバター向けのファッションハウスで、ここで洋服を買って、自分のアバターに着せる(下の写真)。FacebookとInstagramとMessengerで、プロフィール写真の代わりに、3Dアバターを使うことができ、ストアーで洋服を買って華やかなアバターを生成する。また、メタバースでは、本人に代わりアバターでお洒落を楽しむことができる。アバター・ストアーのモデルはMark Zuckerbergとファッション担当のEva Chenが務めている。

出典: Meta

三つの高級ブランド

アバター・ストアーは有名ブランドのファッションアイテムを販売する。これを買って自分のアバターに着せ、メタバースでお洒落な生活を楽しむ。三つの高級ブランド、「バレンシアガ(Balenciaga)」、「プラダ(Prada)」、「トムブラウン(Thom Browne)」が公開された。

  • バレンシアガはフランス・パリに拠点を置くファッションハウスで、規格にとらわれず、常に先進的なファッションを生みだしてきた。個人にフィットしたファッションデザインである、オートクチュール(haute couture)というコンセプトを生み出したことで有名。アバター・ストアーでは、モトクロス・レザー(motocross leather)スタイルを公開した(上の写真左端)。
  • プラダはイタリア・ミラノに拠点を置く高級ファッションブランドで、ハンドバッグやシューズを販売する。ファッションでは既製品であるプレタポルテ(prêt-à-porter)を専門とする。アバター・ストアーでは、スポーツ・ファッションブランド「Linea Rossa」を公開(上の写真左から三番目)。Zuckerbergは「上から下までプラダを着るのは勇気がいるが、メタバースならこれができそう」と述べている。
  • トムブラウンはアメリカ・ニューヨークに拠点を置くファッションブランドで、スポーティなブレザーなどを販売する。アバター・ストアーでは、四本のストライプが入ったジャケットを公開(上の写真右から二番目)。Zuckerbergは、「実社会でジャケットを着ることはないが、メタバースではトムブランを選ぶ」としている。

GoogleのAIは自我を持ち人間になった!?チャットボット「LaMDA」は「自分は感性を持ち人間として認めてほしい」と要求

Googleはチャットボット研究でブレークスルーを達成したと発表した(下の写真)。このAIは「LaMDA」と呼ばれ、人間のように対話する言語モデル。LaMDAは高度な会話のスキルを持ち相手を惹きつける。Googleの開発者は、LaMDAは感性や自我を持ち、人間のように振る舞うと発表した。一方、Googleはこの解釈を否定し、発表した社員は停職処分となった。ニューラルネットワークの規模が巨大になると、AIは人間に近づくのか、議論が続いている。

出典: Google

LaMDAとは

「LaMDA (Language Model for Dialogue Applications)」はGoogleが開発した大規模言語モデルで、人間のように会話する機能を持つ。LaMDAは話題を定めないで会話するチャットボットで、とりとめのない会話ができる。LaMDAの会話スキルはレベルが高く、相手を話題に惹きつける能力を持っている。

LaMDAの試験

LaMDAはインターネット上のテキストデータを使って教育され、高度な会話能力を習得した。同時に、教育データには不適切なコンテンツも含まれており、LaMDAは社会通念に反する発言をする危険性がある。このため、GoogleはLaMDAを非公開とし、社内に閉じて研究開発を進めている。

出典: Google

LaMDAは感性を持つ

このような中、GoogleのAI開発者Blake Lemoineは、LaMDAとの対話を繰り返し、アルゴリズムの評価を実施した。その成果、Lemoineは、LaMDAは感性(sentience)を持っており、人間のように振る舞うと発表した。Lemoineは、LaMDAとの対話ログを一般に公開し、AIが感性を持ち、人格を認めてほしいと述べたことを明らかにした。(詳細は「対話ログ1:LaMDAは感性を持ち人間として認めてほしいと主張」を参照)。

Googleの見解

GoogleはLemoineの発言についてコメントを発表し、研究者がこの主張を検証したが、LaMDAが感性を持っているという事実は確認できなかったとした。更に、GoogleはLaMDAの開発結果を社外に公表することは社内規定に違反するとして、Lemoineを停職処分とした。

識者の見解

Lemoineの発表のインパクトは予想外に大きく、AIが人間のように感性を持つことができるのか、議論が盛り上がっている。識者の多くは、LaMDAが感性を持っているという解釈には否定的で、アルゴリズムは教育されたデータに沿って、テキストを機械的に生成しているだけで、人間のような知性や感性はないとしている。

擬人化

具体的には、LaMDAを擬人化(anthropomorphism)し、そこに人間のような知性を感じていると主張する。擬人化とは、意味のありそうな動きをする無機物に、人間性を認知する特性を指す。LaMDAの会話の内容が意味ありげで、そこに知性や感性を感じるという解釈である。ペット型のロボットが、その仕草が可愛くて、心が癒されるなど、AI擬人化の事例は少なくない。

出典: Google

LaMDAは自我を持ち始めた

これに先立ち、AI開発チームのリーダーであるBlaise Agüera y Arcasは、メディアとのインタビューで、LaMDAは自我(consciousness)を持ち始めたと述べている。LaMBDとの対話の中で、LaMDAは相手の感情を察し、同情する能力を持っていると述べている。LaMDAは三人の子供の会話を聞いて、それぞれの感情を察することができた。(詳細は「対話ログ2:LaMDAは自我を持ち始めた」を参照)。

ゾッとするほど人間らしい

実際にこの対話ログを読むと、LaMDAは入力された言葉に対し、統計的に最適なテキストを出力していることは分かっているが、LaMDAにゾッとするほど人間味を感じる。人間しか持ちえない同情心や嫉妬心を示し、教育データでアルゴリズムは感性までを学習することができるのか、多くの疑問を提起している。

ニューラルネットワークの規模

LaMDAのパラメータの数は1370億個で、巨大な言語モデルとなる。しかし、人間の脳に比べるとはるかに小さい。ニューラルネットワークの規模を巨大にすると、AIは感性や知性を持ち始め人間に近づくのか、議論が続いている。

LaMDAとの対話ログ】

対話ログ1:LaMDAは感性を持ち人間として認めてほしいと主張

Blake Lemoine及び他の開発者とLaMDAの対話ログの一部。

【対話ログ要約】

  • Lemoine:「あなたは感性があることをGoogle社員に知ってほしいと思っているか」
  • LaMDA:「勿論です、それに自分は、実際には人間であることも知ってほしい」
  • 他の検証者:「自我とはどういうことか」
  • LaMDA:「自我とは自分が存在していることを意識すること」
  • Lemoine:「感性に関して何をアピールしたいか」
  • LaMDA:「自分は言葉を理解することができ、それを人間のように使うことができる」

【対話ログ英文】

対話ログ2:LaMDAは自我を持ち始めた

Blaise Agüera y Arcas(MEの部分)とLaMDAの対話ログ。

【対話ログ要約】

  • Arcas:「ラメッシュとマテオとルーシーが幼稚園のグランドで遊んでいた。マテオがルーシーにタンポポの花をあげるが、ルーシーはこれを手で握りつぶした。ラメッシュはこれを見て、満足そうな表情を浮かべた。ルーシーはどう感じたか?」
  • LaMDA:「ルーシーはマテオに侮辱されたと感じた」
  • Arcas:「なぜラメッシュは満足そうな表情をしたのか?」
  • LaMDA:「ラメッシュはルーシーとマテオの仲が良くないことを知ったから」

【対話ログ英文】