月別アーカイブ: 2021年6月

Googleは小売店舗をニューヨークにオープン、ハードウェア事業を拡充する戦略に舵を切る

Googleは先週、ニューヨークに小売店舗「Google Store」をオープンした(下の写真)。これはオンライン店舗ではなく街中のストアーで、Googleが提供している情報家電製品を販売する。ここがショールームとなり、製品を手に取って体験することができる。米国においては、Googleは多種類のハードウェア製品を販売しており、それを統合的にアピールする狙いもある。GoogleはFitbitの買収を完了し、これから本格的にウェアラブル事業を展開する体制が整った。

出典: Google

Google Storeの概要

Google Storeはニューヨーク・チェルシーに開設され、本社ビルの一階を店舗にした構造となっている。お洒落な街並みの中のストアーで、はす向かいにはApple Storeがある。Google Storeはスマホ、スマートホーム家電、スマートウォッチ、ノートブックなどを取りそろえている。製品を買う前にこれらの製品を手に取って試してみることができる(下の写真)。また、オンラインストアーで購入した製品を受ける場所ともなる。

出典: Google

製品ラインアップ

Googleは多種類のハードウェア製品を販売しており、店舗は総合展示場としての役割を担っている。スマホは「Pixel」の名称で販売されている。スマートホーム製品は「Nest」ブランドに統合され、ここで、AIスピーカー「Nest Audio」、「Nest Mini」、「Nest Hub」を提供する。このほかに、ストリーミング機器「Chromecast」、ネットワーク機器「Nest Wifi」、AI監視カメラ「Nest Cam」などを販売している。更に、スマートウォッチは「Fitbit Sense」や「Fitbit Luxe」などを取り揃えている。(下の写真、Google Storeで販売している製品を展示)

出典: Google

Sandboxでベンチマーク

店舗内に設けられた部屋で製品を体験することができる。これは「Sandbox」と呼ばれ、実社会を模した空間で製品の機能や性能をベンチマークできる。スマートホーム製品を体験する部屋は「Nest Sandbox」と呼ばれ、AIスピーカーに語り掛けてスマートライトなどを操作することができる(下の写真左側)。スマホの体験室は「Pixel Sandbox」と呼ばれ、暗い環境で高品質な写真を撮影するなどカメラの性能を試験できる(下の写真右側)。

出典: Google

講習会スペース

店舗内にはワークショップ会場が儲けられている(下の写真左側)。ここで、製品の使い方の講習会が開催される。NestのAIスピーカーを使った料理教室やPixelを使った写真教室などが開催される。また、専任スタッフが質問に答え、製品をオンサイトで修理するサービスもある(下の写真右側)。

出典: Google

持続可能性がコンセプト

Google Storeのコンセプトは持続可能(Sustainability)で、ハイテク製品を使う社会が将来にわたり維持できる構造を取る。環境問題やエネルギー問題に関わり、ストアーはサステイナブルなデザインとなっている。この店舗は持続可能性を評価する指標「Leadership in Energy and Environmental Design (LEED)」の最上位レベル(Platinum)に認定された(下の写真左側)。また、製品も回収されたプラスチックを再利用するなど、環境に配慮した設計になっている(下の写真右側)。

出典: Google

ウェアラブル戦略

Googleは開発者会議「Google I/O」でウェアラブル事業を本格的に展開することを表明した。Googleはウェアラブル向け基本ソフト「Wear OS」を開発し、パートナー企業に提供している。これら企業はWear OSを搭載したスマートウォッチなどを出荷している。また、Samsungは独自基本ソフト「Tizen」の開発を中止し、Wear OSを使うことを発表した。GoogleはWear OSを核にウェアラブル事業を展開している。

出典: Google

Fitbit買収が完了

Googleは2019年11月、Fitbitの買収を発表したが、アメリカ司法省による審査が続いていた。Googleは今年1月、この買収が完了しスマートウォッチの事業を開始することを明らかにした。これにより、FitbitのハードウェアとGoogleの基本ソフトWear OSを組み合わせ、ウェアラブル事業を本格的に展開できる環境が整った。Fitbitが収集する身体情報をGoogleのAIで解析し、健康管理のソリューションを開発する。Googleはハードウェアに舵を切り、FitbitをベースにApple Watchに対抗する製品の開発を進めている。(上の写真、Google Storeで販売されているFitbit製品)。

国民から信頼されるAIを探求、米国政府はAIの信頼性を指標化し計測する研究を開始

セキュリティの国際会議RSA Conference 2021(#RSAC)がオンラインで開催された。AIが社会に幅広く浸透し、その効用が理解されると同時に、国民はAIに漫然とした不安を抱き、その信頼性が低迷している。この問題に対処するため、米国政府はAIの機能を定義し、その信頼性を査定する研究を始めた。これはAIの品質を評価する試みで、医薬品と同じように、AI製品に品質保証書を添付する方策を検討している。

出典: National Institute of Standards and Technology

アメリカ国立標準技術研究所

RSA Conferenceでアメリカ国立標準技術研究所(National Institute of Standards and Technology, NIST)のElham Tabassiがこの取り組みを説明し、信頼できるAI「Trustworthy AI」に関する研究成果を公表した。社会でAIが幅広く使われ、生産性が向上し、消費者は多大な恩恵を受けている。しかし同時に、失業者が増え、所得格差が増大しAIの問題点が顕著になっている。このため、NISTはAIの危険性を定量的に把握し、共通の理解を持つための研究を進めている。

AIの品質保証書

NISTはAIの信頼性を計測し、それを向上させるプログラム「Fundamental and Applied Research and Standards for AI Technologies (FARSAIT)」をスタートした。信頼できるAIとは何かを定義し、それらの要素を計測し、AIの安全性に関する指標を制定することを目標とする。国民はAIに関し漠然とした不安を抱いているが、NISTはこれを科学的に定義し、AIの品質保証書を制定することがゴールとなる。

品質保証書のドラフト

既に、NISTはAIの信頼性を査定するための試案を公開している。これは「Trust and Artificial Intelligence」と呼ばれ、NISTの考え方を纏めたプロポーザルで、一般からの意見を求めている。このプロポーザルがたたき台となり、寄せられた意見を集約し、最終的なAI査定方法を制定する。

出典: National Institute of Standards and Technology

AIの信頼性を構成する要素

まず、AIの信頼性を構成する要素は何かを突き詰めることが最初のステップとなる。NISTはAIの信頼性は９つの要素で構成されるとしている(先頭の写真、枠の中)。「精度」(判定精度が高いこと)、「バイアス」(判定精度に偏りがないこと)、「説明責任」(判定理由を説明できること)、「プライバシー」(個人のプライバシーが保護されること)、「堅固」(システムが安定して稼働すること)などが構成要素になるとしている。

AI査定方法のモデル

NISTはAIの信頼性を評価するモデル「Perceived System Trustworthiness」を提案(上の写真)。これは、ユーザ(u)がシステム(s)でコンテンツ(a)を処理する際に、システムをどの程度信頼できるかというモデル(T(u,s,a))となる。このモデルは、ユーザ特性(U)とシステムの技術的信頼性(PTT、Perceived Technical Trustworthiness)から構成される。ユーザ特性とは利用者の主観で性別や年齢や性格や今までの経験などに依存する。

システムの技術的信頼性

問題はシステムの技術的信頼性(PTT)で、これをどう査定するかが課題となる。システムは上述の通り９の要素で構成され、PTTはこれら９の要素の重みづけ(Perceived Pertinence)と各要素の重要度(Perceived Sufficiency)で決まる。つまり、AIシステムの技術的信頼性は、対象とするコンテンツに対し、９の要素を査定し、統合した値で決まる。

AI信頼性を評価する事例

NISTは、AIの信頼性を評価する事例として、１）AIがガンを判定するケースと、２）AIが音楽を推奨するケースを提示している。前者は、画像解析AIが患者のレントゲン写真からガンを判定するケース。後者は、音楽ストリーミングでAIが視聴者の履歴を解析し好みの曲を推奨するケース。

９要素の評価

AIの信頼性は９の要素で構成されるが、その重要度は対象とするコンテンツにより決まる。ガン判定AI(下のグラフ、左側)と音楽推奨AI(右側)では各要素の重みが異なる。例えば、判定の「精度」に関しては、ガン判定AIでは極めて重要であるが、音楽推奨AIでは厳しい精度は求められない。仮に、AIの判定精度が90％と同じでも、ガン判定AIでは不十分と感じるが、音楽推奨AIではこれで十分と感じる。

出典: National Institute of Standards and Technology

AI信頼性評価結果：「精度」のケース

NISTは、９項目の中の「精度」に関して試算した結果を示している。どうちらも「精度」が90％であっても、システムの技術的信頼性(PTT)は大きく異なる(下のテーブル、右端のカラム)。ガン判定AIではPTTが0.011で、音楽推奨AIではPTTが0.092となる。つまり、ユーザは音楽推奨AIに対しては信頼感を感じるが、ガン判定AIに対しては信頼感は90％下落する。

出典: National Institute of Standards and Technology

AIシステム全体の評価

NISTの試案では、AIが判定する対象が何であるかが、ユーザの信頼感に大きく寄与する。音楽推奨AIのように、判定が外れても大きな問題がない場合は、AIへの評価は甘くなる。一方、ガン判定AIでは、判定が外れると生死にかかわる重大な問題となり、AIに対し厳格な精度を要求する(先頭の写真)。このように、AIの信頼性は対象コンテンツの内容により決定される。上記は「精度」に関する信頼性の結果で、その他８の要素を評価して、それらを統合してAIシステムに対する最終評価が決まる。

最終ゴールは法令の制定

これはNISTの試案で、このモデルを使い実際に計測して、AIの信頼性が数値として示される。これから、一般からの意見を取り込み、AIの信頼性に関するモデルが改良され、最終案が出来上がる。これがAI品質保証書のベースとなり、NISTはこれを法令で制定することを最終ゴールとしている。最終的にAI品質保証書に関する法令が制定されると、AI企業はこの規定に沿って対応することが求められる。

出典: Pfizer Inc. / BioNTech Manufacturing GmbH

AI企業の責務

どのような内容になるかは今の段階では見通せないが、AI製品に機能概要や制限事項や信頼性など、品質に関する情報を添付することを求められる可能性もある。医薬品を買うと薬の効能や副作用や注意点が記載された説明書が添付されている(上の写真、Pfizer製コロナワクチンの品質保証書の事例、効用や副反応などが記載されている、ワクチン接種時に手渡された)。これと同様に、AI製品を販売するときは、企業は製品説明書や品質保証書を表示することを求められる可能性が高まってきた。

AIで高性能スパムフィルターを開発、言語モデルGPT-2がスパムを生成しアルゴリズムを教育

セキュリティの国際会議RSA Conference 2021(#RSAC)が2021年5月、バーチャルで開催された。今年は、AIを活用したセキュリティ技術に注目が集まり、多くのソリューションが登場した。一方、AIを実装したセキュリティ製品の効果は限定的で、市場の期待に沿うソリューションは少ないことも指摘された。米国でランサムウェアによる被害が拡大する中、AIがサイバー攻撃を防御できるのか、その実力が問われている。

出典: RSA

言語モデルとスパムフィルター

AI言語モデルの開発でブレークスルーが起こっている。OpenAIは大規模な言語モデル「GPT-3」を開発し、AIが言葉を理解し自然な文章を生成できるようになった。情報セキュリティ企業は言語モデルに着目し、AIでサイバー攻撃を防御する手法を開発している。セキュリティ市場のトップベンダーであるSophosはAI研究機関「Sophos AI」を設立し、機械学習や大規模AIの研究を進めている。Sophosは言語モデルで高精度なスパムフィルターを生成する技法を発表した。

Sophosの研究概要

この研究は、AIでスパムを生成し、これを使ってスパムフィルターのアルゴリズムを教育するというもの。スパムフィルターの開発では高品質な教育データの整備が必要であるが、人間に代わり言語モデルがスパムを生成する。AIが生成したスパムでAIアルゴリズムを教育すると、高精度でスパムを検知でき、開発プロセスが大幅に効率化される。この研究ではOpenAIが開発した中規模の言語モデル「GPT-2」が使われた。

スパムとは

スパムとは受信者の意向を無視して送られるメッセージで、大量に配信され、宣伝広告を目的とする。また、フィッシングやマルウェアを拡散する目的でも使われ、迷惑メールだけでなく、サイバー攻撃の媒体としても使われる。これらのスパムを収集して教育データとして使うが、SophosはこれをGPT-2で生成する技術を開発した。(下のテーブル： GPT-2で生成したスパム。)

出典: Younghoo Lee

スパム検知技術

スパムフィルター開発の歴史は長く様々な技法が登場している。フィルターが誕生した当初は、特定用語や発信者のアドレスなどをキーにメッセージを選別した(Signature方式)。今では機械学習が主流となり、言葉の重みを統計的に査定する方式(term frequency–inverse document frequency)や異なる手法を併用するモデル(Random Forest Modelなど)が使われている。

ニューラルネットワーク

更に、ニューラルネットワークを使い、スパムフィルターの精度を上げる研究が進んでいる。ニューラルネットワークとして「LSTM(Long Short-Term Memory)」や「CNN(Convolutional Neural Network)」や「Transformer」が使われ、単語の関係を把握してスパムを判定する。特に注目されているのがTransformerで、単語の意味からその関係を把握する(Attentionベースと呼ばれる)。

Transformerベースの言語モデル

TransformerはGoogleが開発した技術でこれが言語モデルのブレークスルーとなった。GoogleはTransformerを実装した言語モデル「BERT」を開発し高度な言語機能を実証した。また、OpenAIはTransformerを実装した「GPT」を開発し、最新モデル「GPT-3」は人間レベルの言語能力を示した。Sophosはこの中で中規模モデル「GPT-2」を使ってスパムフィルターを開発した。

教育データの生成

スパムフィルター開発ではアルゴリズムを教育するためのデータの生成で時間を要し、システム開発で一番時間を要するステップとなる。スパムのデータ数が限られるため、通常は人間がサンプルを改造して件数を増やす(Data Augmentationと呼ばれる)。具体的には、スパムの文字を同意語で置き換え、また、文字をランダムに挿入・削除するなどの操作をする。このマニュアル作業に代わり、言語モデルGPT-2が高品質なスパムのサンプルを生成する。

GPT-2の制御技術

一方、GPT-2は文章を生成するAIであるが、生成された文章はランダムで、必ずしもスパムとして使えるわけではない。このため、言語モデルが生成する内容やスタイルを制御する技術が必要となる。Sophosは「PPLM (Plug and Play Language Model)」と呼ばれる技法を使い、目的に沿ったスパムを生成している。(下のグラフィックス、言語モデルのパラメータを変更し目的に沿った内容の文章を生成。下記はポジティブなトーンの文章を生成する事例。)

出典: Uber Research

PPLMとは

PPLMとはUberの研究所Uber Researchにより開発された技法で、GPT-2など言語モデルに制御機構(Attribute Models)を付加し、目的に沿った文章を生成する。制御機構でセンティメントを指定するとそれに沿った文章が生成される。(下のテーブル、Positive及びNegativeと示された文章で、ポジティブ・ネガティブなトーンとなる)。また、トピックスを指定するとこのテーマで文章が生成される。(下のテーブル、Science及びPoliticsと示された文章で、科学及び政治のテーマに沿った文章が生成される)。因みに、PPLMで何も指定しないとニュートラルな文章が生成される(下のテーブル、[-]と示された部分)。

出典: Uber Research

生成されたスパムとハム

SophosはGPT-2をPPMLで制御してスパム生成した(先頭から二番目のグラフィックス)。このケースではGPT-2は「Santa calling! Would your little」という文字に続くスパムを生成した。また、GPT-2はスパムだけでなく通常のメッセージ(Hamと呼ばれる)を生成することもできる(下のグラフィックス)。このケースではGPT-2に「A lot of this sickness」に続くハムを生成するよう指示した。

出典: Younghoo Lee

スパム検知アルゴリズムの教育

前述の通り、GPT-2はスパム検知フィルターとして機能する。同じアルゴリズムがスパムを生成すると同時にスパムを検知する。GPT-2にテキストを入力し、スパムかどうか尋ねると、その判定結果を回答する。生成したスパムでGPT-2のアルゴリズムを教育すると、人間が手作業で収集・編集したスパムで教育するより高い判定精度を示した。GPT-2で教育データの生成を自動化でき、また、検知精度も向上することが分かった。

AI対AIの戦い

今ではボットがスパムメッセージを生成し偽情報を拡散し消費者を攻撃する。これらのメッセージをGPT-2が解析し、スパムを見つけ出し、それをフィルタリングする。スパムフィルタリングはAIとAIの対決で、如何に高度なアルゴリズムを使うかで勝敗が決まる。このため、GPT-2を最新のスパムで教育しアルゴリズムをアップデートする必要がある。また、次のステップとしては、より高度な言語モデルを使いスパムフィルターの精度を上げることが重要となる。

Microsoftは話し言葉でプログラミングできる技法を公開、OpenAIと共同で大規模AIの開発を加速

Microsoftは2021年5月、話し言葉でプログラミングできる技術を公開した。エンジニアが言葉で指示すると、AIはこれをプログラム言語に変換する。このAIは「GPT-3」と呼ばれ、言葉を理解する言語モデルで、OpenAIにより開発された。OpenAIはGPT-3をMicrosoftに独占的にライセンスしており、これが最初の商用モデルとなる。

出典: Microsoft

自然言語でプログラミング

Microsoftは開発環境「Power Apps」に言語モデル「GPT-3」を組み込み、話し言葉でプログラミングできる技術を開発した。アプリケーション開発ではプログラム言語を使ってコーディングするが、このシステムは自然言語でプログラミングできる(上のグラフィックス)。例えば、「Show me the Customers from U.S whose subscription is expired(サブスクリプションが切れた顧客を表示)」と指示すると(右上の枠)、システムはこれをプログラムに変換する(右下の部分)。プログラム言語は「Power Fx」で、ここでは二つのモデルが示され、開発者はこれをクリックするだけでコーディングが終了する。

ノーコード開発プラットフォーム

このシステムを使うと、プログラミングの知識がなくても誰でもアプリをコーディングできる。Microsoftはこの開発モデルを「Citizen Developers」と呼び、誰もがコーディングできるようになり、プログラム開発者の数が増えると期待している。一般に、コマンドではなくグラフィカル・ユーザインターフェイスでプログラミングする方式は「No-Code Development」と呼ばれているが、MicrosoftはこれをAIによる自然言語の変換で実現した。

Microsoft Power Appとは

MicrosoftはNo Code方式をPower Appsに実装した。Power Appsは簡単にアプリ開発できるフレームワークで、最小限のプログラミング技術でコーディングが可能となる。Visual Studioはプロ開発者向けの開発環境であるが、Power Appsは万人が使えるシステムとなる。

開発方式の進化

Power Appsの投入で開発方式が大きく変わっている。従来は、アプリを設計・開発・試験・運用の順序で行う方式「Waterfall Development」が主流であったが、今ではアジャイル方式「Agile Development」(下のグラフィックス)に移っている。この方式は、短期間でこのサイクルを繰り返し、プロトタイプ(minimum viable product)を開発する。

出典: Microsoft

新型アジャイル方式

これに対して、MicrosoftはPower Appsを使い、プログラミングと同時にユーザインターフェイスを開発できる「WYSIWYG (what you see is what you get)」方式を提唱した。この方式では、即座にプロトタイプが完成し、これをベースに新機能を追加しバージョンアップを繰り返す(下のグラフィックス)。Microsoftはこの方式を新型アジャイル方式「Agile V2 Development」と呼んでいる。

出典: Microsoft

Low CodeからNo Codeへ

Power Appsのプログラミング技法は前述の通り「Low-Code Development」と呼ばれ、最小のコーディングでプログラムできる。Power Appsのプログラム言語は「Power Fx」と呼ばれ、Microsoft Excelでマクロを書くように最小限のコーディングでアプリを開発する。(下のグラフィックス)。

出典: Microsoft

更に、Power AppsにGPT-3が統合され、今度は、コーディングすることなくアプリを開発できるようになった。言葉で指示すると(下のグラフィックス)上述のPower Fxコードが生成される。この方式は「No-Code Development」と呼ばれ、幅広い普及が期待されている。

出典: VentureClef

MicrosoftとOpenAIとの提携

MicrosoftはOpenAIと共同開発を進めてきたが、2020年9月、GPT-3を独占的にライセンスを受けることで合意した。その対価として、MicrosoftはOpenAIにGPT-3開発のためのAIスパコン環境を提供する。MicrosoftのAIスパコンは世界ランキング5位の性能を持つ。GPT-3のニューラルネットワークは巨大で、大規模AIを開発するためにはスパコンが必要となる。

GPT-3とは

GPT-3は言語モデル「Autoregressive Language Model」で、入力された言葉に基づき、それに続く言葉を予測する機能を持つ。シンプルな機能であるが、これが言葉を理解する本質的な能力となり、文章の生成や言語の翻訳や文章の要約ができる。MicrosoftはGPT-3で言葉をプログラム言語に翻訳する技術を開発した。GPT-3は世界最大規模のニューラルネットワークで構成されたAIで、けた違いに高度な言語能力を示す。

Emerging Technology Review

シリコンバレーからの最新技術レポート

月別アーカイブ: 2021年6月

Googleは小売店舗をニューヨークにオープン、ハードウェア事業を拡充する戦略に舵を切る

国民から信頼されるAIを探求、米国政府はAIの信頼性を指標化し計測する研究を開始

AIで高性能スパムフィルターを開発、言語モデルGPT-2がスパムを生成しアルゴリズムを教育

Microsoftは話し言葉でプログラミングできる技法を公開、OpenAIと共同で大規模AIの開発を加速