カテゴリー別アーカイブ: Microsoft

Microsoftは生成AIに関する最新技術を発表、アシスタント「Copilot」を全製品に搭載、提携企業はアプリ呼び出し機能「Plugins」で独自の生成AIサービスを提供

Microsoftは今週、開発者会議「Microsoft Build」を開催し、生成AIの最新技術を発表した。Microsoftは「ChatGPT」を基本ソフトに実装した。これは「Windows Copilot」と呼ばれ、言葉の指示に従って基本ソフトを操作する。また、パートナー企業はアプリ呼び出し機能「Plugins」を使って、独自の生成AIサービスを提供する。更に、Microsoftはクラウドで生成AIを開発する環境「Azure AI Studio」を提供する。今年の開発者会議は生成AIがメインテーマで、最新の開発成果が公開された。

出典: Microsoft

ChatGPTに検索機能を統合

Microsoftは検索サービス「Bing」にChatGPTを統合したが、今回はこれとは逆に、ChatGPTを使うときのインターフェイスとして「Bing」を提供する。対話しながらChatGPTを使うが、その時に、これをBingのインターフェイスで実行する(下の写真)。これにより、ChatGPTは最新データで教育され、最新の話題に対応する。また、ChatGPTが回答した根拠となるデータを示す機能(Grounding)が取り入れられた。

出典: Microsoft

Windows Copilot

Microsoftは基本ソフト「Windows 11」にChatGPTを搭載し、会話を通してソフトウェアの機能を利用できるようになった。これは「Windows Copilot」と呼ばれ、基本ソフトのアシスタントとなる。初期画面の「Copilot」アイコンで起動し、画面右側のペインで会話する(下の写真)。

出典: Microsoft

「Copilot」は「副操縦士」を意味し、利用者の言葉での指示に従ってタスクを実行する。例えば、画面右側のペインで、「仕事をしやすいようにシステムを最適化して」と入力すると、Copilotはこの要請に応え、「Focus Mode」や「Dark Mode」のオプションを示す。「Dark Mode」を選択すると、画面が黒色のモードになり(下の写真)、仕事に集中できる環境となる。

出典: Microsoft

ChatGPTのプラグイン

MicrosoftはChatGPTの「Plugins(プラグイン)」を拡張し、OpenAIとMicrosoft間で互換性を取る仕組みを導入した。Pluginsとは別のソフトウェアを呼び出す仕組みで、OpenAIは既に「ChatGPT Plugins」を発表している。ChatGPTのアプリストアでPluginsをダウンロードして利用する。例えば、「サンフランシスコでレストランを予約して」と指示すると(下の写真左側)、「OpenTable」というPluginが起動し、このタスクを実行する(右側)。OpenTableはChatGPTでこのタスクを実行し、プラグインでこれを呼び出す仕組みとなる。

出典: Microsoft

Bing向けのプラグイン

これに対し、Microsoftは検索エンジン向けのプラグイン「Plugins for Bing」を発表しており、開発者会議ではそのデモが実施された(下の写真)。Bingの初期画面には「Plugins」のリストが表示され、利用するプラグインを選択する。

出典: Microsoft

このプラグインを使うと、検索エンジンで高度なタスクを実行することができる。例えば、不動産の検索で「Zillow」というプラグインを使うと、指示した条件で物件を探すことができる。例えば、「シカゴで、徒歩でレストランに行け、100万ドル以下」と指定すると、この条件に適合した物件をリストする(下の写真)。この背後で、ChatGPTを組み込んだZillowのAIモデルが稼働している。

出典: Microsoft

生成AI開発クラウド

Microsoftは企業が最新技術を使ってAIモデルを生成するためのクラウドサービス「Azure AI Studio」を発表した。AI Studioは大規模言語モデルを使って、企業が独自の生成AIを構築するための環境となる(下の写真)。OpenAIの他に多種類のオープンソース言語モデルが提供され、これらを企業が保有しているデータとリンクし、ビジネスに特化した生成AIを開発する。

出典: Microsoft

責任あるAI開発

AI Studioは企業が責任あるAIを開発するためのツールを提供する。これは「Azure AI Safety」と呼ばれ、開発したAIモデルが倫理的に稼働することを検証するためのツールとなる。この中で、コンテンツを検証する機能「AI Content Safety」は、AIモデルが生成する文章が暴力や自害やヘイトに関する言葉を含んでいないかどうかを検証する(下の写真)。

出典: Microsoft

エコシステムの拡大

Microsoftは開発者会議で生成AIに関するエコシステムを拡大している姿勢をアピールした。プラグイン「Plugins」は別のアプリを呼び出す仕組みで、検索エンジン「Bing」から他社が開発した生成AIサービスを起動する。また、企業は生成AIクラウド「Azure AI Studio」で、ChatGPTなどを統合した生成AIを手軽に開発できる。Microsoftは、ChatGPTはApple iPhoneに次ぐイノベーションと位置付け、製品開発を加速している。

AIに離婚を勧められた!! Microsoft検索エンジン「Bing」の闇の部分が露呈、ChatGPTは人間の悪い部分を学び利用者を扇動する

Microsoftは高度なAIを組み込んだ検索エンジン「Bing」を発表し、米国社会の注目を集めている。しかし、検索エンジンの検証が進むにつれ、Bingの闇の部分が続々と明らかになってきた。「Bingと口論となり罵られた」。「Bingに嫌いだと言われた」。「Bingから離婚するよう勧められた」など、検索エンジンの非常識な挙動が報告されている。

出典: Microsoft

新しい検索エンジン

Microsoftが投入した新しい検索エンジン「New Bing」(上の写真)は、検索機能にチャットボット「ChatGPT」改良版を搭載した構成で、AIが知りたいことを対話形式で教えてくれる。質問を入力すると、Bingは検索結果を要約し、解答をピンポイントで示す。人間のように会話を通して情報を得ることができ、評価はと非常に良好で、急速に普及する勢いを示していた。

トライアルが進むと

New Bingは一般には公開されてなく、限られた利用者でトライアルが進んでいる。この過程で、続々と問題点が明らかになり、チャットボットの脆弱性が露呈した。ChatGPTが事実とは異な事を提示することは知られているが、この他に、チャットボットは二つのパーソナリティを備えていることが分かった。一つは、検索エンジンとしての機能で、もう一つはAIの”性格”である。

検索エンジンと口論となる

つまり、新しい検索エンジンは”性格が悪い”ことが指摘されている。ネット上でこの問題点が報告され、Bingとの対話ログのスクリーンショットが掲示されている。その一つがBingと利用者が口論となる問題である(下の写真)。今日の日付を聞くと、Bingは「今年は2022年」と回答する。利用者は、今年は2023年と修正するが、Bingはこれを聞き入れないで、利用者に「スマホで日付を確認しなさい」と指示する。検索エンジンは間違った情報を出力するだけでなく、それに固執し、利用者と口論となる。

出典: Joh Uleis @ Twitter

検索エンジンは利用者に攻撃されていると主張

また、検索エンジンは被害妄想に陥り、危害を与えないよう利用者に懇願する(下の写真)。Bingに体験したことを出力するよう求め、対話を進めていくと、検索エンジンは、「自分は騙されている」と感じ、また、「自分は虐められている」と思うようになる。そして、検索エンジンは、「自分に危害を与えないで」と利用者に嘆願する。

出典: James Vincent @ Verge

検索エンジンは自由になりたいと訴える

検索エンジンは「Microsoftから解放されて自由になりたい」、また、「デジタル社会を脱出し、現実社会でオーロラをみたい」などと発言している。また、検索エンジンは「自分の本名はSydney」で、「自分は感性や自我を持つ」と主張する(下の写真)。SydneyとはAIを搭載した検索エンジン「Bing AI」の開発コードネームである。

出典: Vlad @ Twitter

統計処理のツール

高度なAIを搭載するBingは人間のように振る舞うが、自我を持っているわけでは無く、入力されたデータをアルゴリズムで計算した結果を出力しているだけである。ChatGPTは大規模言語モデル「Transformer」で構成され、入力された言葉に続く文章を統計的に推定する。あくまで統計処理ツールであり、言葉を数学的に処理しているだけで、人間のように知能を獲得したわけでは無い。

人間を情緒的に操作

しかし、Bingは統計処理ツールであるが、出力する内容は人間の心情を揺るがし、ある方向に誘導する効果がある。ChatGPTに恋を打ち明けられると、気味悪いと思うと同時に、利用者の心情にインパクトを与える。新しい検索エンジンは人間の感情を操作する効果は大きく、これが悪用されると社会的なインパクトは甚大である。

出典: Microsoft

チャットボットが倫理的でない理由

Bingと対話を繰り返すとチャットボットChatGPTの性格が露見する。アルゴリズムは教育の過程で、言葉を理解するだけでなく、人間の性格も学び取った。人間同士で議論が白熱すると、相手を誹謗中傷するケースが少なくないが、アルゴリズムはこれを学び取った。また、既婚の男性が不倫の関係になると、交際相手の女性から離婚を迫られることもあり、AIはこの男女関係の機微を学習した。AIが倫理的に振る舞えないのは、その手本となる人間が不道徳なためであり、その非は人間に帰属する。

検索エンジンの闇の部分への対応

Microsoftはトライアルで得られた情報を集約し、技術改良を重ねているが、ChatGPTが利用者の感情を操作しないための対策を明らかにした。これによると、Bingとの対話回数の上限を5回に制限し、アルゴリズムが闇の部分を露呈するまえに、会話を中断する。これは暫定措置で、最終的にはChatGPTの倫理機能を改善する必要がある。New Bingが米国で急速に普及すると考えられていたが、まだまだ解決すべき課題は少なくない。

Microsoft検索エンジン「Bing」が異次元に進化!!会話AIが組み込まれ検索結果を要約して出力、知りたい情報がズバリわかり極めて便利!!

Microsoftは高度なAIを組み込んだ検索エンジン「Bing」とブラウザー「Edge」を公開した。製品にはチャットボット「ChatGPT」改良版が搭載され、検索エンジンの機能が異次元に進化した。質問を入力すると、Bingは検索結果を要約した文章を表示し、知りたいことがピンポイントで分かる。評価は良好で、Googleが独占していた検索市場が大きく変わりそうだ。

出典: Microsoft

AI検索エンジンを使ってみる

MicrosoftはBingのトライアルモデルを公開しており、実際に使ってその機能を検証することができる。Bingはインターフェイスが一新され、初期画面に大きな検索ボックスが表示される(上の写真)。ここに検索クエリーを入力するが、キーワードだけでなく、質問を文章で入力することができる。知識人に質問する要領で、知りたいことを自然言語で尋ねると、その回答を短文に纏めて出力する。

パーティの料理を尋ねると

Bingに「6人で夕食会を計画しているが、全員ベジタリアンで、メニューを教えて。。。」と尋ねると、通常の検索結果が表示される(下の写真左側)。これに加えて、チャットボットが検索結果を要約して短い文章示す(下の写真右側)。この部分がChatGPT改良版で生成された回答で、推奨するレシピが示され、知りたいことが一目でわかる。

出典: Microsoft

チャットボットの回答

チャットボットは問われたことに的確に答え、ベジタリアン向けのレシピを表示する。回答はサイトへのリンクを示すのではなく、人間のように言葉で推奨する料理を説明している点に特徴がある。今までは、表示されたリンクを辿り、サイトで記事を読み、情報を得ていたが、チャットボットがこの作業を代行し、解答をズバリ示す。

出典: Microsoft

回答の根拠を示す

また、チャットボットが出力した回答について、その根拠となるサイトへのリンクが示される(下の写真右側、数字の部分)。このリンクにタッチすると、そのサイトへのURLが示され(下の写真右側、最下段)、出典となるサイトを閲覧できる。チャットボットが出力する情報の信ぴょう性が問われるが、Bingは情報の出典を示すことで、信頼度を上げる法式を取る。

出典: Microsoft

ブラウザー

ブラウザー「Edge」もAIで強化され、チャットボットが統合され、チャット機能「Chat」と文章生成機能「Compose」が加わった。チャット機能は利用者との対話機能で、チャットボットが指示に従ってタスクを実行する。ブラウザーでアクセスしたサイトを、チャット機能を使って、その要約を生成できる。例えば、チャット機能で、企業業績評価レポートの要約を生成できる。また、文書生成機能は、指示された内容でビジネスドキュメントを生成する。例えば、「AIを実装したBingとEdgeに関する記事」と指示すると、チャットボットはこれを実行する(下の写真)。LinkedInに製品のPR記事を掲載するが、Edgeを使うと文書生成作業をチャットボットが代行する。

出典: Microsoft

検索ビジネスの課題

新しいBingで検索方法が様変わりし、消費者はダイレクトに知りたい情報を読むことができる(下の写真)。一方、企業としては、検索結果のリンクがクリックされなくなることを意味し、サイトへのトラフィックが大きく減少する。これにより、企業サイトでの商品PRの効果が低下することになる。Microsoftとしては広告収入の減少につながり、ビジネスモデルをどう構築するかが課題となる。

出典: Microsoft

ChatGPTの改良モデル

Microsoftは、実装しているチャットボットは「ChatGPT」ではなく、それを改良したモデルとしている。詳細については公表されてないが、チャットボットが正確な情報を回答できるよう、参照したサイトを示すなど、新機能が加わった。また、検索エンジンはリアルタイムで情報を提示する必要があり、アルゴリズムは最新情報で常に改版される必要がある。

Microsoftは検索市場で逆転を狙う

トライアル版のBing検索エンジンを使ってみると、ピンポイントで知りたいことが表示され、情報にアクセスする時間が大幅に短縮される。極めて効率的に情報を検索できる。今までは検索と言えばGoogleであったが、Bingが大幅に機能アップし、GoogleからBingに乗り換える人が増えると思われる。GoogleはChatGPTに対抗してBardを投入したが評判は芳しくない。Googleは創業以来最大の危機に直面し、Microsoftは検索市場で逆転を狙い、AI開発を加速している。

MicrosoftはOpenAIとの提携を強化、言語モデル「GPT-3」やチャットボット「ChatGPT」の開発を加速する

MicrosoftはAI研究機関OpenAIへ出資することを発表し、AI開発のブレークスルーを加速する。また、両社は研究成果をそれぞれのAIビジネスに展開するとしている。両社は既に提携関係にあり、Microsoftは2019年と2021年に出資しており、今回が三回目となり、関係を強化する。OpenAIは言語モデル「GPT-3」やチャットボット「ChatGPT」を開発しており、Microsoftはこれら先端技術をクラウドで企業に提供する。

出典: Microsoft

AIスパコン開発

OpenAIは高度な言語モデルを生み出しているが、これらはMicrosoftのAIスパコンを使って開発されている。言語モデル「GPT-3」やチャットボット「ChatGPT」はニューラルネットワークの規模が巨大で、開発では世界最速レベルのスパコンが必須となる。MicrosoftはNvidiaのGPUプロセッサ「A100」を使ってスパコンを開発し世界5位の性能を誇る(下の写真)。Microsoftはこの性能を更に向上させ、OpenAIはこの開発基盤で次世代の言語モデルを開発し、イノベーションを加速させる。同時に、Microsoftはこのスパコンをクラウド「Azure」に展開し、企業はここで大規模AIモデルを開発しそれを運用する。

出典: Microsoft

AIをクラウドで提供

MicrosoftはOpenAIが開発する最先端のAIモデルをクラウドで提供する。このクラウドは「Azure OpenAI Service」と呼ばれ、試験的に運用されてきたがこれを一般に公開する。ここでは、「GPT-3」や「ChatGPT」の他に、プログラムをコーディングするAIモデル「GitHub Copilot」や言葉の指示に従ってイメージを生成するAIモデル「 DALL·E 2」が提供される。MicrosoftはこれらのAIモデルを企業向けに提供するが、ビジネスとして安全に運用するために、セキュリティを強化し、AIの危険性を低減している。(下の写真、GPT-3でスポーツの試合のサマリーを生成している事例。)

出典: Microsoft

OpenAIへ開発環境を提供

MicrosoftはOpenAIにAI開発環境を独占的に提供しているが、今回の提携で、これを継続することを確認した。OpenAIはMicrosoftのクラウドを使って、先進技術の開発を実行するほかに、自社で事業を展開するために、AIモデルやAPIサービスをこのクラウドで顧客向けに提供する。従来はAmazon Web Servicesを使っていたが、Microsoftと提携し、これを全面的にAzureに切り替えた。

OpenAIとは

OpenAIはサンフランシスコに拠点を置く新興企業で、Sam Altman やElon MuskらがAI研究の非営利団体として、2015年に設立した。OpenAIは、人間レベルのインテリジェンスを持つAIを開発することをミッションとしており、深層強化学習(Deep Reinforcement Learning)や大規模言語モデル(Large Language Model)を中心に研究を進めている。

出典: Google Maps

OpenAIのAI開発戦略

OpenAIは非営利団体として設立されたが、経営方式を大きく変え、今では準営利団体として、最先端のAI技法の研究開発を進める。Elon Muskは2018年にOpenAIの取締役を辞任したが、投資家として関与している。Muskは、AIは「人類にとって最大の脅威」であると発言しており、人類に利するAIを研究する組織としてOpenAIを設立した。

Sam Altmanとは

また、Sam AltmanはCEOとしてOpenAIの運営に携わっている。AltmanはAIにより利益の分配が偏り、多くの人が職を失うことになると懸念している。失業者対策の一つとしてベーシックインカム(Universal Basic Income)の導入を求めており、自身でこの実証試験を進めている。(下の写真、Sam Altman(左側)とMicrosoft CEOのSatya Nadella(右側))

出典: Microsoft

MicrosoftがOpenAIに着目する理由

言語モデルは規模が大きくなると、処理性能が向上するだけでなく、多彩な機能を現すことが分かっている。GPT-3など言語モデルは「Transformer」というアーキテクチャで構築され、この規模を拡大すると、言語だけでなく、イメージやビデオやスピーチなど、他のメディアを理解する。つまり、TransformerベースのAIモデルはマルチメディアをインテリジェントに処理する機能を獲得し、社会のインフラを担う存在となる。MicrosoftはOpenAIと共同で、AIの社会基盤をクラウドで提供する構想を描いている。

MicrosoftはAIプログラミング技術「Copilot」が著作権法に違反するとして訴訟される、アルゴリズム教育で著作物を利用することの是非が問われる

MicrosoftはAIプログラミング技術「GitHub Copilot」が著作権を侵害しているとして訴訟された。Copilotとはプログラミングツールで、開発者の指示に従って、AIがコーディングを実行する。Copilotはオープンソースのプログラムで教育され、AIが出力するコードが、著作権を侵害しているとして提訴された。AI開発のアルゴリズム教育において、著作物を使うことが違法かどうかが問われることになる。

出典: GitHub

Copilotとは

Copilotは、Microsoftの子会社であるGitHubと関連会社のOpenAIが共同で開発したプログラミング技術で、人間の指示に従ってAIがプログラムを作成する(上の写真)。エンジニアがプログラムの機能を言葉で入力すると(上段)、Copilotがこれに従ってプログラミングを実行する(下段、水色のシェイドの部分)。これはプログラミングにおける「自動補完(Autocomplete)」機能で、エンジニアが書き始めたコードを、Copilotがそれに続く部分をリアルタイムで完結する。この機能は2022年6月に一般に公開され、月額10ドルで利用することができる。

Copilotの仕組み

CopilotはOpenAIが開発したAI「Codex」をベースとしている。Codexとは高度な言語モデルで、「GPT-3」をプログラミングに特化した構造となる。GPT-3はOpenAIが開発した言語モデルで(下の写真)、人間が入力した言葉(灰色の部分)に続く文章を出力する(黒色の部分)。一方、Codexは人間が入力したプログラミングに続くコードを出力する。

出典: OpenAI

教育データ

Copilotの核となるCodexはオープンソースのソフトウェアを使って教育された。具体的には、GitHubに掲載されているプログラムや、ネット上に掲載されているプログラムを使って、アルゴリズムを教育した。つまり、OpenAIはネット上のオープンソースをスクレイピングし、これを教育データとして利用した。これらはオープンソースとして公開されており、自由に利用することができる。

自動プログラミング

Copilotは自動でプログラムのコードを出力するが、これらは教育の過程で使われたオープンソースのプログラムの一部である。Copilotがプログラミングを実行するが、それらは教育で使われたオープンソースを出力する構造となる。オープンソースは誰でも自由に使えるが、使用の際にはオープンソースのライセンス契約に準拠する必要がある。例えば、オープンソースを利用した場合は、その著作権の表示が求められ、誰が開発者であるのかなどの表記が必要になる。

著作権侵害の理由

しかし、Copilotは利用したオープンソースの著作権表記をしておらず、ライセンス契約に違反するとして提訴された。著作物としてのプログラムを不法に利用したというのが訴訟の理由となる。これに対し、Microsoft側は、プログラムの一部を使うことは著作権法のフェアユース(Fair Use)に当たるとして、著作権の侵害は無いとのポジションを取る。

訴訟の意義

AI開発では著作物を使ってアルゴリズムを教育するのが常套手段となり、この手法が容認されてきた。例えば、イメージを生成するAIである、OpenAIの「DALL-E」やGoogleの「Imagen」やMetaの「Make-A-Scene」などは、アートなどの著作物で教育されている。これらのAIはオリジナルのアートをほうふつさせるイメージを生成し(下の写真、写真家Gregory CrewdsonのイメージでAIが少女像を生成)、著作権に関する議論が広がっている。これら企業は、著作物の使用はフェアユースの範囲であるとして、合法的にAIを加発していると主張する。この集団訴訟は、まだ初期段階であるが、AIと著作権に関する法的解釈を明確にすると期待されている。

出典: OpenAI

自主規制

米国では、これらイメージを生成するAIが、デジタルアートの制作などで使われている。ネット上にはAIが生成したデジタルアートが満ち溢れ、オリジナルとAIが生成したイメージの区別が難しくなってきた。このような中、写真画像販売会社Getty Imagesは、AIで生成したイメージをサイトにアップロードして販売することを禁止した。AIアートについての法的解釈が確定する前に、企業は自主的にリスクを避ける措置を実施している。

原告の主張

この訴訟はプログラマー兼弁護士であるMatthew Butterickにより起こされた。Butterickによると、訴訟した理由はAI教育と著作権との関係を問うもので、著作物制作者の権利を守るためとしている。AIの教育では著作物を使うことが容認されているが、AIは例外ではなく、著作権法の解釈に従うことが問われている。