カテゴリー別アーカイブ: AR/VR/MR

AIに口説かれると落ちる!?アルゴリズムで造られる音声は人間より豊かな表現力を持ち聞き手に感動を与える

Apple Siriが急に色あせてきた。AIにより生成されるボイスの品質が進化し、今では人間の表現力を上回る。AIで生成される音声は「Synthetic Voice」と呼ばれ、人間のように流暢な喋りができるだけでなく、多彩な感情を表現できる。アニメやゲームの中でアバターが喋る言葉はAIで合成され、人間のように感情がこもった会話が交わされる。

出典: Sonantic

感情豊かなAIボイス

多くの企業がAIボイスを開発しているが、英国に拠点を置く新興企業Sonanticは、感情豊かな合成音声を開発している。生成された音声は人間のものと区別がつかないだけでなく、声優のように、感情に富んだ会話ができる。AIボイスと言えば、Apple SiriやAmazon Alexaが普及しているが、声はモノトーンで機械的な会話となる。新興企業から新世代のAIボイスが登場し、Google Assistantなどの魅力が色あせてきた。

デモビデオ

Sonanticが開発するAIボイスは聞き手を会話に引き込む魅力を持っている。Sonanticはデモビデオを公開しAIボイスの進化をアピールしている(https://www.youtube.com/watch?v=gS1m_TIxEW0)。ビデオで、女性が視聴者に語り掛けるが、これらはAIにより生成されたもので、言葉の端々に微妙な感情表現が窺える。また、言葉ではない、笑いや息遣いが混じり、人間らしさがひときわ際立つ。

微妙な感情表現

微妙な感情表現は「Subtle Emotions」と呼ばれ、人間らしさを演出する技術となる。その一つが、男女関係における駆け引きで、相手の気を引こうとして媚びた感情を表現する。現実社会の会話でも、これは高度なテクニックになるが、AIボイスはこれをマスターし、なまめかしく魅力的な声で男性を誘惑する。また、目立たないようにする控えめな表現や、相手の好奇心をくすぐる表現もできるようになった。

言葉にならない表現

AIボイスを人間らしいと感じるのは、言葉以外の発声が混じるためである。これらは、「Non-Speech Sounds」といわれ、息遣いや、咳払いや、笑いなどを指す。また、「あー」とか「えー」など、無駄な発声もこの区分となる。人間は、スピーチするときには、これらの口癖を矯正するように教えられるが、AIボイスはあえてこれらを取り込み、人間臭さを演出する。(下の写真、発声の最後に咳ばらいを挿入する操作。)

出典: Sonantic

AIボイスの生成方法

AIボイスはダッシュボードでインタラクティブに生成する(下の写真)。アバターが発声するテキストを入力し、それに感情を付加するプロセスとなる。例えば、「The enemy fleet is attacking」というテキストを入力すると、音声が合成される。その際に、シーンに応じて、言葉に感情を与える。ここでは、「怒り」、「恐怖」、「幸せ」、「悲しみ」、「絶叫」などの要素を注入できる。また、声のピッチやタイミングなどを設定できる。

出典: Sonantic

ゲームで使われている

ゲーム開発会社Obsidianはアバターが喋る言葉をSonanticで合成している(下の写真)。今までは、声優がシーンに合わせて音声を吹き込んでいたが、今では、Sonanticの技術を使っている。AIボイスは声優のレベルに達し、人間がマニュアルで声を吹き込む必要がなくなった。また、AIボイスはゲーム開発の進行に応じて、シーンの変更があれば、何度も作り直すことができ、コンテンツ開発が効率化された。

出典: Obsidian

ニューラルネットワーク

Sonanticはニューラルネットワークを人間の声で教育し、AIボイスを生成する手法を取る。人間らしいAIボイスを生成するためには、教育データの品質がカギとなる。このため、声優に様々な感情を含む声を録音してもらい(下の写真)、それを教育データとして使った。しかし、「Non-Speech Sounds」については、この方法では高品質なAIボイスを生成できなかった。このため、SonanticはNon-Speech Sounds向けに独自のニューラルネットワーク開発し、AIボイスが息遣いをマスターした。

出典: Sonantic

声優の役割

声優はゲームやアニメや映画で欠かせない存在であるが、いまその役割がAIボイスで置き換えられている。声優は、声の吹込みから、AI開発のための教育データの生成に、その役割が変わってきた。長年、エンタメ業界を支えてきた声優の職をどう守るかが問われている。

会話の表現方法

会話はその内容より話し方など表現方法が意思伝達で重要な役割を担う。会話の中で伝達された情報より、それがどのような形で伝わったかが、発言者の意図を把握する手段となる。このため、高度なコミュニケーションを構築するには、AIボイスが感情を表現できることが必須の技術となる。

出典: Meta

倫理的な使い方

AIボイスは聞き手の感情を操作する能力を持ち、その使い方には注意を要す。メタバースでは、自身のデジタルツインを介してコミュニケーションするが、会話の相手は人間だけでなく、AIとの対話が始まる。AIが多彩な表現力を駆使して、消費者に高額な商品を販売し、危険な契約を結ばせる。AIボイスを使ったヘイトスピーチや虐めが始まると、今以上にダメージが深くなる。高度なAIボイスが悪用されると、その被害は甚大で、倫理的な使い方のガイドラインの制定が必須となる。

これはもうNFTバブル!!デジタルアートに常識外の高値が付く、セレブが競って購入し市場は危険水域に

米国でNFT取引がブームを通り越しバブルとなっている。NFTとは、デジタルアセットの所有権を示す証文で、これによりデジタルアートやアバターなどを売買するビジネスが生まれた。しかし今では、価値があるとは思えないデジタルアートをセレブがこぞって購入し、これにより価格が高騰し、市場が危険な水域に入った。

出典: OpenSea

退屈したサル

サルをモチーフにした「Bored Ape Yacht Club」(上の写真)が破格の値段で取引されている。これはデジタルアートのコレクションで、「ヨットクラブの退屈したサル」というテーマとなっている。1万種類のサルが生成され、それらがNFTとして売買されている。これらの作品は1点が140 ETH (約5200万円)で、常識外の値動きとなっている。

セレブがNFTを購入

何の変哲もないデジタルアートになぜ破格の値段が付くのか議論を呼んでいる。理由の一つが、著名人の影響で、セレブが競ってNFTを購入しているという事情がある(下の写真)。有名モデルParis Hilton(左側の人物)と、トーク番組司会者Jimmy Fallon(右側の人物)は、相次いでBored Ape Yacht Clubを購買した。両者はトークショーで、NFTをプリントアウトしたものを示し、一躍、Bored Ape Yacht Clubの名前が全米に広がった。このようなセレブの“PR活動が”NFT人気を押し上げている。

出典: @jimmyfallon

何のために購入するか

Jimmy Fallonは購入したデジタルアートをTwitterのプロフィール写真として使っている(上の写真、左上のアバター)。NFTを本人を表すアバターとして使っている。高額なNFTをアバターとして使うのは、レアな作品を所有していることを誇示する目的がある。しかし、最終目的は投資のリターンで、NFTを転売して利益を得ることにあるといわれている。このた、プロフィールを“広告塔”として利用し、価格を吊り上げているとの解釈もある。

トランザクションの内容が分かる

Jimmy Fallonが購入したアートは作品番号「#599」(下の写真)で、2021年11月7日に46.6 ETH (当日のレートで約$216,000=約2500万円)で落札している。NFT収集家「collector936」から購入している。このNFTはブロックチェーン「Ethereum」で生成されており、過去のトランザクションすべてが「Block」と呼ばれるデータベースに記録されている。このBlockは公開情報で、誰でもこれを見ることができ、購買に関する全ての情報が分かる。これがブロックチェーンの特徴で、Jimmy Fallonが落札した価格や購入先などを知ることができる。

出典: OpenSea

NFT価格の推移

セレブが競ってNFTを購入している。Jimmy Fallonの他に、ラップ歌手Eminemやバスケットボール選手Steph CurryがBored Ape Yacht Clubを購入した。これらがニュースで報道され、NFTの人気が高まり、価格が上昇している。Bored Ape Yacht Clubの取引価格の推移を見ると(下の写真、折れ線グラフ)、2021年11月ころから価格が上昇に転じていることが分かる。

出典: OpenSea

Bored Ape Yacht Clubとは

Bored Ape Yacht ClubはYuga Labsという団体により開発されたNFTであり、ヨットクラブに属する退屈したサルというストーリーになっている(下の写真)。デジタルアートはプログラムで生成されたもので、170の特徴量を変化させ、1万種類のサルのイメージを生み出した。NFTはEthereumで生成されるトークンで、「ERC-721」という規格に準拠し、データは分散ファイルシステムに格納される。

出典: Bored Ape Yacht Club

NFTの危険性と将来性

デジタルアートの価値の評価は難しいが、特定のNFT価格が常識外の値動きを示している。また、デジタルアートを盗み、それをNFTに変換した模造品の販売が広がり、深刻な問題となっている。また、メタバースで、土地というデジタルアセットの購入が進み、不動産ブームが起こっている。米国において、メタバースで危険な投資が広がり、NFTという新しいビジネスモデルが試されている。

米国でNFTブームが続くなか模造品の販売が広がる、メタバースにおける知的財産権の管理が最大の課題

米国でNFT取引がブームになっている。簡単にNFTを生成でき、これを高値で販売して、短時間でリッチになれる。NFTとは、ブロックチェーンで稼働するトークンで、デジタルアセットの所有権を示す。NFTは新しいコンセプトで、その仕組みは正しく理解されていない。このため、NFT売買で不正行為が始まり、消費者やクリエーターが被害にあっている。メタバースでデジタルアセットの販売が始まるが、その知的財産権の管理が大きな課題となる。

出典: OpenSea

NTFでリッチになれる

NFTで短時間に利益を得る行為は「Get-Rich-Quick」と呼ばれ、米国社会で話題になっている。多くの実例が報道され、これがNFTブームを押し上げている。先月、ジョージア州アトランタ郊外に住む二人の女性は、アヒルをテーマとするデジタルアートを創作し、それをNFTとして販売したところ(上の写真)、6時間で12万ドル(約1400万円)の収入を得た。二人は生活費に困る生活をしていたが、収入を土地のローン支払いに充て、差し押さえを回避したと報道された。

NFTが高値で売れる仕組み

このNFTは1万点から成るアヒルのデジタルアートで、「Dastardly Ducks」と命名され販売された。デジタルアートはプログラムで生成され、同じテーマを保ちながら、パターンを変化させることで、1万種類のデジタルアートを生成した。これらがNFT収集家により購入され、短時間で高収入を得た。今では、これらのデジタルアートが、NTF収集家により転売されている。1点の値段は0.0036 ETH (Ethereum) で、今日の相場では 10.60ドルとなる。アヒルのデジタルアートに10ドルの価値があるのか判断が分かれるが、値上がりが期待できるとして、NFTの売買が進んでいる。

NFTとは

NFTとはブロックチェインで構成されるトークンで、デジタルアセットなどの所有権を示す証文となる。NFTのデータは、ブロックチェインの分散データベースで安全に管理される。上記のケースでは、NTFはブロックチェイン「Ethereum」で運用されている。更に、NFTの売買に関する規定は、スマート契約機能「Smart Contracts」でプログラミングされる(下の写真)。アヒルのアートはこの契約に基づき、マーケットプレイス「OpenSea」で売買された。

出典: OpenSea

模造品の販売

NFTという新しい事業モデルで市場が急拡大しているが、同時に、様々な違法行為が発生している。デジタルアートは簡単に複製できることから、その模造品が生成され、マーケットプレイスで販売されている。Eコマースサイトで、ブランド品の模造品が販売されるように、盗用したデジタルアートのNFTが販売されている。しかし、デジタルアートは複製したものと見分けはつかず、犯罪行為を防ぐのは容易ではない。

被害が広がっている

テキサス州サンアントニオに住むアーティストAja Trierは、犬をモチーフにしたデジタルアート「Starry Night Dogs」を制作している。犬の背景が、ゴッホの星月夜「The Starry Night」のデザインで、独特の筆遣いがデジタルアートに取り込まれている。TrierはこのデジタルアートをNFTに変換し、マーケットプレイスで販売している(下の写真)。このデジタルアートが盗まれ、犯罪者はこれをNFTに変換し、マーケットプレイスで販売していることが判明した。

出典: OpenSea

簡単に複製でき被害が広がる

犯罪者は、デジタルアートのファイルをダウンロードし、それをNFTに変換して販売する。デジタルファイルをNFTに変換するプロセスは「Mint」と呼ばれ、ブロックチェインでトークンを生成する作業となる。このプロセスはシンプルで、技術の知識は必要なく、誰でも容易に実行できる。今では、この盗用作業がソフトウェア・エージェント(Bot)で実行され、被害が広がる要因となっている。

模造品への対応

クリエーターは、自分の作品がコピーされ、NFTとして販売されていれば、そのサイトの管理者に連絡し、それを取り下げてもらう措置を取る。また、NFTが取引されるマーケットプレイスは数多くあり、これらのサイトで模造品の販売をチェックする必要がある。消費者は、NFTを購入する前に、デジタルアートの持ち主を確認し、被害を防ぐことが求められる。NFT市場が拡大するが、消費者を保護する仕組みは無く、詐欺にあわないためには、自分で防衛するしか手は無い。

メタバースが抱える最大の課題

メタバースではデジタルアセットの売買が主要な収入源となると期待されている。デジタルアセットは、デジタルアートの他に、写真(下の写真)やコレクタブルなどが対象となる。これらがNFTとして売買されるが、模造品による犯罪行為が懸念されている。簡単に複製できるデジタルアセットを如何に安全に取引できるかが課題となる。

出典: OpenSea

NFTの法的解釈】

デジタルアートとNFTの関係

NFTは新しいコンセプトで、これに関連する知的財産権(著作権や商標権など)の理解が進んでいないことが、被害を拡大する要因となっている。NFTの売買条件は「Smart Contract」で規定されるが、多くのケースで、NFTだけを購入する条件となっている。具体的には、購入者は、NTFとデジタルファイルを得るが、デジタルアートの知的財産権は含まれていない。つまり、NFTを購入しても、デジタルアートの知的財産権を得ることはできない。現実社会でのアート取引とは異なり、購入者はNFTを得るが、デジタルアートの所有権を得るわけではない。NFTを購入する際は、NFTを高値で購入してもアートの所有者にはなれないということを理解しておく必要がある。

模造品の販売は違法ではない?

NFTに関する法整備が進んでいない現在では、NFTの模造品を販売することの法的解釈が議論となっている。犯罪者は、デジタルアートを盗んで、それを販売しているのではなく、そのNFTを販売している。NFTには知的財産権は含まれおらず、犯罪者は制作者の知的財産権は侵害していないという議論がある。知的財産権は製作者が所有し、犯罪者はその証文であるNFTというトークンだけを販売している。ブロックチェインが内包する問題の一つで、これから議論を進め、関連法令の整備が必要となる。

Meta(Facebook)は世界最速のスパコンを開発、AIとメタバースは高性能プロセッサが勝敗を分ける

Meta(Facebook)は、今週、スパコンを開発していることを明らかにした。最大性能は5 Exaflopsで世界最速のマシンとなる。Metaが独自でスパコンを開発するのは、AIとメタバースの開発で、大量の演算処理が必要になるため。AI開発ではアルゴリズムの規模が巨大化し、その教育には高速プロセッサが必須となる。メタバースはAIと密接に関連し、3D仮想社会を生成するには、高精度なコンピュータビジョンが求められる。

出典: Meta

スパコンの概要

Metaは、スパコンを「AI Research SuperCluster(RSC)」(上の写真)と呼び、AI研究のための高速計算機と位置付ける。今年中旬の完成を予定しており、演算性能はExaflopsを超える。(Exaflopsとは1秒間に10の18乗(10^18)の演算を実行する性能。) 現在、最速のマシンは442 Petaflops (0.442 Exaflops)で、ついにスパコンがExaの領域に入ることになる。

研究テーマ

スパコンは、名前が示しているように、AI研究で使われる。Metaは、自然言語解析(Natural Language Processing)やコンピュータビジョン(Computer Vision)の開発をスパコンで実行する。これらAIモデルはアルゴリズムが巨大化し、その教育で大規模な演算が発生する。パラメータの数が1兆個を超え、もはや、スパコン無しにはAIを開発することができない。

自然言語解析:有害コンテンツを検知

自然言語解析はソーシャルネットワークの有害情報(Harmful Contents)を検知するために使われる。FacebookやInstagramで、フェイクニュースやヘイトスピーチが拡散し、社会問題となっている。今では、ワクチンに関する偽情報が拡散し(下の写真)、ワクチン忌避者が増えている要因とされる。これら有害情報をAIで正確に検知する技術は確立されておらず、ソーシャルネットワークの責任が厳しく問われている。

出典: Meta

Few-Shot Learning

AIが有害情報を正確に検知できない理由は、教育データが不足しているため。アルゴリズムを教育するには、大量のデータを必要とするが、有害情報に関するデータは少ない。例えば、ワクチンに関する偽情報は、少ないだけでなく、その内容は短期間で移り変わる。このため、Metaは少ない事例でAIを教育する「Few-Shot Learning」という技法を開発している。このモデルで判定精度を上げるためには、アルゴリズムのサイズを大きくする必要があり、AIが巨大になる。大規模なモデルを教育するためにスパコンが必須のインフラとなる。

コンピュータビジョン:メタバースの開発

次世代プラットフォームであるメタバースを開発するために、スパコンが必要となる。メタバースは3D仮想社会で、利用者はアバターを介し、オブジェクトとインタラクションする(下の写真)。メタバースにアクセスするためにAR・VR・MRグラスが使われ、デバイスに仮想社会が生成される。高品質な仮想社会を生成するためにコンピュータビジョンが重要な役割を果たし、この開発でスパコンが必須となる。

出典: Meta

システム構成

スパコンのプロセッサにはNvidiaのAIシステム「NVIDIA DGX A100」(下の写真)が使われる。このシステムはNvidiaの最新プロセッサ「A100」を8台搭載した構成で(①の部分)、高速ネットワーク「InfiniBand」で通信する。スパコンは16,000台のA100を搭載し、最大性能は5 exaflopsとなる。スパコンはDGXを連結したクラスタ構成で、AI Research SuperClusterと呼ばれる。

出典: Nvidia

巨大テックがAIスパコンを開発

アルゴリズムが巨大化の道をたどり、AI開発ではスパコンが必須の計算環境となる。Googleは大規模アルゴリズムの開発でAIクラスター「Cloud TPU」を使っている。Microsoftは独自でAIスパコンを開発し、大規模言語モデルを開発している。これからは、メタバースの開発で高速プロセッサが必須となり、スパコンの用途が拡大することになる。

Meta(Facebook)はNFT市場に参入か、メタバースでデジタルアセットの販売を計画

Meta(Facebook)は、NFT市場に参入し、メタバースでデジタルアセットを販売することを計画している。NFTとはNon-Fungible Tokenの略で、デジタルアセットなどモノの所有権を示す証文(Token)となる。簡単に複製できるデジタルアセットにNFTを付加し、ブロックチェインで商取引を実行する。デジタルアートが破格の価格で取引され、NFT市場がにわかに注目を集めている。

出典: Meta

MetaのNFT計画

これはFinancial Timesが報道したもので、MetaはNTF市場に参入し、ここでコレクタブルを販売することを計画している。具体的には、Meta配下のFacebookとInstagramは、利用者のプロフィールにNFTを掲載する機能を搭載する。また、利用者が、これらソーシャルメディアで、NFTを生成することもできる。更に、MetaはNFTのマーケットプレイスをオープンし、ここでNFTの売買を行う。実際に、Metaが発表したメタバースには、NFTを購買するシーンがあり(上の写真)、最終的には仮想社会でデジタルアセットの販売で使われる。

NFTとは

そもそもNFTとは、ブロックチェインで構成されるトークンで、デジタルアセットなどの所有権を示す証文となる。NFTのデータは、ブロックチェインの分散データベースで安全に管理される。現在、NFTで使われるブロックチェインは「Ethereum」が殆どで、事実上の業界標準となっている。NFTは、Ethereumのスマート契約機能「Smart Contracts」を使い、インテリジェントに処理を実行する。事前に設定されたルール(契約)に基づき、人間の介在無しに、ソフトウェアが売買のトランザクションを実行する。NFTにより、デジタルアセットの所有権が証明され、デジタルアセットの売買をクラウド上で実行できる。(厳密には、NFTはトークンであるが、今では、NFTが付与されたデジタルアセットもNFTと呼んでいる。)

NFTマーケットプレイス

NFTの市場規模は400億ドルといわれ、その規模が急拡大している。NFTはマーケットプレイスというわれるサイトで売買される。この市場のリーダーは、ニューヨークに拠点を置く新興企業OpenSeaで、NFTブームで急成長している。OpenSeaは、オンラインサイトでNFTを生成する機能を提供しており、クリエータはここでデジタルファイルをNTFに変換する。生成したデジタルアセットをマーケットプレイスに掲載して販売する。このサイトには、デジタルアートやコレクタブルなど、幅広いNFTが掲載されている。OpenSeaはEthereumで構成されたシステムで、売買は暗号通貨「ETH(Ethereum)」などで実行される。(下の写真、OpenSeaに掲載されているデジタルアート、希望価格は2 ETH (5,456.42ドル)で、オークション方式で販売されている。)

出典: OpenSea

NFTの生成方法

NFTは誰でも簡単に制作することができる。OpenSeaのケースでは、作成画面の指示に沿ってデータを入力していくと、NFTを生成できる。イメージやビデオやオーディオなどをNFTに変換することができる。これらデジタルファイルをアップロードして、NFTに変換するプロセスとなる。この処理は「Mint」といわれ、デジタルファイルに所有者を証明するトークンを生成する作業となる。生成されたトークンはブロックチェインに安全に保管される。Mintのプロセスは有料で、利用者は処理費用「Gas Fee」を支払う。生成したNFTをマーケットプレイスで販売するが、作品が売れると手数料を支払う構造となる。

デジタルアートが高値で売れる

デジタルアートが高値で売れ、NFTブームが続いている。先月、NFTマーケットプレイスNifty Gatewayで、デジタルアートが91,806,519ドル(約104億円)で販売された。これはPakが制作した「Merge」という作品で(下の写真)、コンピュータで制作され、デジタルファイルとして売られた。ファイルには証明書NFTが添付され、これがアートの所有権を示す。(「Merge」は312,686のユニットから構成され、28,983人が購入した。一つのデジタルアートが312,686のNFTで構成されるという特異な構成。作品が転売されるごとにトークンがマージ(Merge)し、その数が減り、作品の価値が上がると説明している。)

出典: Merge by Pak

NFT市場の危険性

今では、アートやコレクタブルや写真などがNFTで販売され、デジタルアセットが投資の対象となっている。株式取引とは異なり、NFTへの法規制は無く、トランザクションで詐欺や不正行為が発生しているのも事実である。生まれたての技術で、新しいビジネスモデルが市場で試されている段階で、NFT購入には高度な判断が求められる。