作成者別アーカイブ: nad00251

AIで短編映画を制作する時代が到来！Metaはテキストからビデオを生成する技法「Make-a-Video」を公開

Metaはテキストをビデオに変換するAIを公開した。これは「Make-a-Video」と呼ばれ、言葉の指示を理解し、それに従ってビデオを生成する機能を持つ。例えば、「スーパーマンのマントをまとった犬が空を飛ぶ」と指示すると、AIはそのシーンをビデオとして生成する(下の写真)。生成されたビデオの品質は高く、メタバースやプロモーションビデオの作成などで利用される。

出典: Meta

Make-a-Videoの概要

「Make-a-Video」は入力されたテキストを解析し、その意味を理解して、指示に沿って、ショートビデオを生成する。AIは異なるスタイルのビデオを生成し、現実には起こりえないシーンを描き出す(上の写真、「空を飛ぶ犬」)。また、これとは対照的に、現実のシーンを高精度で描写する(下の写真左側、「水を飲んでいる馬」)。更に、油絵のタッチなど、特定のスタイルでビデオを生成することもできる(下の写真右側、「イブニングドレスを着た二人が帰宅中に土砂降りの雨にあったシーン」)。

出典: Meta

ビデオを生成する仕組み

Make-A-Videoは複数のAIを組み合わせ、入力されたテキストを、荒い動画に変換し、その解像度をあげて、解像度の高いビデオを生成する仕組みとなる(下のグラフィックス)。AIは、入力されたテキストの意味を把握し、それをイメージに変換する(「P」の部分)。更に、そのイメージから、動画を構成するフレームを生成し(「Dt」)、フレームの数を増やし(「F」)、それらの解像度を上げる(「SRtl」と「SRh」)処理を実行する。Make-A-Videoは、テキストからラフな動画を生成し、複数のAIでその解像度を向上し、最終ビデオを生成する構造となる。

出典: Uriel Singer et al.

イメージからビデオを生成

Make-A-Videoはこの他に、イメージをビデオに変換する機能がある。AIが、入力された1枚のイメージを、ショートビデオに変換する。例えば、オランダの画家レンブラント(Rembrandt)の名作「ガラリアの海の嵐(The Storm on the Sea of Galilee)」をMake-A-Videoに入力すると(下の写真左側)、アルゴリズムはこれをショートビデオに変換する(右側)。ここには、嵐の中でキリストを乗せた船が、高波を受けて航行する様子が、動画で描かれている。

出典: Meta

ビデオからバリエーションを生成

更に、Make-A-Videoは、入力したビデオからそのバリエーションを生成する機能がある。AIが、入力されたビデオのフレームを解析し、その意味を理解して、バリエーションを生成する。宇宙飛行士が宇宙遊泳しているビデオを入力すると(下の写真左側)、AIはそれをアレンジしたビデオを生成する(右側)。

出典: Meta

AIがイメージを生成

Metaは、これに先立ち、テキストをイメージに変換するAI「Make-A-Scene」を公開している。AIは、入力された言葉の指示に従って、イメージを生成する。例えば、「笑っている紫色のヤマアラシ」と言葉で指示すると、Make-A-Sceneはこのイメージを生成する(下の写真中央)。

出典: Oran Gafni et al.

人間に代わりAIがクリエータになる

今回は、Metaはこの機能を拡張し、「Make-a-Video」として、テキストをビデオに変換するアルゴリズムを開発した。これらはコンテンツを生成するAIで、AI研究のホットテーマとなり、新技術が続々登場している。人間に代わりAIがビデオを生成する時代に突入し、メタバースの開発や、企業のプロモーションビデオの制作などでの展開が期待されている。

MetaはMRヘッドセット「Quest Pro」を投入、メタバースの構想が製品として結実、企業向けメタバースに比重が移る

Metaは開発者会議「Connect 2022」でメタバース開発の最新状況を公開した。Metaは、昨年、このイベントでメタバースの構想を示し、数年先のビジョンを提示した。今年は、直近のメタバースに焦点を当て、その適用法やソリューションを示した。イベントのハイライトは、MRヘッドセット「Quest Pro」(下の写真)の発表で、メタバースにアクセスする技術が大きく進化した。更に、Microsoftとの提携を発表し、メタバースで３Dビデオ会議「Microsoft Teams」を利用できる。Metaは企業向けのメタバースに比重を移していることが明らかになった。

出典: Meta

MRヘッドセット「Quest Pro」

MRヘッドセット「Quest Pro」は、VR(仮想現実)とAR(拡張現実)を統合したMR(複合現実)機能を実装したウェアラブルとなる。Quest Proを着装すると、現実空間に仮想オブジェクトが組み込まれ、それを実際に手で触ることができる。例えば、オフィスで社員がQuest Proを着装すると、デスクの上に仮想のモニターが描写され、この画面で業務を遂行できる(下の写真)。価格は1,499.99ドルで、今月から出荷が始まる。

出典: Meta

仮想オフィス「Workrooms」

Metaは企業向けにメタバースを展開しており、コラボレーション・アプリ「Horizon Workrooms」を提供している。これはメタバースに構築された会議室で、社員はこの空間でコミュニケーションする。Metaは、これを大幅にアップグレードし、個人向けの仮想オフィス「Solo Workrooms」を開発している。仮想オフィスには三台の大型モニターがセットされ、ここが仕事空間となる(下の写真)。PCやMacBookを買う代わりに、Quest Proでタスクを実行する構想を描いている。

出典: Meta

3Dオブジェクト

３D仮想オフィスHorizon Workroomsの機能が強化される。これはデザイナーやエンジニア向けの機能で、会議室でオブジェクトを３Dで見ることができる。例えば、会議室において、開発中のヘッドセットを３Dで表示し、そのデザインを関係者で議論できる(下の写真)。

出典: Meta

MR会議室「Magic Room」

Metaは、現実社会と仮想社会の会議室をミックスしたMR会議室「Magic Room」を開発している(下の写真)。これは実社会の会議室に仮想の人物やオブジェクトを組み込んだ構成となる。Quest Proを着装して実社会の会議室に入ると、そこに遠隔地の社員がアバターとして参加する。また、この空間でホワイトボードに作図して会議を進めることもできる。

出典: Meta

Microsoftとの協業「Teams」

MicrosoftのCEOであるSatya NadellaはメタバースでMetaと協業することを明らかにした。その第一弾として、Microsoftのコラボレーションアプリ「Teams」をMeta向けに提供する。これによりQuest ２とQuest ProでTeamsを使うことができる(下の写真)。Microsoftもメタバース開発を進めており、Metaと競合する可能性があったが、この発表で両社は協調路線を歩むことが明らかになった。

出典: Meta

アバターに足を付加「Avatar Store」

Metaはアバターに足を付加し全身を描写できるようにした。現在のアバターは上半身だけで(上の写真)、足の部分は描かれていない。これに足の部分を付加し、完全な身体像を生成できるよう進化した(下のアバター)。手や腕の動きはヘッドセットのカメラで撮影し、それをアニメーションで表示するが、足の動きを捉えるのは難しい。足がテーブルや腕の陰になり、見えないケースが多く、そのイメージを捉えるのは難しい。このためMetaはAIを使い、アルゴリズムで足の状態を推定し、イメージを描写している。また、Metaは「Avatar Store」をオープンし、ここでアバター向けのファッション製品を販売している(下の写真)。

出典: Meta

入力モード「Electromyography(筋電図)」

Metaは研究開発中の技術についても、その概要を公表した。その一つがARグラスにデータを入力する方法で、「Electromyography(筋電図)」という技法を開発している。これは筋肉で発生する微弱な電場をAIで解析し、動作の意図を推定するもの。手首にデバイスを装着し(下の写真右側)、指を動かして方向を指示すると、ゲームの中のキャラクターがその方向に動く(左側)。これはゲームのキャラクターを動かす事例であるが、その他に、ARグラスを着装して、指を動かして写真撮影をすることができる。

出典: Meta

３Dイメージ生成技法「Neural Radiance Fields」

MetaはAIを使って３Dモデルを簡単に生成する技法を発表した。これは「Neural Radiance Fields」と呼ばれ、カメラで撮影した複数の写真をAIで繋げ、３Dイメージを構築する技法となる。例えば、クマのぬいぐるみを、スマホで複数の方向から撮影し、これをAIで繋ぎ合わせると、３Dのモデルを生成できる(下の写真)。３Dモデルを簡単に生成できるため、メタバースを構築する基礎技術として期待されている。

出典: Meta

リアリスティックなアバター「Codec Avatars」

Metaは、リアリスティックなアバターを生成する技術を公開した。このアバターは「Codec Avatars」と呼ばれ、人間の顔の形状や表面の質感を忠実に再現し、ビデオ撮影したものと区別がつかない(下の写真、Mark ZuckerbergのCodec Avatar)。特殊カメラ170台を使い、被写体の顔を異なる方向から撮影し、これらを合成して３Dモデルを生成する。ハリウッドの映画の特撮などで使われている。

出典: Meta

手軽に生成できるアバター「Instant Avatars」

これに対し、Metaはスマホで簡単に３Dアバターを制作する技法を公開した。これは「Instant Avatars」と呼ばれ、スマホカメラで複数の方向から顔を撮影し、このデータを元にAIが、高精度な３Dモデルを生成する(下の写真)。Codec Avatarは特殊カメラを使ってアバターを制作するが、Instant Avatarsはスマホで手軽に高精度な３Dモデルを生成できる点に特徴がある。

出典: Meta

企業向けメタバースにシフト

昨年の開発者会議では、Mark Zuckerbergは消費者を対象としたメタバースのビジョンを示した。今年は一転して、企業向けに現実の問題を解決するためのメタバースを提示した。ハードウェアではMRヘッドセットQuest Proを投入し、メタバースは構想の段階から製品化に進んでいることを印象づけた。ソフトウェアの観点からは、コラボレーションツールWorkroomsなどを中心に、企業向けのソリューションが示された。メタバースは企業の生産性に寄与することをアピールしたイベントとなった。

ノーベル物理学賞は「量子もつれ」の研究者が受賞、奇怪な現象を実験により確認したことが評価される、量子情報科学の発展を支える

2022年のノーベル物理学賞は「量子もつれ(Quantum Entanglement)」という現象を実験で証明した研究者三人に授与された。量子もつれとは、二つの量子(物理特性の最小単位)が離れていても、両者の動きは連動しているという現象を指す(下のグラフィックス)。二つの量子が遠く離れていても、この現象が起こり、光の速度を超えて情報が伝達することになる。アインシュタインはこれを「奇怪な動き」と呼び、量子物理学は不完全な体系であるとの論文を公開した。

出典: The Royal Swedish Academy of Sciences

三人の受賞者

アインシュタインを中心に議論が続く中、三人の科学者は実験により、量子もつれという現象が起こっていることを証明した。受賞者はアメリカのジョン・クラウザー(John Clauser)博士、フランスのアラン・アスペ (Alain Aspect)教授、オーストリアのアントン・ツァイリンガー(Anton Zeilinger)教授(下の写真)。クラウザー博士は量子もつれを実験で証明し、アスペ教授は実験方法を改良し、ツァイリンガー教授は量子もつれを情報工学に応用し、「量子テレポーテーション(Quantum Teleportation)」と呼ばれる送信技術を考案した。

出典: The Royal Swedish Academy of Sciences

受賞の意義

アインシュタインは量子もつれを「奇怪な動き(spooky action at a distance)」と呼び、量子力学は未完の体系で、この理論は正しくないとする論文「EPR Paradox」を他の研究者と共に1935年に発表した。これ以来、量子もつれについて議論が続いてきたが、受賞者はこれを実験で証明し、この奇怪な現象が起きていることを示した。直感では理解できない物理現象であるが、量子もつれは量子コンピュータや量子通信の基礎技術として幅広く使われており、ノーベル賞の選考委員会は、この実験が量子情報科学の発展に寄与したことを評価した。

量子もつれとは

量子もつれとは、二つの量子が連携した状態で、極めて特異な動きをする性質を指す。量子はランダムに動くが、二つの量子が量子もつれの状態となると、その挙動が同期する。例えば光の最小単位である光子(Photon)が、量子もつれの状態になると、二つの光子が同期して動く。一つの光子が縦方向に偏向すると、他の光子も同じ方向に偏向する。まるで二つの量子が見えない糸で繋がっているかのような挙動を示す(先頭のグラフィックス)。

隠れた変数理論

量子もつれは奇怪な挙動で、これを説明するために別の理論が提唱された。これは「隠れた変数理論(Hidden Variables)」と呼ばれ、この奇怪な現象の背後には、分かっていない変数があるという考え方。量子もつれを、実験者が観測できない変数を導入して、この挙動を説明する理論となる。スウェーデン王立科学アカデミー(Royal Swedish Academy of Sciences)は、量子もつれという現象を、ボールを投げるマシンで説明している(下のグラフィックス)。マシンには白と黒のボールが入っており、Bob(右の人物)が黒色のボールを受け取ると、Alice(左の人物)は白色のボールを受け取ったことが分かる。隠れた変数は「色」で、量子もつれには「色」という変数が隠れており、これを観測できていないという理論。

出典: The Royal Swedish Academy of Sciences

量子力学の理論

これに対して量子力学(Quantum Mechanics)では、マシンに入っているボールの色は白と黒が混ざった灰色で、ボールを受け取った時点で初めて、その色がランダムに白色または黒色になるという理論(下のグラフィックス)。Bobがボールを受け取ると、その時点でボールは黒色であることが分かる。この結果、Aliceは白色のボールを受けっとったことが分かる。

出典: The Royal Swedish Academy of Sciences

ベルの不等式

二つの理論が議論される中、両者の理論のどちらが正しいかを実験で証明することができるとの考え方が提唱された。これは英国の科学者ジョン・スチュワート・ベル(John Stewart Bell)が1964 年に、提唱したもので、「ベルの不等式(Bell Inequalities)」と呼ばれている。隠れた変数理論では、実験結果が特定の値(2)を超えないというもので、反対に、実験でこの値を超えると、量子力学の理論が正しいことが示される。

ジョン・クラウザーの実験

ジョン・クラウザーは、ベルの不等式の理論に基づき、量子もつれ証明するための実験を行った。実験では量子として、光の最小単位である光子(Photon)を使った。カルシウムの原子に特定波長の光を照射すると、二つの光子を量子もつれの状態にすることができる。二つの光子を二つのセンサーで偏光の方向を計測する(下のグラフィックス)。計測を重ねることで、実験結果はベルの不等式の条件に反することが分かり、量子力学が正しいことが実証された。

出典: The Royal Swedish Academy of Sciences

アラン・アスペの実験

その後、アラン・アスペはクラウザーの実験精度を高め、量子力学の理論が正しいことを確認した。アスペは量子もつれの光子を高速で生成する技術を開発し、また、センサーの設定を変えることで、システムは事前に結果に関する情報を得ていないことを証明した(下のグラフィックス)。

出典: The Royal Swedish Academy of Sciences

アントン・ツァイリンガーの研究

アントン・ツァイリンガーは量子もつれを応用した情報処理技術を開発した。これは「量子テレポーテーション(Quantum Teleportation)」と呼ばれ、量子の情報を遠隔地に送信する技術である。これが今日の量子通信技術や量子セキュリティ技術で使われている。

EPRパラドックス

アインシュタイン(Albert Einstein)は、量子もつれは起こりえない事象だとして、同僚の研究者ボリス・ポドリスキー(Boris Podolsky)とネイサン・ローゼン(Nathan Rosen)と共に、この現象を検証した。1935年、検証結果を発表し、量子力学は現実を記述するには完成された体系ではない、との解釈を示した。この考え方は三人のイニシャルを取って「EPR Paradox」と呼ばれている。アインシュタインは、量子力学は自然界の現象を完全に記述するものではなく、統合した理論があるとの考え方を示した。

クラウザー博士の人となり

クラウザー博士は、カリフォルニア大学バークレー校(University of California, Berkeley)で長年にわたり研究に従事し、現在は、サンフランシスコ郊外のウォールナットクリークで活動を続けている(下の写真)。地元テレビ局のインタビューで、実験開始のきっかけを明らかにした。クラウザー教授は、まず、ジョン・スチュワート・ベルに連絡し、ベルの不等式が破られていないことを確認し、実験に着手した。その当時、実験は「アインシュタインの理論を覆す無謀な挑戦」といわれ、実験で量子もつれを実証できた時は「有罪判決から解放された気分であった」と述べた。無名の研究者が歴史上の人物に挑戦した構図となった。

出典: Terry Chea / Associated Press

量子情報科学の基礎

量子もつれを実験で実証したことは、現在開発が進んでいる量子情報科学へ道筋をつけたことを意味する。量子もつれは、量子計算、量子通信、量子ストレージなどに応用され、特に、ハッキングできない安全な通信技術として社会に貢献している。

【参考情報：量子コンピュータで実行すると】

量子もつれ

量子コンピュータで量子もつれを生成し、その結果を出力すると、その挙動をビジュアルに理解できる(下のグラフィックス)。これは量子プログラム開発環境「Qiskit」を使ったもので、量子コンピュータのゲート操作(上段)とその結果が表示(下段)される。これはQubit[0]とQubit[1]に対するゲート操作で、二つのQubitを量子もつれにし、その結果が球体「Q-sphere」(下段右側)に示されている。演算によりQubit[0]とQubit[1]のスピンの方向はどちらも下向き｜11＞であることを示している。この演算を繰り返し実行すると、Qubit[0]とQubit[1]のスピンの方向はどちらも上向き｜00＞である確率が50％で、どちらも下向き｜11＞である確率が50％となる(下段左側のグラフ)。つまり、量子もつれは、Qubitのスピンの向きは、常に同じ方向であることを示している。

出典: IBM

量子テレポーテーション

量子もつれを応用した技術が量子テレポーテーションで、ある場所から別の場所に情報を送信するアルゴリズムとなる。SF映画に登場するテレポーテーションは人や物が移動するが、量子テレポーテーションでは情報(Qubitの状態)を遠く離れた場所に移動させる技術となる。量子テレポーテーションは量子もつれを応用した技法で、量子コンピュータでこの現象を実行できる(下のグラフィックス)。これは量子テレポーテーションのゲート操作で、三つのQubit(q0, q1, q2)を使う。処理は左から右側に進み、ゲート操作を実行すると、q0の情報がq2にテレポーテーションする。ゲート操作でq1とq2が量子もつれとなる。量子テレポーテーションは量子通信技術に応用され、ハッキングできないセキュアな通信として使われている。

出典: IBM

Teslaが世界最大のロボット企業になる！？自動走行技術をヒューマノイドに応用、クルマのように部品を標準化し大量生産により低価格を実現

TeslaはAI技術を発表するイベント「Tesla AI Day 2022」を開催し、ロボットの開発状況を明らかにした。このロボットは「Optimus」と呼ばれ、昨年のイベントではそのプロトタイプが公開された。今年は、その開発プラットフォームが登場し、ステージの上をゆっくりと歩くデモが実施された(下の写真)。Elon Muskはロボットを大量生産する計画で、価格はクルマより安く、2万ドルになるとの予測を示した。更に、経済生産性の観点からは、ロボットはクルマより重要で、Teslaはロボット会社に転身することを暗示した。

出典: Tesla

Optimusとは

Teslaが開発しているロボット「Optimus」は、人間の骨格を模したヒューマノイドで、二足歩行し、両手でものを持つことができる。人間は自然界で進化し、骨格や関節や筋肉などが最適化され、効率的に動くことができる。Optimusは最適化された人間の物理構造を参考に設計された。ロボットは配送センターで荷物を運び、また、製造工場では部品の組み立てなどに使われる。(下の写真、Optimusが両手で荷物を持ち、それを運んでいるシーン。)

出典: Tesla

ロボットの構造

ロボット(下の写真中央)は、人間の筋肉に相当するアクチュエータ(赤色の部分)と、神経系に相当する電気系統(水色の部分)から構成される。28のアクチュエータを搭載し、人間の動きを再現する。電気系統ではバッテリーを搭載し、また、ロボットの頭脳としてTeslaが設計した半導体(SoC)を実装する。通信技術としてはWi-FiとLTEを採用するとしている。

出典: Tesla

視覚とナビゲーション

ロボットはカメラを搭載しており、周囲を撮影しオブジェクトを把握する。ロボットがプランターの植物に水をあげる時には(下の写真左側)、植物の位置を認識し(右側)、じょうろを的確に動かす。また、屋内を移動するときには、カメラで家具などのランドマークを認識し、安全なルートを算出する。ここには、Teslaの自動運転技術が使われているとしているが、技術詳細は公開されなかった。

出典: Tesla

アクチュエータ

Teslaは人間のように効率的に動けるヒューマノイドを目指していて、このためにアクチュエータの最適なデザインを模索している。アクチュエータは人間の筋肉に相当し、その動きは速度とトルクの関係で定義される。センサーでそれらを計測し、一番効率的に動かすための関係を検証した。その結果、アクチュエータの種類を６とし、解析結果をもとに最適なデザインを開発した。(下の写真、６つのアクチュエータは色分けして示されている。グラフはそれぞれのアクチュエータの速度とトルクの関係。)

出典: Tesla

開発過程

昨年のイベントではOptimusのプロトタイプ(下の写真左側)が紹介され、今年はその開発プラットフォーム(中央)を中心に、開発状況が示された。更に、最新版のOptimus(右側)がステージに登場したが、実際に歩行することはできなかった。

出典: Tesla

最新版のOptimus

ライブデモの代わりに、Teslaは最新版Optimusが研究室で歩行訓練をしている様子を公開した。2022年4月に、最初の一歩を踏み出し、技術開発を進め、腕を振り、つま先をあげることができるようになったが、まだ歩くことはできない。最新版Optimusは、アクチュエータやバッテリーなど必要なハードウェアを搭載しており、現在、ソフトウェアを中心に技術開発を進めている。

出典: Tesla

ロボットを開発する理由

イベントでMuskは、Optimus(下の写真)は経済生産性を二けた向上することができると、繰り返し述べた。ロボットが人間に代わり、荷物を運び、部品を組み立てることで、経済生産性が大きく向上する。ビジネスの観点からは、クルマよりロボットのほうが、将来性があると述べ、Teslaはロボット企業に転身することを示唆した。

出典: Elon Musk

Muskの発言の解釈

Muskの発言が業界に衝撃を与えているが、同時に、これをそのまま受け止めるのではなく、割り引いて解釈すべきとの意見も少なくない。Muskは壮大な構想を打ち出し、社会の注目を集めるが、これが不発に終わるケースは少なくない。また、Optimusは優秀なエンジニアを雇い入れるためのPRだという解釈もある。Muskの発言は、厳密なロードマップとは異なり、柔らかい構想を示したもので、これをどこまで実現できるのか、ウォッチしていく必要がある。

AIが生成したコミックブックの著作権が認められる、テキストをイメージに変換するAIでアニメ事業がスタート

米国でテキストをイメージに変換するAIで事業が生まれている。これは、言葉の指示に従ってイメージを生成するAIで、描きたい内容をテキストで入力すると、アルゴリズムはそれに沿った画像を生成する。この手法でコミックブックが制作され、販売が始まった。著作者はコミックブックの著作権を申請し、これが認められた。AIが描き出すイメージが著作権で保護されることになり、AI出版が大きな事業になると期待されている。一方、これに慎重な姿勢を示す企業は多く、AIで生成されるイメージの販売禁止も広がっている。

出典: Kris Kashtanova

コミックブック

このコミックブックは「Zarya Of the Dawn」というタイトルで、Kris Kashtanovaにより制作された。主人公Zarya(上のイメージ)が、未来のニューヨーク(下のイメージ)を探訪するストーリーとなっている。これらのグラフィックスはAIにより生成され、ここにセリフを付加して、物語を構成し、コミックブックが創られた。アーティストが画面を描き出す代わりに、AIがイメージを生成した。

出典: Kris Kashtanova

製作者プロフィール

このコミックブックを制作したのはニューヨークを拠点に活動しているKris Kashtanovaで、職業は「Prompt Engineer」としている。テキストをイメージに変換するAIを使い、最適な入力文(Prompt)を見つけ、印象的なグラフィックスを生成するエンジニアとなる。

著作権を申請

Kashtanovaは、制作したコミックブックを著作権物として申請した。米国著作権局(United States Copyright Office)は、今週、これを認可し、コミックブックが著作物として登録された。これにより、「Zarya Of the Dawn」は、著作権法による保護の対象となった。AIが生成したイメージが著作権で保護されるのはこれが最初のケースで、AI出版事業への道筋が開けると期待されている。

過去の事例

AIが生成したイメージに対する著作権申請はこれが最初ではなく、過去にも行われたが、米国著作権局は、この申請を退けている。米国の発明家Stephen Thalerは、AIで創作したデジタルアートの著作権の登録を申請した。このAIは「Creativity Machine」という名前で、アルゴリズムが「A Recent Entrance to Paradise」という題名のデジタルアートを生成した。この申請に対し、米国著作権局は、2022年2月、AIが生成したアートは、人間が創作に関与しておらず、著作権の登録はできないとの判定を下した。

コミックブックの著作権が認められた理由

米国著作権局は、著作権で保護できる著作物は、人間が制作したものに限られる、との解釈を示している。AIなど人間以外のものが創作した著作物は、著作権の保護の対象とはならないことになる。一方、デジタルアート制作の過程で、人間の関与があれば、創作物は著作権で保護される対象となる。今回のケースでは、クリエーターがコミックブックを制作する過程で、AIというツールを使ってイメージを生成したので、この作品は著作権物として登録することができた。

出典: Kris Kashtanova

Midjourney

Kashtanovaは利用したAIは「Midjourney」であることを明らかにしている。コミックブックの表紙に、製作者として、自身の名前とMidjourneyを併記している(先頭のイメージ)。MidjourneyとはAI研究団体で、独自の手法で、テキストをイメージに変換する技術を開発した。現在はベータ版が公開されており、サイトでイメージを生成できる。ギャラリーには既に、Midjourneyで制作されたデジタルアートが掲載されている(下のイメージ)。

出典: Midjourney

主人公は誰

Zarya Of the Dawnの著作権が認められたが、主人公「Zarya」は誰かという議論が広がっている。コミックブックを通じて、AIが同じ人物を描き出しており、製作者はテキストで特定の氏名を指示していることになる。巷では、この人物は米国の女優Zendaya(ゼンデイヤ)であるとの憶測が広がっている。Zendayaは映画やテレビで活躍するでけでなく、2022年にはTimeの「世界で最も影響力のある100人」に選ばれている(下の写真)。確かに、Zendayaは主人公Zaryaに似ている。

出典: Time

AIイメージの取り使いを禁止

米国ではMidjourneyの他に、OpenAIが開発した「DALL-E」や、Stability AIの「Stable Diffusion」など、テキストからイメージを生成するAIがデジタルアートの制作で使われている。このため、ネット上にはAIが生成したデジタルアートが満ち溢れている。このような中、写真画像販売会社Getty Imagesは、AIで生成したイメージをサイトにアップロードして、これを販売することを禁止した。

禁止の理由

Getty Imagesは、AIが生成したイメージを禁止する理由として、イメージそのものと、AIを教育したイメージに関し、著作権侵害のリスクがあるという解釈を示してる。多くのAIは、著作権で保護されているイメージを使って、アルゴリズムを教育している。この手法はスクレイピングと呼ばれ、フェアユース(Fair Use)で、その利用行為は著作権の侵害に当たらないとの解釈が一般的である。しかし、生成したイメージを商品として有償で販売するケースでは、この抗弁は成り立たず、著作権侵害にあたるとの解釈がある。

出典: AI Comic Books

グレーなエリア

AIに関する著作権の議論が収束しないなか、既に、AIで生成されたコミックブックが数多く販売されている。その代表がAI Comic Booksで、AIで生成したコミックブックのマーケットプレイスで、ここで多くの作品が販売されている(上の写真)。Zarya Of the Dawnもこのサイトで販売されており、価格は無料であるが、その代わりに寄付金を募っている。アルゴリズムを著作権で保護されたイメージで教育すると、AIが生成したイメージは合法なのか、グレーなエリアでビジネスが広がっている。

Emerging Technology Review

シリコンバレーからの最新技術レポート

作成者別アーカイブ: nad00251

AIで短編映画を制作する時代が到来！Metaはテキストからビデオを生成する技法「Make-a-Video」を公開

MetaはMRヘッドセット「Quest Pro」を投入、メタバースの構想が製品として結実、企業向けメタバースに比重が移る

ノーベル物理学賞は「量子もつれ」の研究者が受賞、奇怪な現象を実験により確認したことが評価される、量子情報科学の発展を支える

Teslaが世界最大のロボット企業になる！？自動走行技術をヒューマノイドに応用、クルマのように部品を標準化し大量生産により低価格を実現

AIが生成したコミックブックの著作権が認められる、テキストをイメージに変換するAIでアニメ事業がスタート