月別アーカイブ: 2024年1月

ニューヨーク・タイムズはOpenAIを著作権侵害で訴訟したが情勢は芳しくない?和解の道を選択か?言語モデルの教育に関しルールの制定が求められる

ニューヨーク・タイムズはOpenAIとMicrosoftを著作権侵害で提訴した。これに対し、OpenAIは公式にコメントを発表し、AIモデルは著作権法に違反していないとの解釈を示した。一方、欧州連合のAI規制法は、AI企業に教育で使ったデータを開示することを求めており、これが事実上の国際規格と解釈されている。AI企業とメディア企業の間で教育データに関する新たなルールの制定が求められる。

出典: GPT-4

ニューヨーク・タイムズの訴訟

ニューヨーク・タイムズはOpenAIとMicrosoftを著作権侵害で提訴した。OpenAIはニューヨーク・タイムズの記事で言語モデルを開発し、AIモデルは記事の内容をそのまま出力し、報道事業を脅かすと主張する。ニューヨーク・タイムズは訴状で実例を多数示し、特定なプロンプトを入力すると、GPT-4が記事をそのまま出力し、著作権法に違反すると主張している。具体的には、プロンプトに記事のURLと最初の文章を入力すると(下の写真上段、黒字の部分)、GPT-4は記事をそのまま出力する(下段左側、赤字の部分)。これはオリジナルの記事(下段右側、赤字の部分)と同じ文章となっている。

出典: New York Times

OpenAIの主張

これに対し、OpenAIは訴訟に関し公式な見解を発表し、AIモデルの教育は合法的に実施されたと主張している。これは四つのポイントから成り:

  1. OpenAIはメディア企業と共同で新しい形態のビジネスを生みだしている
  2. モデルの教育はフェアユースでメディア企業にオプトアウトする選択肢を提供している
  3. 記事をそのまま出力するのはバグで修正を続けている
  4. ニューヨーク・タイムズはすべてを語っていない

OpenAIの主張のポイント

技術的な観点から、訴訟ではモデルの「教育」と「実行」が争点となる。

  • モデルの教育:新聞記事など著作物でアルゴリズムを開発することの合法性が議論となる。
  • モデルの実行:モデルが出力した内容が問われる。

OpenAIは、モデルの「教育」は著作権に抵触しておらず、モデルの「実行」はバグであり、問題点を修正していると主張する。

モデルの教育

OpenAIは、著作物で言語モデルを教育するのは「フェアユース(Fair Use)」で、著作権侵害には当たらないと主張する。この解釈は業界で定着しており、著作者と開発者の双方にメリットがある。また、AIモデルを著作物で教育する手法は、アカデミアや業界団体や著作者団体などから支持されている。更に、OpenAIはメディア企業にアクセスを禁止するオプションを提示しており、実際に、ニューヨーク・タイムズはOpenAIのクローラーが記事を収集するのを禁止ている。

出典: OpenAI

モデルの実行

モデルの実行関しては、アルゴリズムは著作物を学習し、学んだ内容を出力するが、これは記事全体ではなくその一部であり、法令で許容された範囲内であると主張する。また、訴状の中でGPT-4が記事全体を出力する事例が提示されているが、OpenAIはこれに対してはAIモデルのバグであり、問題解決を進めているとしている。

EU AI Actの解釈は

欧州連合はAI規制法「AI Act」の最終合意に至り、この法令が今年から順次、施行されることになる。OpenAIがEU域内で事業を展開する際は、AI Actに準拠することが求められる。著作権に関しては、AI Actはモデルの教育で使ったデータを公開することを求めている。また、著作物を教育データとして使う場合は、所有者に許諾を得ることを義務付けている。この二つの条項が著作権に関する事実上の国際標準と解釈されており、ニューヨーク・タイムズの訴訟で重要な指針となる。

ビジネス拡大に寄与

現在、ニューヨーク・タイムズはOpenAIが記事をスクレ―ピングすることを禁止しており、GPT-4は最新記事に関する情報は学習していない。Sam AltmanはGPT-4などの言語モデルが、メディア企業のビジネスに貢献しているとの解釈を示している。モデルが記事の要約を出力し、その出典を示すことで、ニューヨーク・タイムズの記事の閲覧回数が上がるとの考え方である。Google検索エンジンが読者をサイトに誘導するのと同じコンセプトで、AIモデルがニューヨーク・タイムズのページビューを増やすとしている。(下の写真、最新モデルのGPT-4はニューヨーク・タイムズの記事は出力しないで、記事へのリンクを示している。)

出典: OpenAI

両社の合意は近い?

ニューヨーク・タイムズがOpenAIを提訴したのは、著作権に関する交渉を有利に進めるための手段とみられている。ニューヨーク・タイムズは法廷で勝訴することが目的ではなく、著作物のライセンス料を高値で合意することを目指している。OpenAIはメディア企業と提携を進めているが、著作物を教育で使うために100万ドルから500万ドルを支払っているとの情報もある。ニューヨーク・タイムズは記事のライセンス条件についての交渉を進めているが、両社の合意は近いとの見方もある。

OpenAIはアップストア「GPT Store」でChatGPTアプリ「GPT」の販売を開始、企業の事務効率を劇的に改良するアプリの開発が進む

OpenAIは1月10日、GPTのアップストア「GPT Store」の運用を開始した(下の写真)。GPTとは用途に特化した専用のChatGPTで、生成AIのアプリケーションとして機能する。Appleの「App Store」でiPhoneアプリを購入するように、GPT StoreでChatGPTアプリを利用する。多くのGPTを使ってみたが、ビジネスに役立つアプリが多く、企業はこれを導入して事業プロセスを効率化できる。米国企業はGPTに着目しており、今年は生成AIを導入する流れが加速する。

出典: OpenAI

GPTとは

GPTはカスタムバージョンのChatGPTで、独自のスキルと知識を持ち、特定分野で能力を発揮する。GPTは用途に特化した専用のChatGPTで、生成AIのアプリケーションとして位置付けられる。OpenAIはGPTのアップストア「GPT Store」の運用を開始し、GPTの販売を開始した。AppleのApp Storeと異なり、GPT Storeにはビジネスに役立つアプリが数多く掲載されており、利用者の中心が企業ユーザとなる。

GPTを使ってみると

GPT Storeには多くのGPTが掲載されており、その数は300万件を超える。使い方はシンプルで、GPT StoreでGPTを選択し、それをスマホやPCで実行する仕組みとなる。GPT Storeには多彩なモデルが掲載されており、仕事や研究や開発でプロセスを効率化するツールが揃っている。ソフトウェアツールとは異なり、GPTは生産性を劇的に向上する。企業や研究所にとって必須のツールになる。同時に、GPT Storeに掲載されているアプリの品質には大きな幅があり、役に立たないモデルも数多く、その見極めが難しい。

Writing:文章作成で品質を向上するアプリ

GPT Storeには文章生成を効率化するための多種類のアプリが掲載されている。ビジネスドキュメントの開発を支援するGPTが最も注目されている。「Fully SEO Optimized Article including FAQ’s」というGPTは、タイトルとキーワードを指定すると(下の写真上段)、それに沿ってブログ記事を生成する。GPTは指示された内容に沿って、アウトラインを生成し、ドキュメントの構成を提示する(下段)。

出典: OpenAI

最終的に、GPTはアウトラインに沿ってコンテンツを生成し、検索エンジンの上位に掲載される、記事を完成する(下の写真)。多くのスタートアップ企業が同様なモデルを投入しており、生成AIアプリにとってここが主戦場となる。

出典: OpenAI

Productivity:ビジネスの生産性向上アプリ

生産性向上アプリは企業が日常業務を効率化するために使われる。「VideoGPT」というGPTは、指定された条件に沿ってビデオを生成する。企業が製品のプロモーションビデオを制作する際に利用できる。製品の概要や利用シーンを指定し、ビジュアルとオーディオの特性を示すと(下の写真左側)、アプリがこれに沿ったビデオを生成する(右側)。プロンプトに沿ってGPTがライブラリからビデオを抽出し、これを組み合わせて最終コンテンツを生成する。ChatGPTがビデオを生成しているのではなく、プロンプトに従ってクリップを組み合わせてビデオを完成する。

出典: OpenAI

Research & Analysis:研究や解析のためのツール

研究者のためのGPTが開発されている。これらの多くは、公開された学術論文を参照し、科学に裏付けられた回答を導き出す。「ScholarAI」というGPTは、科学技術に関し仮定を設定し、それを過去の論文を参照して検証する。例えば、「ロボット手術でVR技術の役割を検証せよ」と指示すると、過去の論文「医師の教育でVR技術が有効である」を参照して、評価レポートを制作する(下の写真)。

出典: OpenAI

Programming:コーディング支援アプリ

コーディング技術はもはや不要で言葉でプログラムを作成できる。これは「Prompt-Gramming」と呼ばれ、プロンプトでプログラムの内容を指示すると、GPTがそれに合ったコードを生成する。「DesignerGPT」というGPTは、ホームページを生成するアプリで、プロンプトに従って(下の写真左側)、ウェブページを生成する(右側)。プロンプトでホームページの構成やイメージを指示すると、それに沿ったHTMLを生成する。

出典: OpenAI

DALL·E:イメージ生成アプリ

DALL·EとはOpenAIが開発したモデルで、言葉の指示に従ってイメージを生成する。GPT-4とは異なり、ディフュージョン(拡散、Diffusion)という技法で、極めてリアルなイメージを生成する。人気のジャンルで、ここにイメージを生成するGPTが掲載されている。その中で「Super Describe」というGPTは、入力された写真(下の写真左側)を、独自のスタイルでその複製(右側)を生成する。企業がオリジナル作品から、その派生イメージを生成する際に利用できる。一方、派生イメージがオリジナルの著作権を侵害しないなど、合法的な利用法が求められる。

出典: OpenAI

企業向けのGPT

企業はGPTで業務を効率化するためのアプリを簡単に開発できる。開発したGPTは外部に公開することなく、社内で安全に利用できる。OpenAIはGPTの利用シーンを示しており、企業は”人事GPT”を開発し、GPTが福利厚生に関する質問に回答するなどの利用法がある。「HR Helper」というGPTは、健康保険の掛け金に関する質問に回答する(下の写真)。人事規定は企業ごとに異なるが、社内ルールを反映したGPTを簡単に作成して運用できる。昨年は、ChatGPTの技術評価が進んだが、今年は生成AIをビジネスに適用する流れが本格化する。

出典: OpenAI

OpenAIはGPTのアップストアを開設、カスタムChatGPTの購入や販売が始まる、企業は生成AIをビジネスに統合する流れを加速

OpenAIは1月10日、GPTのアップストア「GPT Store」の運用を開始した(下の写真)。GPTとは用途に特化した専用のChatGPTで、生成AIのアプリケーションとして位置付けられる。Appleの「App Store」でiPhoneアプリを購入するように、GPT StoreでChatGPTアプリを利用する。既に300万件のChatGPTアプリが掲載されており、生成AIのエコシステムが急成長している。また、企業はChatGPTをビジネスに適用する取り組みを加速している。

出典: OpenAI

GPTとは

ChatGPTに対して、「GPT」はカスタムバージョンのChatGPTで、昨年11月にOpenAIの開発者会議で公開された。通常のChatGPTはインターネットの情報で教育され、多彩な知識を持ち、指示されたタスクを幅広く実行する。しかし、企業や消費者は独自のタスクに特化したカスタムChatGPTを求めており、この解がGPTで、独自のスキルと知識を持ち特定分野で威力を発揮する。

GPTの販売が始まる

GPT Storeには多くのGPTが掲載されており、ここでアプリを購入し、それをスマホやPCで実行する仕組みとなる。GPT Storeは分野ごとに区分され、多彩なカスタムChatGPTが掲載されている:

  • Featured / Trending:人気のアプリ
  • DALL·E:イメージ生成アプリ
  • Writing:文章作成で品質を向上するアプリ
  • Productivity:ビジネスの生産性向上アプリ
  • Research & Analysis:研究や解析のためのツール
  • Programming:コーディング支援アプリ
  • Education:生徒や教師向けの教育支援ツール
  • Lifestyle:日常生活を支援するアプリ

人気のGPTは

GPT Storeには、消費者向けのアプリの他に、企業や研究者向けのツールが幅広く掲載されている。また、アプリの人気ランキングが公開され、注目を集めているGPTが分かる(下の写真)。

出典: OpenAI

人気アプリConsensusとは

一番人気のアプリは「Consensus」で、研究や解析のためのツールとし、開発者の活動を支援する。Consensusは2億件の学術論文で教育され、研究成果に特化したChatGPTとなる。研究者の質問に、ChatGPTは過去の論文を引用して回答する。例えば、大規模言語モデルの研究で「Transformers」の論文を引用しているものを尋ねると、ChatGPTはそれを的確に回答する(下の写真)。

出典: OpenAI

イメージを生成するアプリ

GPTはイメージ生成技術「DALL·E」とリンクしており、言葉の指示に従って、多彩なグラフィックスを生成する。人気アプリ「Logo Creator」は対話形式で会社のロゴを生成する。例えば、アイスクリームショップは好みのデザインを反映したロゴを簡単に生成できる。GPTと対話しながら、色やトーンやメッセージなどを指示すると(下の写真左側)、DALL·Eはそれに沿ったロゴを制作する(右側)。

出典: OpenAI

消費者向けのアプリ

GPT Storeには消費者向けのアプリが数多く掲載されている。その中で人気のGPTが「AllTrails」で、ハイキングのコースを教えてくれる。対象とする地域を指定し、コースの難度などを対話形式で入力すると(下の写真左側)、最適なコースを出力する(右側)。GoogleやChatGPTで検索することもできるが、GPTはズバリ回答を示すので使って便利と感じる。

出典: OpenAI

企業向けのGPT運用環境

OpenAIは「Assistants API」などGPTを開発する環境を公開しており、企業はここで簡単に、専用のChatGPTアプリを開発できる。更に、企業は開発したGPTを一般に公開することなく、社内で安全に運用できる環境が提供された。これは「Team」と呼ばれ、ChatGPTとGPTを社内でセキュアに運用できる環境となる。ここで企業は業務に特化したGPTを開発し、社内データを統合し、機密情報がリークすることなく安全に利用できる。

出典: OpenAI

企業は生成AIの導入を加速

これに先立ちOpenAIは、企業向けのChatGPTサービス「Enterprise」を投入しており、「Team」と合わせ、企業向けの生成AIの開発と運用の環境が拡充された。既に、260社が「Enterprise」のユーザであるとされ、企業が業務にChatGPTを導入する流れが加速している。企業内でビジネスに特化したGPTを開発し、これを安全に運用する環境が提供され、企業が生成AIをビジネスに適用するトレンドが鮮明になった。

ニューヨーク・タイムズはOpenAIとMicrosoftを著作権侵害で訴訟、ChatGPTは学習した記事を“暗記し”そのまま出力、訴状は違法な事例を克明に提示し生成AIの課題が浮き彫りになる

ニューヨーク・タイムズはOpenAIとMicrosoftを著作権侵害で提訴した。訴状によると、両社はニューヨーク・タイムズの記事を使って言語モデルを開発し、ChatGPTやCopilotがそれをそのまま出力し、著作権を侵害していると主張。両社はライセンスに関する協議を続けてきたが合意に至らず、ニューヨーク・タイムズは訴訟に踏み切った。訴状にはGPT-4が出力したテキストが数多く証拠として提示され、言語モデルの問題点が浮き彫りになった。

出典: Adobe Stock

訴訟の内容

ニューヨーク・タイムズは12月27日、OpenAIとMicrosoftを著作権侵害で提訴した。OpenAIは数百万件の記事を使って言語モデルを開発し、ニューヨーク・タイムズの事業と直接競合するとしている。学習した記事をベースに、AIモデルはその内容をそのまま出力し、また、記事のサマリーを生成する。これにより、ニューヨーク・タイムズは有料記事のライセンス収入が減り、また、広告収入も減少し、事業に多大な影響を及ぼすとしている。

ニューヨーク・タイムズの主張:教育データ

ニューヨーク・タイムズは、OpenAIの言語モデルの教育で、ウェブサイトから取集した大量のデータが使われ、ここにニューヨーク・タイムズの記事が含まれていると主張する。教育されたモデルは記事の内容を覚え、利用者のプロンプトに対し、モデルは記事の内容を出力する。このため、OpenAIが事実上のニュース会社となり、ニューヨーク・タイムズの競合企業になると主唱する。訴状によると、GPT-3の教育で「Common Crawl」などが使われ、ここにはニューヨーク・タイムズの記事が大量に掲載されている。(下のグラフ、上から四段目。) 一方、OpenAIはChatGPTとGPT-4の教育データについては何も開示してない。

出典: New York Times

ニューヨーク・タイムズの主張:プロンプト

ニューヨーク・タイムズはGPT-4に特定なプロンプトを入力すると記事を丸ごと出力すると主張する。多数の記者が長年の歳月をかけ調査した記事を、GPT-4が自作の記事のように、記事を出力する。訴状によると、記事のURLと最初の部分をプロンプトとして入力すると、GPT-4はそれに続く記事を出力する。(下の写真:GPT-4に入力したプロンプト、記事の冒頭の部分)

出典: New York Times

ニューヨーク・タイムズの主張:GPT-4の出力

このプロンプトに対し、GPT-4はそれに続く記事をそのまま出力する。左側はGPT-4が出力した内容で、右側はオリジナルの記事を示している。赤文字の部分がオリジナル記事と同じテキストで、GPT-4は記事の内容を暗記し、最初のパラグラフが入力されると、これに続く記事をそのまま出力している。ニューヨーク・タイムズの記事は有料であるが、最初のパラグラフを入力すると、これを無料で読めることになる。

出典: New York Times

現在のGPT-4で試してみると

GPT-4が実際にニューヨーク・タイムズの記事を出力するのか、現行モデルで試してみたが、訴状で述べられている現象を再現することはできなかった。同じプロンプトを入力したが、GPT-4はここに著作物が含まれているとして、記事を出力できないと回答。他の記事で試してみたが、同様に、著作物のコンテンツの出力は抑制されている。

出典: OpenAI

OpenAIの主張

OpenAIは従来から、著作物で言語モデルを教育するのは「フェアユース(Fair Use)」で、著作権侵害には当たらないと主張する。アルゴリズムは、著作物を学習し、学んだ内容を出力するが、これは記事全体ではなくその一部で、法令で許容された範囲内であると主張する。米国著作権の専門家も同様な見解を示しており、ニューヨーク・タイムズが勝訴するのは難しいという意見もある。

Google Book Searchの判決

過去には、Googleの書籍検索システムがフェアユースとして認められた事例がある。Googleは書籍をデジタル化し、それを検索するシステム「Google Book Search」を構築した。検索エンジンで書籍を検索できるようになったが、著作者団体「Authors Guild」はこのシステムは著作権を侵害するとして提訴した。裁判所は、書籍検索は著作権の中のフェアユースと認定し、Googleが勝訴した。検索エンジンは書籍の一部分だけを出力し、これは著作権の侵害ではないと判定された。

メディアとの提携

OpenAIはニューヨーク・タイムズを含め、主要メディアと記事のライセンスに関する協議を進めている。既に、ドイツに拠点を置く大手メディア企業Axel Springerと、記事のライセンス条件について合意した。OpenAIは、「Politico」と「Business Insider」の記事を利用でき、GPT-4はそれをそのまま引用することが認められた。また、Associated Press(AP)はOpenAIが記事を使ってモデルを教育することを認めた。

出典: Adobe Stock 

メディアとの決裂

一方、ニューヨーク・タイムズはOpenAIがモデルを記事で教育することを禁止しており、クローラ「OpenAI GPTBot」が記事をスクレ―ピングするのをブロックしている。また、CNN、BBC、ロイターも同様の仕組みを導入し、OpenAIが記事を収集することを禁止している。メディア企業は、OpenAIとの提携を模索するグループと、記事の提供を禁止するグループに分かれ、生成AIと著作権の関係の難しさを表している。

今年は重大な局面を迎える

ニューヨーク・タイムズの訴訟がどのように進むのか、メディア企業やハイテク企業が注目している。実際に裁判が始まり、法廷で判決が下されるのか、それとも、これを切っ掛けに両社が交渉を再開するのか、重大な局面を迎える。裁判では巨額の費用と長い歳月を要し、両社は交渉を再開し、ビジネスとして決着するとの見方が広がっている。ニューヨーク・タイムズとOpenAIで、言語モデル教育の条件や対価が決まれば、これが事実上の業界標準ガイドラインとなる。