カテゴリー別アーカイブ: Google

Alphabetは解体されムーンショットは終了か、Googleは激変の年を迎える

Alphabetは2019年12月、創業者のLarry PageとSergey Brinが役職を退き、Sundar Pichaiがこれを引き継ぐことを発表した。PichaiがAlphabetのCEOとなり、Googleを含むすべての経営を掌握する。これまで、PageはAlphabetのCEOとしてムーンショット「Other Bets」を育成してきた。今回の発表でPichaiがAlphabetの経営を担い、ムーンショットを継続するのか、その判断に関心が集まっている。

出典: VentureClef

Alphabetの設立

そもそもAlphabetとは、コア事業体「Google」と新規事業「Other Bets」を統括する親会社で、Other Betsの財政状況をクリアにするため、2015年10月に設立された。PageがCEOに就任し、同時に、PichaiがGoogleのCEOとなった。これにより、PageがAlphabetで次世代ビジネスを育成し、Pichaiが検索などのコア事業を運営する構造となった。

ムーンショットの概要

今回の発表でPageはAlphabetのCEOを退き、Pichaiがその後を引き継ぎ、ムーショットを運営する。Alphabetが設立されてから4年余りで大きな節目を迎えた。Alphabetで野心的な研究開発が進んでいるがこのプロジェクトをムーンショットと呼ぶ。「Waymo」は自動運転車を開発する会社で、既に、無人タクシーの営業運行を始めている。「Calico」は老化のメカニズムの研究を進め、老化を止める医療技術の開発を目指している。「Verily」はヘルスケア企業で、人体をデジタルに把握し健康を定義する。「Sidewalk Labs」はスマートシティを開発する企業でカナダで大規模な事業を進めている。「X」はMoonshot Factoryとも呼ばれ、文字通り革新的な技術を生み出す(下の写真、Xのオフィスビル。Xの他にWaymoやロボット開発チームが入居している)。

出典: VentureClef

組織見直しの理由は

なぜこのタイミングでAlphabet責任者がPageからPichaiに代わるのか、シリコンバレーで様々な憶測が流れている。CNBCはPageの健康問題が要因との見方を示している。Pageは声帯に異常があり大きな声が出ないという障害があり、ビジネスの一線から退いたと説明している。New York Timeは、Pageは会社経営には関心がなく、革新技術を探求するために会社を去ったとの見解を示している。Recodeは、公開されていな重大な出来事が起こり、Pageがこの職をPichaiに移譲したと推測している。どのメディアも真相を把握できておらず、謎に満ちた交代となった。

実質的に引退した状態

この発表とは別に、既に、Googleの顔はPichaiとなっている。PageはGoogle I/Oなどの公の場に姿を見せることはなく、その存在感は薄くなっている。最近では、Alphabet社内にも姿を見せなくなったといわれ、Pageの経営への関与も縮んでいる。事実、連邦議会委員会に出席を求められたが、Pageは出向くことはなく、空席のまま公聴会が進んだ。Pageは事実上、引退している状態であった。

Pichaiの評価

一方、PichaiはGoogleの顔となり、実質的に会社運営を担ってきた。Pichaiの評判は良好で、物静かで控えめなキャラクターと評価されている。Pichaiは本当のギークと評され、技術者の立場から企業運営を担っている。PichaiはしばしばMicrosoft CEOのSatya Nadellaと比較される。両者ともインド出身のアメリカ人で、カリスマ創業者の後を継ぎ、企業文化を保ちながら、うまく事業を拡大している。

ムーンショットの評価

Alphabetが設立され四年余りが経過するが、ムーンショットの成果が問われている。ムーンショットは毎年、大規模な赤字を計上しており、2018年度は34億ドルの損失となった。投資家やウォールストリートはAlphabetが大きな損失を出していることに厳しい見方を示している。Alphabetを閉じコア事業である検索にリソースを集約すべきとの意見が多い。これに対し、PageはGoogleの成長を維持するには新規事業を起こすことが必須であると主張しOther Betsの盾となってきた。

ムーンショットの行方は

PichaiはAlphabetの経営を任され、ムーンショットの運営についてどのような判断を下すのか、市場の関心が集まっている。このままプロジェクトを継続するのか、それとも、中止するのか、重大な決断が下されることになる。ただ、PageとBrinは役職を退いても、両者で株主総会の議決権の56%を有しており、今度は株主として会社経営に関与する。そのため、Pichaiの経営判断はPageの承認を仰ぐことになり、ムーンショットの路線が大きく変わることはないとの見方もある。事実、Waymoは事業開始直前で、ムーンショットの成功事例となる。投資家の視点は短いが、Googleの業績は好調で、その利益をどれだけムーンショットに投入するのか、このバランスが問われることになる。

出典: VentureClef

Googleは新本社を建設中

Googleは本社キャンパスに隣接して新社屋を建設している(上の写真)。外観は今にも飛び立とうとする宇宙船のようにも見え、人目を惹くデザインとなっている。この社屋のテーマは次世代ビルで、この巨大なドームの中に柔軟構造のオフィスビルが建設される。ドームの透明の天蓋で外光や外気を取り入れ、周囲には歩道や緑地が整備される。今年は本社ビルも変わることになる。

Googleは家事や介護ができる汎用学習ロボットを開発中、高度なAIでブレークスルーを狙う

Googleの持ち株会社Alphabetはロボット開発を進めているが、2019年11月、最新状況を公開した。ロボットは「Everyday Robots」と呼ばれ、家庭やオフィスで日々のタスクを実行する。ロボットは自分で学習する機能を備え、煩雑な環境の中を自律的に動き、ごみの分別などをこなす。最終的には家庭に入り、家事をこなし、高齢者の介護を手掛ける。Everyday Robotsは高度なAIが求められ、Google BrainやWaymoと密接に開発研究を進める。

出典: Alphabet X

ロボットの概要

ロボットはGoogleのムーンショット工場「Alphabet X」で開発されている。ロボットは駆動機構に円柱状の本体が乗り、ここにアームが接続されている(上の写真)。頭部にカメラなどのセンサーを搭載し、AIがイメージを解析し周囲の環境を理解する。煩雑なオフィスの中を社員に交じって安全に移動する。

ロボットの視覚とアーム操作

ロボットはアーム先端のグリッパーで日常のオブジェクトを掴んだり動かしたりする(下の写真)。ロボットは搭載されたセンサーで収集したデータを解析し、何を見ているのか、また、何を聞いているのかを理解する。更に、ロボットは世界の中でどこにいるのかを把握し、日常生活の中で人間に交じり、タスクを安全に実行する。つまり、ロボットは常識を持ち人間の同僚のように振る舞う。

出典: Alphabet X

ロボットの位置付け

いまのロボット(下のグラフ、Industrial Robotics)は管理された環境で厳密に定義されたタスクを実行する。自動車工場の製造ロボットがこれに該当し、規定されたパーツを定義された動作とタイミングでシャシに搭載する。このために、操作を逐一プログラミングする構成で、ロボットはそれに沿って正確に稼働する。この結果、ロボットはオフィスや家庭のように予定外の事象が発生する環境では動くことはできない。

出典: Alphabet X

汎用学習ロボット

これに対して、Everyday Robotsは人間に交じり、想定外の事象が起きる環境で、日々のタスクを安全に実行する(上のグラフ、Everyday Robots)。自動運転車より難易度が高いというポジショニングとなる。また、Everyday Robotsは人間のしぐさを見てタスクの実行方法を学び、また、他のロボットから学習する機能もある。そして、ロボットはクラウドのシミュレーション環境の中でタスクを学んでいく(下の写真、Lidarで周囲のオブジェクトを把握している様子)。

出典: Alphabet X

ごみの分別を学習

Everyday Robotはごみを分別するタスクを学習している(下の写真)。箱に入っているごみを、ボトルはリサイクルのトレイに、また、紙コップはランドフィルのトレイに移し替える。ロボットはごみの種類を把握して、それをグリップで掴み、指定された場所に移す。学習を重ね、今では95%の精度でごみの分別ができる。数多くのロボットが並列してごみ分別タスクを実行することで学習速度を上げる。

出典: Alphabet X

Googleのロボット開発の歴史

Googleのロボット開発は紆余曲折を経て今の形に収束した。Googleがロボット開発に着手したのは2013年12月で、Android生みの親Andy Rubinが指揮を取った。GoogleはBoston Dynamicsなどのロボットベンチャーを相次いで買収した。しかし、ロボット開発は難航し、プロジェクトは中止となり、GoogleはBoston DynamicsをSoftBankに売却した。更に、Rubinは人事問題で2014年末に会社を離れ、Googleのロボット開発は失敗の象徴として語られる。

ロボット開発再開

しかし、2016年ころ、Googleのロボット開発はAlphabet Xに集約され、ここで再出発することとなった。今度は最新のAIをロボットに適用することでインテリジェントなロボットを目指した。Googleのアプローチはコモディティ・ハードウェアに最新のAI技法を取り込み高度なロボットを開発するというもの。研究施設にはロボットアームが40台並び、オブジェクトのピッキングなどのタスクが実施された。多数のロボットアームが稼働することから、この施設は「Arm Farm」と呼ばれた。ロボットが多重でタスクを実施することでアルゴリズムを教育する速度が向上した。

深層強化学習

この頃、DeepMindは深層強化学習(Deep Reinforcement Learning)という手法で囲碁システム「AlphaGo」を開発し、人間の囲碁のチャンピオンを破った。Googleはこの手法をロボットに応用し、学習速度をあげるアプローチを取った。AlphaGoがシミュレーション環境で囲碁の技を磨いてきたように、ロボットもシミュレーション環境でピッキングを繰り返しスキルを上げた。

出典: Google

Alphabet Xキャンパス

Everyday Robotはこの延長線上にあり、ロボットは、昼間は研究所の中でごみ分別作業を繰り返し、夜間はシミュレーション環境でこのタスクを実行する。ちょうど、自動運転車Waymoが市街地を走行し、同時に、シミュレーション環境で試験走行を繰り返すモデルに似ている。WaymoとEveryday RobotはAlphabet Xの同じキャンパスで開発されている(下の写真)。また、ロボットはWaymoが開発したLidarを搭載しており、これで周囲のオブジェクトを把握し、自動で走行する。

出典: VentureClef

ブレークスルーはあるか

Everyday Robotsは深層強化学習など高度なAIを搭載し、自分でごみの分別方法を学んでいく。ごみの分別ができると次のタスクに進むが、既に基礎教育ができているので、研究チームは新しいスキルを短時間で習得できると見込んでいる。ロボットは異なるタスクでも学習速度をあげ、Everyday Robotは汎用学習ロボットに到達するというシナリオを描いている。しかし、この仮説が実証された事例はなく、本当に汎用学習ロボットに到達できるのか、大きな挑戦となる。Googleの高度なAIでこの壁を破れるのか、世界が注目している。

Googleの量子コンピュータ開発、次はNISQでブレークスルーを起こす

Googleが発表した量子コンピュータ「Sycamore」(下の写真)は「Quantum Supremacy(スパコン越え)」に到達したのか判断が分かれているが、プロセッサは論理設計通りに稼働し、多数のゲート演算を実行し、大きなマイルストーンとなった。Sycamoreはエラーを補正する機構は搭載しておらず、大規模な演算を実行することは難しい。この種類の量子コンピュータは「Noisy Intermediate-Scale Quantum (NISQ)」と呼ばれ、ノイズが高く(エラー率が高く)、中規模構成(50から100Qubit構成)のシステムとなる。これからNISQで量子アルゴリズム開発が始まる。 果たしてNISQという不安定な量子コンピュータでキラーアプリを開発することができるのか、世界が注目している。

出典: Google

量子コンピュータの構想

量子コンピュータの基礎概念は1981年にRichard Feynmanが提唱した。当時、Feynmanはカリフォルニア工科大学の教授で、講座「Potentialities and Limitations of Computing Machines (コンピュータの可能性と限界)」の中で量子コンピュータの概念を講義した。「自然界は量子力学に従って動いているので、それをシミュレーションするには量子コンピュータしかない」と説明し、量子コンピュータという構想を示した。

量子技術を実現する

量子コンピュータの基礎研究が進む中、最初に量子コンピュータの演算単位「Qubit」を生成することに成功したのはDavid Wineland(当時アメリカ国立標準技術研究所の研究者、下の写真)のグループである。この研究が認められ、量子システムを計測・制御した功績で、2012年にノーベル物理学賞を受賞した。この研究ではTrapped Ion(電荷を帯びた原子(イオン)を容器に閉じ込めこれをレーザー光線で操作)という手法で2つのQubitからなる量子ゲートを生成した。量子コンピュータの演算基礎単位を実現できたのは2006年ごろでまだまだ新しい技術である。

出典: National Institute of Standards and Technology

NISQという種類の量子コンピュータ

今では、GoogleがSycamoreを開発し、53のQubitで量子ゲートを構成し、まとまった計算ができるようになった(下の写真)。これに先立ち、IBMは量子コンピュータを「IBM Q System One」として販売している。これらは「Noisy Intermediate-Scale Quantum (NISQ)」に分類され、Qubitが正常に稼働できる時間(Coherence Time)が短く、エラー(Decoherence)が発生してもそれを補正する機構は無く、不安定なシステムとなる。このため、スパコンを超える性能は出せるが、大規模な構成は取れないという制約を持つ。因みに、NISQというコンセプトはカリフォルニア工科大学教授John Preskillにより提唱された。Preskillは米国で量子技術の基礎研究をリードしており、「Quantum Supremacy」というコンセプトも同氏が提唱した。

出典: Google

量子機械学習アルゴリズム

NISQは量子ゲートのエラー率が高く大規模な演算はできないが、規模の小さい量子アルゴリズムの研究で使われている。実際に、化学、機械学習、物性、暗号化などのアルゴリズム開発が進んでいる。特に、量子機械学習(Quantum Machine Learning)に注目が集まっている。これはAIを量子コンピュータで実行する手法で、大規模なデータを量子状態で処理することで、アルゴリズム教育を高速で実行できると期待されている。具体的には、ニューラルネットワークで多次元のデータを処理するとき、そのデータマトリックスをQubitの量子状態にエンコードすることで学習プロセスが効率化される。一方、AIの実行では大量のデータを量子プロセッサに入力する必要があるが、このプロセスがネックとなる。量子コンピュータは演算速度はけた違いに速いが、データを読み込んだり、データを書き出す処理で時間がかかる。このデータ入出力プロセスを高速で実行することが重要な研究テーマとなっている。

ハイブリッド構成で稼働

NISQは現行コンピュータを置き換えるものではなく、両者が協調してタスクを実行する構成が取られる。これは「Hybrid Quantum-Classical Architectures」と呼ばれ、NISQが現行コンピュータのアクセラレータ(加速器)として機能する。現行コンピュータでアプリを実行する際にその一部をNISQにアウトソースする形を取る。パソコンでビデオゲームをする際に、アプリはCPUで稼働するが、画像処理の部分はGPUで実行される方式に似ている。

ハイブリッド構成で最適化問題を解く

ハイブリッド方式では「Variational Quantum Eigensolver (VQE)」という手法が注目されている。VQEはEigenvalue(固有値)を求める手法で現行コンピュータと量子コンピュータが連動して解を見つける。アルゴリズム全体は現行コンピュータで稼働し、数値演算の部分は量子コンピュータで実行される。具体的には、分子の基底状態(Ground State Energy、エネルギーが一番低い状態)を見つける計算や、ルート最適化(セールスマンが巡回するルートの最適化)などで使われる。

高信頼性量子コンピュータの開発

量子コンピュータ開発で、NISQは通り道で、最終ゴールは高信頼性量子コンピュータとなる。このために、ノイズに耐性のある量子ゲートの研究が続けられている。ノイズとは温度の揺らぎ、機械的な振動、電磁場の発生などがあげられる。これらがQubitの状態を変えエラーの原因となる。現行コンピュータでも記憶素子でエラーが発生するが、特別な機構を導入しエラー検知・修正をする。量子コンピュータでもエラーを補正する機構の研究が進んでいる。また、エラーに耐性の高いアーキテクチャの研究も進んでいる。その代表がMicrosoftの「Topological Qubit」で、Qubitの安定性が極めて高く、高信頼性の量子コンピュータができる。しかし、Topological Qubitはまだ基礎研究の段階で、物理的にQubitは生成できておらず、長期レンジの開発となる。(下のグラフ:Googleの量子コンピュータ開発ロードマップ、NISQではQubitの個数は1000が限界であるが、エラー補正機構を備えた高信頼性マシンではQubitの数は100万を超える。)

出典: Google

生活に役立つ量子アプリケーション

高信頼性量子コンピュータが登場した時点で、大規模な量子アプリケーションを実行することができ、社会に役立つ結果を得ることになる。新薬の開発(分子のシミュレーション)、送電効率の向上(室温超電導物質の発見)、 化学肥料生成(窒素固定(Nitrogen Fixation)触媒の開発)、大気中の二酸化炭素吸収(炭素固定(Carbon Fixation)触媒の開発)などが対象になる。高信頼性量子コンピュータがいつ登場するのか議論が分かれているが、アカデミアからは開発までには10年かかるという意見が聞かれる。一方、産業界からは、開発ペースが加速しており5年と予測する人も少なくない。

大きなブレークスルー

Googleの量子コンピュータ開発責任者John Martinis教授はSycamoreを世界初の人工衛星「Sputnik 1(スプートニク1号)」に例えている。スプートニクは歴史的な成果であるが、人工衛星は電波を発信する機能しかなく、社会生活に役立つものではなかった。しかし、スプートニクが宇宙開発の足掛かりとなり、その後、リモートセンシングやGPSや衛星通信など多彩なアプリケーションが生まれた。同じように、Sycamoreは限られた規模のゲート演算しかできないが、このプラットフォームで若い研究者が量子アルゴリズムを開発し、 大きなブレークスルーを起こすことが次の目標となる 。量子コンピュータ開発が大きな転機を迎えた。

Googleは量子コンピュータがスパコンを超えたと発表、IBMはそれを否定、この発表をどう解釈すべきか

Googleは2019年10月23日、量子コンピュータの性能がスパコンの性能を超えたと発表した。Googleは世界で初めて「Quantum Supremacy(スパコン越え)」に到達したとアピールした。このベンチマークでは量子プロセッサ「Sycamore」が使われ、単純なゲート操作を実行した。徐々にQubitの数と実行回数を増やして実行され、スパコンでは計算できない規模に到達した。この規模の演算はGoogleの量子コンピュータを使うと200秒(3分20秒)でできるが(下の写真左側)、最速スパコン「Summit」を使っても1万年かかると推定した(下の写真右側)。一方、IBMは同じタイミングで論文を発表し、これをスパコンで実行すると2.5日で解けるとし、GoogleはQuantum Supremacyに到達していないと反論した。両社の意見が真っ向から対立し、市場はこの発表をどう受け止めるべきか困惑が広がっている。

出典: Google

量子プロセッサ

Googleは科学雑誌Natureに論文「Quantum supremacy using a programmable superconducting processor」を掲載し、その内容を明らかにした。このベンチマークはGoogleの量子プロセッサ「Sycamore」(下の写真、プロセッサの外観)で実行された。Sycamoreは54Qubit構成のプロセッサで、ベンチマークでは53Qubitが使われ、量子ゲート(Quantum Gate)が構成された。

出典: Google

量子ゲート

量子ゲートは基本演算の論理ゲートとなり、これらを組み合わせて単純な処理を実行し、その結果が計測された。(下のグラフィックス:量子ゲートの事例。左端がSycamoreでXの部分がQubitを示す。Qubitは接続装置(Coupler、A・B・C・Dで示される部分)を経由して隣の4つのQubitに接続される。Qubitは単独で、また、二つのQubitを連結して実行された(中央部分)。処理は左から右に進みその実行結果が計測された(右端)。)

出典: Nature

何を測定したのか

ベンチマークではゲートをランダムに組み合わせ、その結果を測定する方式が取られた。測定結果は0と1のランダムな並び(Bit Stream、例えば「0000101」)となる。しかし、Quantum Interference(量子の干渉)という物理特性から01の並びは完全にランダムではなく特定の並びに偏る。もっとも起こりやすい01の並びを見つけることがこのベンチマークのタスクとなる。

スパコン越えの根拠

ベンチマークでは、最初は12Qubitから53Qubitを使い、単純なゲート演算を実行した(下のグラフ左側)。この際、Gate Depth(演算繰り返し回数)は一定 (14サイクル)にして実行された。また、実行時間(Sampling)は常に200秒に固定された。この確認ができた後、今度は、複雑なゲート演算を53Qubit構成で実行した。その際に、Gate Depthを深くしながら実行し、スパコンが到達できない領域まで、その深度を増していった(下のグラフ右側)。そして53Qubit構成でGate Depthが20の地点でQuantum Supremacyに到達(下のグラフ右側、右端のポイント)。このポイントではこれをスパコンで実行しても1万年かかると算定した。

出典: Nature

量子プロセッサの基本機能の検証

このグラフの縦軸はCross-Entropy Benchmarking Fidelity(ゲートが正常に稼働する指数)を表し、〇、X、+は異なる構成で実測した値で、実線は予想値を示す。Qubit数やGate Depthが増えると(ゲート規模が大きくなると)正常に動作する指数が下がる(エラーが増える)。しかし、実測値は予想したラインに乗り、急速に低下することはなかったことを示している。つまり、Sycamoreで想定外の物理現象はなく、量子プロセッサとして目途が付いたことを意味している。

プロセッサ構成

Sycamoreは54Qubit構成のプロセッサで、Qubitは平面に配置され、隣の4つのQubitと接続する。Qubitはこの結合を通してすべてのQubitと結び付くことができる。SycamoreでQuantum Supremacyに到達できた理由はQubitの信頼性が向上しエラー率の低いゲートを構成できたことにある。Sycamoreプロセッサは超電導回路で構成され、システム全体は円筒状の冷蔵装置(Cryostat)に格納され、絶対零度近辺まで冷却して運用される(下の写真)。

出典: Google  

次のステップはNISQでアプリ開発

Googleは量子コンピュータ開発のロードマップを明らかにした。その一つが、Noisy Intermediate-Scale Quantum (NISQ)といわれるプロセッサでアプリ開発を進めること。NISQとはノイズが高い(エラー率が高い)、中規模構成(50から100Qubit構成)の量子コンピュータを指し、Sycamoreがこの範疇に入る。エラー率が高いので大規模なゲート演算はできないが、限られたサイズのタスクでアルゴリズム開発を進める。

最終ゴールは高信頼性量子コンピュータ

しかし、最終ゴールは「Fault-Tolerant Quantum Computer」の開発で、エラーに耐性のある大規模構成の量子コンピュータを開発する。エラー補正機構などを備えた信頼性の高い量子コンピュータで、大規模な量子アルゴリズムを実行することができる。この時点で社会に役立つアプリケーションの開発が可能となる。例えば、新素材開発に着目しており、軽量バッテリーや肥料を生成するための触媒などの開発が期待される。ただし、この量子コンピュータが登場するまでには歳月を要す。

IBMがGoogleに反論

IBMはGoogleが論文を公表した二日前に、それに反論する論文を掲載した。これは「Leveraging Secondary Storage to Simulate Deep 54-qubit Sycamore Circuits」という表題で、Googleが達成したというQuantum Supremacyに異議を差し挟んでいる。Quantum Supremacyの定義の一つは「スパコン越え」であるとし、世界最速のスパコン「Summit」を使うと、この処理を2.5時間で実行できるというもの。Googleは計測したQubitの状態をRAM(主記憶)に格納して処理することを前提に、処理時間を1万時間と算定した。しかし、IBMはRAMだけでなくディスクも使い、最適化手法を導入することで2.5時間で処理できると算定した。(下のグラフ:GoogleがSycamoreで実行したタスクをSummitで実行したときの処理時間予測。縦軸が実行時間(日)で横軸がCircuit Depth(処理の繰り返し回数)。53Qubit構成(青色のグラフ)で繰り返し回数が20のポイントをみると2.5日となる。仮にフル構成のSycamore(54Qubit)でも、Summitで実行すると6日で計算できる。)ちなみにSummitはIBMが開発したスパコンでIBMはSummitでのタスク最適化技術を誰より熟知している。

出典: IBM

発表前に論文がリーク

IBMがGoogleの発表と同じタイミングで39ページに及ぶ詳細な論文を発表した背景には、Googleの論文が正式発表前にすでにウェブサイトに掲載されていたという背景がある。この論文は2019年8月に、NASA Ames Research Centerがウェブサイトに公開した。すぐにこの公開は停止されたが、この措置は手遅れで、読者がこの論文をRedditなどのサイトに掲載し、だれでも読める状態になっていた。このため、正式発表を待たず、市場ではGoogleのQuantum Supremacyについて評価が行われていた。

大きなマイルストーン

Googleの発表にIBMが水を差す形になり、市場はどう評価すべきか戸惑っている。これから両社の間で議論が深まり、また、これを契機に改めて開発競争が進むことも期待されている。Quantum Supremacyに達したかどうかは疑問が残るものの、Sycamoreが論理設計通りに稼働し、数多くのゲートを使って演算が実行できたことは大きなマイルストーンとなる。基本動作が確認でき、次は大規模な量子プロセッサが登場することが期待される。

AIで音楽を作曲してみると、アルゴリズムが感動的なオリジナルミュージックを生成

人気歌手Taryn SouthernはAIで作曲した音楽を発表し話題となっている。AIが作曲した音楽にSouthernが歌詞を付け歌っている(下の写真)。実は、我々が聴いている音楽の多くはAIが作曲している。実際に、AIで作曲してみたが、簡単に感動的な音楽を生成することができた。ビジネスで使える高品質な音楽で、AIミュージックの進化を肌で感じた。

出典: Taryn Southern

Amper Scoreをトライアル

作曲で使ったAIは「Amper Score」で、ニューヨークに拠点を置くベンチャー企業「Amper Music」が開発した。Amper ScoreはAI作曲プラットフォームでクラウドとして提供される。音楽のスタイルやムードを指定するとAmper Scoreがそれに沿った音楽を生成する。プロ歌手が使うだけでなく、ビデオの背景音楽を生成する利用方法が広がっている。メディア企業は映像にマッチする音楽をAmper Scoreで生成する。

Amper Scoreの使い方

Amper Scoreは設定に沿った音楽をアルゴリズムが生成する。音楽のスタイル、情景、ムードなど指定すると、これに沿ったサンプル音楽が生成される。例えば、音楽のスタイルを「Cinematic」に、情景を「Ambient」に、ムードを「Confident」と指定すると、「Soap Opera Drama」という音楽が生成された(下の写真)。お昼のメロドラマの背景音楽にピッタリの甘くて危険な感じのする曲が生成された。

出典: VentureClef / Amper Music

楽器の設定など

生成された音楽をそのまま使うこともできるが、更に、演奏する楽器などを設定することができる。ここでは背景音、ギター、パーカッション、弦楽器などを指定できる。弦楽器ではバイオリン、ビオラ、チェロなどを指定でき、更に、それらの音質を指定できる(下の写真)。「Robust」と指定すると歯切れのいい音に、「Sweet」とすると柔らかい音になる。

出典: VentureClef / Amper Music

全体の構成など

事前に音楽の構成として、全体の長さ、イントロ(Intro)、メインテーマ (Climax)、エンディング(Outro)の長さを指定しておく。設定が完了し再生ボタンを押すと、AIが生成した音楽を聴くことができる。出来栄えを把握し、必要に応じて設定を変更し、求めているイメージに合った音楽に仕上げていく。

プロモーションビデオ

実際に上述の手順でサンフランシスコの観光案内ビデオをAmper Scoreで作成した(下の写真)。Union Squareをケーブルカーが走るビデオをアップロードし、設定画面で「Hip Hop」スタイルと「Heroic」ムードを選択。これだけの操作で、テンポのいいリズムに合わせ弦楽器がスタンドプレーする華やかな音楽ができた。更に、バイオリンやハイハットなどの音色を調整し10分程度でプロモーションビデオが完成した。商用コマーシャルとして使える高品質な出来栄えとなった。

出典: VentureClef / Amper Music

大手企業で利用が始まる

AIで音楽を生成する手法は大企業で採用が進んでいる。大手ニュース配信会社Reutersはコンテンツ生成プラットフォーム「Reuters Connect」を発表した。これはニュースコンテンツの販売サイトで、世界のジャーナリストはここでビデオを購入し、それを編集し、自社の記事で利用する。Reuters ConnectでAmper Scoreが使われており、利用企業はこのサイトでニュース映像にマッチする音楽を生成する。

AIが音楽産業を変える

AIミュージックの技術進歩は激しく、このペースで進化するとアルゴリズムが人間の作曲家の技量を上回る時代が来るのは間違いない。トップチャートの20%から30%はAIが作曲するとの予測もある。一方、AIが生成する音楽はフェイクミュージックで、人間が創り出した音楽の模倣で、創造性は認められないという意見も少なくない。議論は分かれるが、メディア産業はAIによりその構造が激変している。

AIが音楽を生成する仕組み】

GoogleのAI音楽プロジェクト

音楽生成と自然言語解析はメカニズムがよく似ており背後で稼働するニューラルネットワークは同じものが使われる。Googleは音楽を生成するAI技法「Music Transformer」を開発した。Music Transformerは文字通り「Transformer」という高度なニューラルネットワークで音楽を生成する。

AIが音楽を生成するメカニズム

Transformerは自然言語解析で使われ、入力された文章に続く言葉を推測する機能を持つ。Transformerは機械翻訳で威力を発揮し「Google Translate」の背後で稼働している。Music Transformerはこの仕組みを音楽に応用したもので、アルゴリズムが次の音を予測する。つまり、AIが音楽を生成するとはTransferが音を読み込み、それに続く音を予測する処理に他ならない。

作曲を可視化すると

実際に、AIが音楽を生成する過程(下のグラフィックス)を見るとMusic Transformerの機能を理解しやすい。音楽は左から順に生成され、ピンクの縦軸がMusic Transformerが音を生成している個所を指す。その左側の黒色のバーは生成された音楽で、円弧はMusic Transformerとの依存関係を示している。Music Transformerは特定のHidden State(円弧がポイントする部分)を参照し音を生成する。つまり、Music Transformerは直近に生成した音だけでなく、遠い過去に生成した音を参照して音楽を生成していることが分かる。

出典: Cheng-Zhi Anna Huang et al.

作曲が難しい理由とMusic Transformerの成果

音楽を生成するのが難しい理由は、音楽は異なるスケールの時間軸で構成されているため。音はすぐ前の音と繋がりを持ち(モチーフの繰り返しなど)、また、遠い過去の音との繋がりを持つ(複数小節の繰り返しなど)。従来手法(Recurrent Neural Networkを使う手法)は長期依存の機能は無く(遠い過去の音は参照できない)、最初に登場するモチーフは繰り返されない。これに対し、Music Transformerは短期と長期の依存があり、最初に登場するモチーフを繰り返し、ここから独自に音楽を展開できるため、高品質な音楽が生成される。上述のTaryn SouthernはAmper ScoreやGoogle Music Transformerを使って作曲している。新世代の歌手は芸術性だけでなくデータサイエンティストとしての技量も求められる。