カテゴリー別アーカイブ: 人工知能

AIで新型コロナウイルスの遺伝子配列を解析、配列を言葉として解析しワクチンが効かない異変種の発生を予測

新型コロナウイルス感染症のワクチン接種が始まり、パンデミックが終息に向かうと期待されている。ウイルスは変異を繰り返し、今年に入り相次いで英国型や南アフリカ型異変種が発見された。これら異変種は感染力が高いが、ワクチンは有効であるとの見解が示されている。しかし、最新のAIを使った解析では、更に複数の異変種が生まれ、その幾つかはワクチンが効かないと推定する。この事態に陥れば、新型コロナウイルスの終息にはもう少し時間がかかるかもしれない。

出典: Brian Hie et al.

Viral Escape:ワクチンが効かなくなる

新型コロナウイルスなど感染症向けにワクチンが開発されるが、ウイルスの遺伝子が変異するとワクチンの有効性が低下し、最悪の場合は効かなくなる。ワクチン接種により体内に抗体(Antibody)が生成されるが、ウイルスが変異すると抗体がこれを認識できなくなる。これは「Viral Escape」(ウイルスがワクチンをすり抜けるという意味)と呼ばれ、感染症対策の大きな課題となっている。ワクチン開発ではウイルスがどう変異するとワクチンが効かなくなるのかが重要な情報となる。(上のグラフィックスは新型コロナウイルスのスパイクたんぱく質で、Viral Escapeが発生する可能性が高い個所(黄色)と低い個所(青色)を示している。スパイクたんぱく質に対してワクチンが開発されているが、Viral Escapeが発生しない部分(上のグラフィックス右側、S2と示された個所)に作用する仕組みを取る必要がある。)

ウイルスに自然言語解析を適用

MITのAI研究チームはViral EscapeをAIの自然言語解析(Natural Language Processing)を使って予測する技法を開発した。ウイルスの遺伝子配列を言葉として捉え、そこから文法(Grammar)と意味(Semantics)を把握することで、どの遺伝子変異がViral Escape(ワクチンが効かない状態)に繋がるかを予測した。この研究ではインフルエンザウイルス(influenza A hemagglutinin)、エイズウイルス(HIV-1 envelope glycoprotein)、及び、新型コロナウイルス(SARS-CoV-2 spike glycoprotein)の三種類が使われた。

遺伝子配列の文法と意味

ウイルスの遺伝子配列を解析し、その文法と意味を把握するが、それらを次のように解釈できる。文法とはウイルスの基礎機能を決める。文法がしっかりしているウイルスは感染能力が高く、ウイルスが生存する可能性が高いことを示す。一方、意味はウイルスの変異を示す。異なる意味をもつウイルスは異なる形状を示すことになる。例えば、新型コロナウイルスが変異して、意味が異なり、文法が正しければ、ワクチンが効かない感染力の強いウイルスが生まれることになる。

出典: Brian Hie et al.  

遺伝子配列の文法と意味を可視化

上のグラフはこれを可視化したもので、縦軸が文法で横軸が意味を示す。文法が正しいほど(上に行くほど)、感染能力が高い(赤色の円)。意味が変わるとワクチンが効かなくなる。矢印の通り、左上のウイルスが右上のウイルスに変異すると、感染力が高く、ワクチンが効かないウイルスとなる(Viral Escapeが起こる)。一方、ウイルスが変異しても文法が正しくなければ、感染力が低下し無害のウイルスとなる(青色の円)。

自然言語解析の手法

この研究では自然言語解析の手法を適用したが、具体的には、LSTM(Long short-term memory)というタイプのニューラルネットワークが使われた。LSTMは時系列のデータを解析する手法で、言語処理では入力された言葉に続く言葉を推定する。この研究では、LSTMにウイルスの遺伝子配列を入力し、ネットワークは意味と文法を出力する。

出典: Brian Hie et al.  

上のグラフィックス;BiLSTMにウイルスの遺伝子配列を入力すると(最下段)、ネットワークはその意味(入力データに続く言葉 = 変異)を出力し(中段)、更に、その文法を出力する(最上段)。モデルは推定した言葉と、この言葉が持つ文法の正しさを推定し、Viral Escapeとなる確率を算定する。

解析の結果

モデルが予測した結果を過去のデータで検証し推定の精度を検証した。このモデルはインフルエンザやHIVや新型コロナウイルスなど5種類のウイルスを解析した。その結果、新型コロナウイルスに対して、モデルは85%の精度Viral Escapeとなる変異を予測した(下のグラフ、右端)。

出典: Brian Hie et al.  

感覚的な理解

このモデルを自然言語に応用するとこの機能を理解しやすい。モデルは元の文章が変異するパターンを予測し、それが文法に適合しているかどうかを判定する。更に、文章の意味に関し、それらがどのような位置関係にあるかを算定する(下のグラフィックス)。

  • 上段:元の文章は「オーストラリア人がバリ島で死んだ」
  • 中段:文章が変異する(australianがaussieに変わる)が意味は変わらない
  • 下段:文章が変異する(deadがballetに代わる)と「オーストラリア人がバリ島でバレイ」となり意味が変わるが、文法も正しい。この変異がViral Escapeとなる。
出典: Brian Hie et al.  

事前に対策を講じる

いま新型コロナウイルスが変異し、英国型や南アフリカ型変異種の感染が広がっている。もし、変異種が発生する前に、ワクチンが有効かどうかを把握できると、医療関係者はその拡散に備え、必要な対策を取ることができる。また、ワクチンや治療薬の開発では、Viral Escapeが発生しにくい領域を対象に、モデルを開発することができる。このモデルはまだ研究段階であるが、AIは現行ワクチンが効かない新型コロナウイルスの発生を予測しており、不測の事態に備えておく必要がある。

Amazonはリストバンド「Halo」を投入、究極の健康管理ウエアラブルでAIが身体とメンタルの状態をモニター

Amazonは健康管理のウエアラブル「Amazon Halo」(下の写真)の出荷を開始した。これはリストバンドタイプのウエアラブルで、身体情報をモニターするセンサーとして機能する。ディスプレイは備えておらず、健康管理に特化したセンサーで、スマホアプリとペアで使う。実際に使ってみると、フィット感は良く、身体やメンタルの状態を把握でき、健康管理デバイスの新しい流れを感じる。

出典: Amazon

Amazon Haloの概要

Amazon Haloは右手または左手の手首に装着し、身体状態をモニターするために利用する。四つの機能を搭載しており、運動量、睡眠の質、声のトーン、及び、体脂肪率を計測する。計測したデータはスマホの専用アプリ「Amazon Halo App」に表示される(下の写真)。スマートウォッチではディスプレイに情報が表示されるが、Amazon Haloは健康管理センサーとしてデザインされ、最小限の機能だけを搭載している。価格は99.99ドルでAmazon Prime会員向けには74.99ドルで販売されている。Amazon Haloはサブスクリプション方式のデバイスで、月額3.99ドルの使用料金を支払う。

出典: Amazon / VentureClef

運動量をモニター

Amazon Haloは運動量をモニターし、体を動かした量をポイントで表示する(下の写真、左側)。一週間に150ポイントを得ることが目標で、その過程がグラフで表示される。1ポイントは1分間に中程度の運動をする量となる(右側)。中程度の運動とは、速足でのウォーキングやほうきで庭を掃除する程度の運動で、医療学会American Heart Associationは一週間に150分の運動を推奨している。Amazon Haloは加速度センサーと心拍数センサーで運動量を算定する。

出典: VentureClef

睡眠の質を測定

Amazon Haloは睡眠の状態を測定し、その質を100点満点のスコアで示す(下の写真、左側)。スコアは睡眠時間と睡眠内容を総合的に評価したもので、70点を下回ると対策が必要となる(右側)。スコアは睡眠時間の他に、寝入るまでの時間、ステージごとの時間、夜中に起きた回数などを加味する。睡眠のステージは「Hypnogram」と呼ばれ、Light、Deep、REMから成る。Lightは浅い眠りで、睡眠時間の半分を占める。Deepは深い眠りで、睡眠の前半に起こる。深い眠りの中で身体の細胞が修復され、健康維持に深くかかわるとされる。REM(Rapid Eye Movement)は脳が活動して覚醒状態にある眠りで、このステージで人は夢を見たり、記憶が整理される。このスコアで睡眠の状態を把握し、問題があればこれを改善する。ただ、睡眠の質は人により異なり、スコア以外に、朝起きた時の爽快感や日中の気分などが重要な指標となる。

出典: VentureClef

声のトーンを分析

Amazon Haloに搭載されたマイクが利用者の声を聞き、それをAIで解析して、声のトーンを把握する(下の写真、左側)。声のトーンとは言葉に含まれた感情で、四つに分類され、Amused、Content、Reserved、Displeasedとなる(右側)。Amusedは楽しい時の、Contentは満足した時の声のトーンとなる。Reservedは静かな状態で、Displeasedは怒った時の声のトーンとなる。実際に使ってみると、声のトーンを通じてメンタルの状態を把握できる。その日の気分を正確に把握するのは難しいが、Amazon Haloはこれを客観的に分析しグラフで提示する。また、Amazon Haloは会話の”鏡”として機能し、自分の声が相手にどのような印象を与えているのかを理解できる。この機能を使うには、事前に声を入力し、AIが本人を特定できるよう教育しておく。

出典: VentureClef

体脂肪率を推定

Amazon Haloは体脂肪(Body Fat)の割合を計測する(下の写真、左側)。スマホカメラで身体を撮影し(右側)、AIが画像を解析し脂肪量(Fat Mass)を推定する。体重については利用者が測定して入力する。これにより体脂肪率が分かる。

出典: Amazon

体脂肪率は健康管理に重要な指標で、この値が健康寿命や病気発症に関連する。体脂肪率が高いと心臓疾患や糖尿病の発症確率が上がる。体重は食事などで頻繁に変わるが、体脂肪量は変動が少なく、その変化が健康に大きく影響する。このため、二週間おきに体脂肪率を測定することを推奨している。体脂肪については、多くの測定法があるが、Amazon Haloはコンピュータビジョンと機械学習でイメージを解析する手法を取る。AIが体形から体脂肪を推定するが、病院での測定技術(Dual-Energy X-Ray Absorptiometryなど)と同等の精度であるとしている。

健康管理のコンテンツ

Amazon Haloは研究所「Labs」を運用しており、ここに健康管理のコンテンツを揃えている。コンテンツはワークアウトや睡眠の質を向上させるプログラムやマインドフルネスのレッスンなどから成る。ワークアウトは自宅でできるエクササイズが揃っており、ビデオでインストラクターの指示に従って体を動かす(下の写真)。ストレングス、カーディオ、ヨガ、バー(Barre、右側下段)の分野があり、目的に合ったプログラムを選択できる。バーとはバレエダンスに基づくワークアウトで、ハリウッドのセレブが行っていることで人気となった。Appleはフィットネスのための有料プログラム「Apple Fitness+」をスタートしたがAmazon Haloはこれに対抗する位置づけとなる。

出典: VentureClef

実際に使ってみると

左手にはApple Watchを着けているので、Amazon Haloは右手に装着して利用している。Apple Watchより一回り小型の形状で、着装感は軽く負担は感じない。デバイスを操作する必要はなく、Amazon Haloが自動で身体状態をモニターするので、ウエアラブルというよりはバイオセンサーを着装している感覚に近い。

一番驚かされたデータ

睡眠を分析した情報に一番驚かされた。日ごとに睡眠のスコアは大きく変わり、また、睡眠のパターンも一定ではない。よく眠れた日とそうでない日が明らかになり、今までは、感覚的に寝不足を感じていたことがデータで示される。次のステップとしては、上述のLabsに登録されているコンテンツを使って、睡眠の質を上げることになる。

リアルタイムで声のトーンを分析

Amazon Haloが分析する声のトーンも参考になる。普段の会話の声のトーンを把握し、次は、好感を持ってもらえる声のトーンにアップグレードするステップとなる。また、スピーチで好まれるしゃべり方を学習することもできる。Amazon Haloはリアルタイムで声のトーンを解析する機能もあり(下の写真、右側)、このツールとLabsに掲載されているレッスンを併用して声のトーンを改良する。

出典: VentureClef

バイオセンサー

Amazon Haloは人気のウェアラブル「Fitbit Tracker」からディスプレイを取り外した形で、リストバンド形状のバイオセンサーとしてデザインされている。センサーが収取するバイオデータをAIが解析し、健康管理のポイントをアドバイスをする。実際に使ってみると、健康管理のウエアラブルは生活に必須のデバイスであると感じ、これから需要が大きく伸びると思われる。できることなら、血圧や血糖値や酸素飽和度を測定する機能があれば健康維持に大きく寄与する。

タンパク質フォールディングでブレークスルー!!DeepMindはアミノ酸配列からたんぱく質3D構造を予測するAIで50年に渡るチャレンジに解を出す

アミノ酸の配列からタンパク質の3D形状を推定する技法は「タンパク質フォールディング」と呼ばれ、生物学のグランドチャレンジとして、50年にわたり研究が続いてきた。DeepMindは高度なAI「AlphaFold」でこの問題に挑戦し、ついにこれを解くことに成功した。これは生物学の革命と称賛され、医療や製薬が大きく進展すると期待されている。(下の写真:タンパク質フォールディングの事例で、タンパク質の3D形状をイラストで示している。緑色の形状が実測値で、青色の形状がAlphaFoldの予測。)

出典: DeepMind

生物学のグランドチャレンジ

タンパク質はヒトや他の生物を構成する基本単位で、その数は2億種類にのぼる。ヒトは2万種類のタンパク質で構成され、これらが生命の源となる。タンパク質は3D構造が重要で、その形状が機能を決定し、また、他のタンパク質との相互作用を司る。このため、タンパク質は「structure is function」といわれ、その3D構造の解明が続いてきた。しかし、構造を解明できたタンパク質の数はわずかで、3D構造解析が生物学のグランドチャレンジとされてきた。

タンパク質フォールディング

タンパク質はアミノ酸の配列で構成され、ヒトのタンパク質は20種類のアミノ酸で構成される。DNA情報を元にアミノ酸の配列が生成され、それが折り畳まれて3D構造のタンパク質となる。アミノ酸とアミノ酸が結合するとき、両者の距離や結合角度が決まり、らせん配列(Alpha Helix)やシート配列(Pleated Sheet)の構造となる。更に、これらが絡み合い、3D構造のタンパク質ができる。タンパク質がどのように折り畳まれているかを解明する研究を「Protein Folding Problem」と呼び、過去50年にわたり研究が続いてきた。

実験による3D構造の解明

タンパク質の形状を実測するために様々な手法が使われている。主なものは、低温電子顕微鏡法(cryo-electron microscopy)、 核磁気共鳴(nuclear magnetic resonance)、X線回折(X-ray crystallography)などで、実験的手法でその形状を把握する。これらが標準手法(Gold standard)で高精度に形状を把握できるが、測定には時間と経験と費用がかかる。

AlphaFold2の概要

DeepMindはタンパク質の実測に代わり、ニューラルネットワークで形状を推定する研究を進めている。このAIは「AlphaFold」と呼ばれ、アミノ酸の配列からタンパク質の3D形状を推定する。AlphaFoldは既に形状が判明しているタンパク質のデータを使って教育された。AlphaFoldは10万のタンパク質のアミノ酸配列と3D形状を学習し、新たなタンパク質の形状を推定できるようになった。その最新版「AlphaFold2」は高精度に3D形状を推定できる。

出典: DeepMind

タンパク質フォールディングのコミュニティ

DeepMindはタンパク質フォールディングのコミュニティCASP (Critical Assessment of protein Structure Prediction)でずば抜けた性能を示した。CASPはアミノ酸の配列からタンパク質の3D形状を予測するコンペティションで二年ごとに実施される。DeepMindは2018年にはAlphaFoldで、今年は最新モデルAlphaFold2で参戦し、破格の成績を示した(上のグラフ)。

ベンチマーク結果

タンパク質フォールディングの性能はGDT(Global distance test)という指標で示される。これは実験で得られたタンパク質3D構造と予測した3D構造がどれだけ重なるかを査定し、100点満点で示される。AlphaFold2のスコアは90点を超え(上のグラフ右端)、これはタンパク質フォールディングの解を示したと解釈される。つまり、AlphaFold2は実測と同じ精度でタンパク質の3D形状を推定できることを意味する。

新型コロナウイルスの解析

DeepMindはAlphaFoldを新型コロナウイルス(SARS-CoV-2)に応用し治療法の研究に貢献している。新型コロナウイルスは30種類のタンパク質から成り、それらの3D構造の解析が進んでいる。しかし、その中で6種類のタンパク質についてはその形状が分からず、DeepMindはその中の「ORF3a」の形状を特定することに成功した(下の写真)。青色の形状がAlphaFoldによる推定で、緑色の形状がUC Berkeley Brohawn Labによる実測値で、推定結果は実測値に極めて近いことが示された。その後、AlphaFoldはもう一つのタンパク質「ORF8」の3D構造を解明した。

出典: DeepMind

医療への応用

AlphaFoldがタンパク質の3D形状を推定することで、医療技術が大きく進化すると期待されている。その一つが感染症対策で、アフリカなどの途上国で蔓延している感染症「睡眠病(sleeping sickness)」の治療法開発に役立つとされる。睡眠病はツェツェバエが媒介する感染症で、タンパク質の形状が分からないことが病気治療の妨げとなっている。これらは「neglected tropical diseases」と呼ばれ、医療の手が届かず放置された状態の病気で、緊急の対策が求められている。

新薬開発

また、製薬会社はAlphaFoldで分子構造を把握することで、新薬開発が大きく進展すると見ている。新薬開発では複数の候補分子を選び、そこから効果のあるものを絞り込み、完成までに10年の歳月と25億ドルの費用が掛かるとされる。AlphaFoldで病気に関与する人体のタンパク質の形状が分かると、それに効果のある分子を特定でき、新薬開発が大きく進化する。

出典: DeepMind

DeepMindの苦戦と成果

DeepMindは「AlphaGo」を開発し、高度なAIが囲碁の世界チャンピオンを破り、社会に衝撃を与えた。その後、DeepMindは研究開発を進めるが、社会に役立つAIが登場せず、その開発戦略が問われていた。AlphaGoから5年が経過するが、AlphaFoldはタンパク質フォールディングで画期的な成果を示し、今度は社会に役立つAIで世界を驚かせた。(上の写真、AlphaFold開発チーム、今年は在宅勤務で研究を続行。)

アメリカ大統領選挙の予想は大きく外れた、一方AIは有権者の群集心理から勝敗を正確に予想

アメリカ大統領選挙はバイデン氏が圧勝すると予測されていたが、ふたを開けると僅差での勝利となった。選挙予想は再び外れたが、今回の予測は四年前より誤差が大きく、現行手法の限界が示された。一方、AIは有権者の群集心理を解析する手法で、激戦州の勝敗をズバリと的中させた。また、このAIは、勝敗が決まった後も、トランプ大統領は、選挙は不当であると主張し、敗北宣言をしないと予測している。

出典: CNN  

再び予測が外れる

アメリカ大統領選挙で主要メディアはバイデン氏が圧勝すると予測したが、バイデン氏が勝ったもののその差は小さく、再び予測が外れた。2016年の大統領選挙でも予測が外れたが、今年の選挙では前回より誤差が大きく、世論調査の手法についての検証が始まっている。国の世論が激しく対立する中、いまの手法で動向を予測することは限界であるとの意見も聞かれる。

AIによる選挙予測

このような社会情勢のなか、AIで選挙結果を予想する技法が注目されている。このAIを開発したのはサンフランシスコに拠点を置く新興企業Unanimous AIで、群集心理を解析することで勝敗を予測する。この技法は「Swarm Intelligence」と呼ばれ、個人ではなく集団で予測すると予測精度が上がるという仮説の元に構築されたモデル。大統領選挙の他に、野球やフットボールの試合の結果を正確に予測する。また、アメリカ映画のアカデミー賞では受賞作品を正確に予測し、社会を驚かせた。

激戦州の予測

大統領選挙ではSwarm Intelligenceを激戦州に適用してその結果を予測した。多くの州はその結果は明白で、投票前に勝敗が分かる(例えばカリフォルニア州は民主党支持でバイデン氏が勝利など)。しかし、10余りの州は勝敗の予測が難しく、激戦州(Swing States)と呼ばれ、これらの州の結果で大統領が決まる。Unanimous AIはこれら激戦州の勝敗の予測を投票日の45日前(9月21日)に実施し、その結果を公開した(下のグラフ)。

出典: Unanimous AI

予測結果

このグラフは激戦州ごとに勝敗の予測とその差が示されている。例えば、ペンシルベニア州はバイデン氏が3.5%の差で勝利すると予測。選挙結果が出そろったが、この判定はすべて的中している。注目はフロリダ州で、主要メディアはバイデン氏が3%から5%の差で勝つと予想していたが、Unanimous AIは1.6%の差でトランプ氏が勝つと予測した。実際に、トランプ氏が3.4%の差で勝利し、この手法の有効性が示された。

トランプ大統領が負けを認めない期間

Unanimous AIは選挙結果が出た後の両者の行動を予測している。トランプ大統領が負けた場合、94%の確率で、「この選挙は公正でない」と主張すると予測し、実際にこの事態が発生している。また、82%の確率で「勝敗が確定した後も最低二週間は負けを認めない」と予測している(下のグラフ、左側)。つまり、少なくても11月21日まではトランプ大統領は勝ちを主張することになる。

出典: Unanimous AI  

トランプ大統領支持率の予測

Unanimous AIはこれに先立ち、トランプ大統領就任後100日間の支持率を予測している(下のグラフ、緑色の線、歴代大統領との比較)。AIの予測によると支持率は42.1%で、他の大統領と比較して極めて低く、ショッキングな数字となった。しかし、この予測は的中し、支持率は41.9%で、在任中一度も50%を上回ることはなかった。

出典: Unanimous AI  

応用分野

Unanimous AIはこの技法をマーケティング調査や専門家の意見集約などに応用している。実際に、スタンフォード大学医学部は肺のレントゲン写真から結核を判定するプロセスにSwarm Intelligenceを導入した(下の写真)。複数の放射線医師がレントゲン写真から結核の判定をするが、そのプロセスをSwarm Intelligenceで解析すると判定精度が22%向上した。この病院ではAIが自動で結核を判定するシステム「CheXNet」を使っているが、Swarm Intelligenceの判定精度がこれを上回った。人間の知恵を集約することでAIより高度な判定ができることを示している。

出典: Unanimous AI  

何故予測が偏るのか

主要メディアは予測が大きく外れた理由を解析しているが、四年前に増して今回も、数多くの「Shy Trump Voters」がいたと考えられている。これは隠れトランプ支持者とも呼ばれ、世論調査の統計に表れない層を指す。今回は、トランプ大統領が支持者に対し、世論調査には答えないよう発言しており、この数が増えたとの見方もある。

有権者は懐疑的

一方、今回は、有権者は世論調査結果に懐疑的で、数字を割り引いてみる傾向が強かった。特に、マイケル・ムーア映画監督はしばしばテレビ番組に出演し、世論調査の結果はバイデン氏に偏っているので、これを信用しないようバイデン支持者に呼びかけた。このように、今回の選挙戦は有効な予想技術を持たない中、霧の中での戦いとなった。分断されたアメリカ社会で世論動向を正しく把握する技術としてAIに期待が寄せられている。

アメリカ大統領選挙はバイデン氏が勝利、トランプ大統領家族はフェイクイメージでテレビ番組に出演

アメリカ大統領選挙はバイデン氏が勝利宣言し、新しい時代の幕開けとなった。選挙期間中はフェイクイメージが有権者を混乱させると警戒していたが、予想に反し目立った被害はなかった。一方、AIで構成されたテレビ番組が始まり、初回はトランプ大統領家族が“出演し”、AIがリアルに描いたフェイクイメージが注目を集めている。

出典: Sassy Justice

Deepfakeで作られた番組

この番組は「Sassy Justice」という名前で、登場人物の顔はすべてAIで描かれる。世の中の不正を暴くことを使命とする主人公Fred Sassyが、ワイオミング州の州都シャイアンで活躍するというパロディーで、多くの著名人が登場するが、その顔はDeepfakeで生成されている。Deepfakeとは顔を置き換えるAIで、演技する俳優の顔を著名人の顔で置き換える。

トランプ政権の風刺

この番組は大統領選挙前にYouTubeに公開され、トランプ政権を風刺した内容となっている。トランプ大統領とニュースキャスターのインタビューがDeepfakeで再現された。実際の場面が描かれ、回答に困窮するシーンがクローズアップされた(下の写真)。顔はDeepfakeで生成されたものであるが、映像からそれが偽物であるとは分からない。しかし、受け答えや演技はコミカルで、フェイクビデオであることが分かる。

出典: Sassy Justice  

ロシア政策のパロディー

この番組はトランプ一家が登場し、イヴァンカ・トランプ(先頭の写真)は記者会見で、「米国でDeepfakeが拡散している理由はロシアによるもの」との見解を示した。トランプ大統領はロシアによる情報操作は無いと主張するが、この番組でイヴァンカがこれを認めた形となっている。一方、ジャレッド・クシュナーは子供として登場し(下の写真)、Deepfakeの取り締まりを強化しているが、その目的は「パパが選挙で勝つため」と答える。

出典: Sassy Justice  

映画スターの登場

トランプ家族の他にも著名人が登場し、女優ジュリー・アンドリュースは若いころの姿で、Deepfakeの検知技術を開発している研究者として描かれている(下の写真)。社会にDeepfakeが溢れる中、コンピュータ技術を使い、これを見抜く技法を開発している。しかし、それを使ってビデオ画像を判定するが、どうも上手くいかない。。。

出典: Sassy Justice  

番組制作者

この番組は米国の人気アニメ「South Park」の監督・声優であるTrey Parkerらにより制作された。米国のトップ・プロデューサーが手掛けるDeepfakeは完成度が高く、映像からフェイクであることを見抜くことはできない。一方、音声は声優によるものであり、また、前述の通り、コミカルな演技から、Deepfakeを使ったコメディであることが分かる。

Deepfakeで番組を制作する目的

Trey Parkerはメディアとのインタビューの中で、このビデオを制作した理由はDeepfakeの危険性を分かりやすく伝えるためとしている。フェイクイメージが社会に広がり、人々は戦々恐々としているが、このビデオはコミカルにDeepfakeとは何かを説いている。同時に、完成度の高いDeepfakeのインパクトは強く、映画やテレビ番組でAIで顔を生成する手法が広がる兆しを感じさせる。

[Deepfake技術概要]

Deepfakeとは

Deepfakeは顔を置き換える技法で、実在の人物の顔を著名人の顔に置き換えるツールとして使われている(下の写真)。ある人物の顔写真(左端)を著名人の顔(中央、トム・クルーズ)に置き換えると、その人物の顔の部分だけがトム・クルーズになる(右端)。例えば、ビデオ撮影した自分の顔をトム・クルーズの顔に置き換えると、映画スターが映っている偽のビデオができる。

DeepFaceLab

この番組では「DeepFaceLab」というタイプのDeepfakeが使われた。DeepFaceLabはオープンソースとして公開されており、誰でも自由に使うことができる。DeepFaceLabは演技者の顔が鮮明に映ってなくても、高精度なDeepfakeを生成できるという特徴を持つ。(下の写真:DeepFaceLabで生成したイメージで、サングラスで目が覆われていても高精度なDeepfakeを生成できる。)

出典: Ivan Perov et al.