カテゴリー別アーカイブ: 人工知能

AIが女性の服を脱がせる:GANが写真からヌードイメージを生成、リベンジポルノへの悪用が懸念される

AIの暴走が止まらない。女性の写真を入力するとAIが服を脱がせてしまう。これは「DeepNude」というアプリで、AIが写真を服を脱いだヌードイメージに変換する。女性を標的にしたアプリで、リベンジポルノとして使われると深刻な被害が予想される。また、セレブの偽ヌード写真を生成でき、個人の肖像権が著しく侵害される。フェイクイメージを取り締まる法整備が進むが、SNS企業はこれを拡散させない対策が求められる。

出典: DeepNude  

DeepNudeとは

このアプリは匿名の技術者により開発され、DeepNudeホームページ(上の写真)に掲載されていた。アプリをダウンロードして使うことができたが、社会に及ぼす問題の重大性が認識され、このサイトは閉鎖された。アプリは女性の写真を読み込み、服の部分を肌に変換し、全身のヌードイメージを生成する。アプリは無償版と有償版(50ドル)があり、後者を使うと全身が裸になる。

本当にヌードイメージが生成されるのか

このサイトは閉鎖されたが、既に多くのメディアがこのアプリを試し、その結果を公表している。生成されるヌードイメージの出来栄えは入力する写真により大きく変わる。被写体に光があたり鮮明に映っている場合は極めてリアルなヌードイメージが生成される。一方、入力する写真の解像度が低い場合は生成されるイメージにノイズがのる。また、被写体が暗い場合や正面から撮影されていない場合は、全くイメージが生成されない。なお、このアプリは女性のヌードイメージだけを生成する。男性の写真を入力しても女性のイメージが生成される。

アルゴリズムの制約

これらから、アルゴリズムは女性の写真だけで教育されていることが分かる。男性のヌード写真は使われていないが、興味の対象外であることに加え、インターネットでこれらの写真は少なく、教育データの整備が難しいことも理由となる。更に、教育データの件数は多くなく、特定条件の写真(正面から鮮明に撮影した写真)だけを処理できる。DeepNudeはベータ版という印象を受けるが、AI開発が進むと被害が拡大することになる。

アルゴリズムの仕組み

このアプリは「Image-to-Image Translation with Conditional Adversarial Networks」という研究成果を使っている。これはBerkeley AI Research (BAIR) Laboratoryが公表した論文で、入力したイメージを異なるイメージに変換するAI技法である。研究チームはこの成果をソフトウェア「pix2pix」として公開している。pix2pixはGenerative Adversarial Networks(GAN)の手法を使い、入力されたイメージを指定されたイメージに変換する。例えば、靴のスケッチをpix2pixに入力すると靴の写真が生成される(下の写真、GANの仕組み)。

出典: Phillip Isola et al.

イメージ変換の応用事例

pix2pixの特徴は同じアルゴリズムを異なるモデルで使えることで、応用分野は広く様々な操作ができる。例えば、ラベル付けされた道路イメージを道路の写真に変換する (下の写真、左側上段)。また、航空写真を地図に変換するプロセスでも利用される(左側下段)。更に、白黒写真をカラー写真に(右側上段)、昼間の写真を夜の写真に(中央下段)、夏の写真を冬の写真に変換することができる。

出典: Phillip Isola et al.

DeepNudeへの応用

DeepNudeもこのイメージ変換の技法を使った事例となる。DeepNudeは上述の通り、GANを女性のヌード写真で教育した。これ以上の説明はないが、ヌード写真の一部をマスクし、GANはマスクしたヌード写真から元の写真を生成できるよう教育されたものと思われる。元の写真がGround Truthとなり、GANはマスクされた部分(服の部分)を元の写真(肌の部分)に変換する技法を習得し、全身のヌードイメージを生成する。

社会的影響の大きさ

このアプリは軽い娯楽として開発されたのかもしれないが、想定外に重大な問題を内包している。特定の女性を攻撃するためにこのアプリが悪用されると社会に与える影響は重大である。男性が女性に復讐するためにDeepNudeを使うと、写真をヌードイメージに変換し、偽のリベンジポルノが生成される。また、組織が女性活動家の行動を制限するためにDeepNudeを使う可能性も否定できない。前述の通り、セレブのフェイクヌードが拡散し個人の尊厳が脅かされる。

既にフェイクビデオが拡散

既に、DeepFakesで生成されたフェイクビデオがネットで拡散し社会問題となっている。最近では、 ZuckerbergのフェイクビデオがInstagramに公開された(下の写真)。本物と見分けのつかない偽のZuckerbergがデータの独占について語る仕組みとなっている。Facebookはサイトからフェイクビデオを削除しないことを表明しており、開発者はこの指針に抗議するためこのフェイクビデオを投稿した。

出典: bill_posters_uk@Instagram

フェイクビデオをどう取り締まるか

DeepFakesやDeepNudeへの対策が喫緊の課題となっている。米国連邦議会はDeepFakesによるフェイクビデオの流通を制限する法案「DEEP FAKES Accountability Act」を作成した。一方、DARPAはフェイクビデオを検知する技術の開発を進めているがまだ目立った成果は出ていない。このため、フェイクビデオを取り締まるためには、DeepFakesやDeepNudeの開発者が同時に、偽コンテンツの識別技術も開発する必要があるとの議論が進んでいる。更に、Facebookなどのプラットフォームはフェイクビデオの拡散を防ぐ技術を確立することが求められている。

DeepNude改良版

DeepNudeのサイトは閉鎖され問題は沈静化に向かうように見えるが、既にパンドラの箱は開けられ、元に戻ることはできない。DeepNudeに代わるアプリが開発されていることは明らかで、GANを強化し完成度の高いヌードイメージを生成するアプリが登場することが予想される。今度は、攻撃されるのは女性だけでなく、男性も対象となり、新たな問題が生まれる。

ハリウッドの終焉:映画会社がAIでデジタルヒューマンを生成、完璧なフェイク俳優がリアルタイムで演技する

フェイクビデオはAIにより完成度が向上し、もはや本物と偽物を見分けることが難しい。映画特撮ベンチャーはAIを使って極めて高精度なデジタルヒューマンを生成した(下の写真)。俳優や歌手やアニメをデジタルに生成するもので、仮想のキャラクターが動き喋りだす。フェイクビデオとは違い、完成度が格段に高く映画で使える品質となっている。映画スターはデジタルヒューマンに置き換わり、メディア産業が激変の時を迎えている。🔒

出典: Damien Abdool  

AIが音楽ヒットチャートの3割を生成、ニューラルネットワークが音楽産業を一変する

ピアノ曲「エリーゼのために」をモチーフにAIがディズニースタイルで音楽を生成した。

これはOpenAIが開発したAIで、映画で使える完成度の高い音楽が創られた。実際、日ごろ聞いている音楽の中にAIで創られた曲が含まれており、ニューラルネットワークの創作力は急速に進化している。人気シングルの3割はAIが創り出すといわれており、音楽産業が大きく変わっている。🔒

Googleは次世代「Assistant」を公開、AIがスマホで稼働し言葉でアプリをサクサク使える

Googleは2019年5月、開発者会議「Google I/O 2019」を開催し、最新の製品や技術を披露した(下の写真、Sundar Pichaiの基調講演)。今年のテーマは「Help」で、人々を助け社会の役に立つAIに重点が置かれた。怖いほど先進的なAIの発表はなく、生活を便利にするAI技術が数多く登場した。この模様はYouTubeでリアルタイムで放送された

出典: Google  

発表概要:新製品

ハードウェアではミッドレンジのスマホ「Pixel 3a」と「Pixel 3a XL」が発表された(下の写真、左側)。また、スマートホームハブの最上位機種「Nest Hub Max」が登場(下の写真、右側)。従来のハブ「Google Hub」は「Nest Hub」と改名され、スマートホーム商品として位置付けられた。ソフトウェアでは基本ソフト最新モデル「Android Q」が公開された。Qはセキュリティやプライバシー保護に重点を置くデザインとなっている。

発表概要:AI関連技術

AI関連では「Google Assistant」の機能を大幅に強化した次世代AIアシスタント「Google Assistant Next Generation」が発表された。AIを軽量化しスマホで稼働させることで、高速処理を実現。また、GoogleはAIのバイアス(偏った判定)を検知する技術「TCAV」を公開した。更に、AIを人類のために活用するプロジェクト「AI for Social Good」を紹介し、GoogleのAI開発のスタンスを明らかにした。

出典: Google

次世代Google Assistant

多くの新技術が登場したが、Googleは次世代Assistantに多くの時間を割いて、その機能を紹介した。現在、AssistantのAI (Recurrent Neural Networks、言葉を理解するAI)はクラウドで稼働しており、そのサイズは100GBを超える。スマホでAssistantを起動するとそのタスクはクラウドで実行され、結果がスマホに返される。次世代AssistantではAIサイズが0.5GBに軽量化され、これがスマホで実行される。このため、処理時間が大幅に短くなり、最大10倍の高速化を実現した。

アプリを言葉で高速実行

これにより言葉でアプリを連続してリアルタイムで操作できる(下の写真)。テキストメッセージを送信するときは、「Reply Justin, Had a great time with my family」と指示する。写真アルバムを検索するときは、「Show me my pictures from Yellow Stone」と、また、その中で動物が写っている写真を選ぶときは、「The ones with animals」と語る。複数のアプリを音声でサクサクと処理できる。

出典: Google

長いメールを言葉で生成

次世代Assistantは音声認識機能が大幅に向上し、長いメールを言葉だけで生成できる(下の写真)。Assistantに「Send mail to Jessica」と指示すると、メールアプリが起動。ここにメール文を音声で読み上げるとテキストに変換される。メールの題名を指定するときは「Set subject to Yellow Stone Ventures」と述べる。今までは短いメールに限られていたが、次世代Assistantは正確に音声をテキストに変換するので、長いメールでも苦にならない。

出典: Google

Duplexでレンタカーを予約

Googleは昨年、AIがレストランに電話をかけ予約する機能「Duplex」を発表し市場を驚かせた。今年は、Duplexでウェブサイトを操作する機能を発表した。DuplexはAssistantと連携して稼働する。Assistantにタスクを指示すると、Duplexがウェブサイトにアクセスし、これを実行する。Duplexはウェブサイトでレンタカーを予約できる。Nationalのレンタカーを予約する際は「Book a car with National for my next trip」と指示する。DuplexはNationalのウェブサイトにアクセスし予約プロセスを起動(下の写真)。Duplexは利用者のカレンダーから次の出張予定を把握しており、予約日時を自動で入力する。また、Duplexは前回借りた車種を表示し、利用者の氏名や連絡先を入力する。利用者はこれら入力された情報を確認して予約を実行する。数多くの画面でデータを入力する必要はなく、実行ボタンを押すだけで予約が完了する。

出典: Google

個人に沿ったサービス

現行Assistantはその機能が拡充され、利用者の情報を幅広く把握することで、個人に沿ったサービスを提供する。個人情報は「Personal Preference」のページで事前に登録しておく。また、家族の情報、よく訪れる場所、好みの音楽などを登録しておくと、Assistantはこれらに沿った情報を提示する。「Nest Hub」(旧Google Hub)にディナーのレシピを尋ねると、Assistantは利用者は地中海料理が好きであることを理解しており、「Classic Israeli Shakshuka」を推奨する(下の写真)。また、Assistantは環境も理解しており、朝の時間帯にレシピを尋ねると朝食の作り方を示す。

出典: Google

Assistantをクルマで利用

Assistantはクルマの中で音声によるナビゲーションのほか、メッセージング、電話、メディア操作ができるようになった(下の写真)。クルマのダッシュボードにスマホを装着し、「Let’s drive」と述べてこの機能を起動する。Assistantは利用者の予定を把握しており、ディナーの予約があればそのレストランまでのナビゲーションを始める。Assistantは利用者の好みの音楽を把握しており、それをスマホ画面に表示する。また、電話を受信するとAssistantは発信元の名前を表示する。

出典: Google

クルマを遠隔操作

Assistantは遠隔でクルマを操作する機能を搭載した。クルマに乗る前に車内の空調を起動するときは「Turn on the car A/C to 70 degrees」と指示する。この他に、ガソリン残量やドアロックを確認できる。対象となるメーカーとシステムはHyundaiの「Blue Link」とMercedes-Benzの 「Mercedes me connect」。

提供時期

次世代AssistantはPixelの次のモデルに搭載され、出荷時期は2019年末の予定。Googleは次世代のスマホモデルを発表していないが、これで今年末に出荷される予定であることが分かった。DuplexはAndroid OSを搭載したデバイスで利用でき出荷時期は2019年末の予定。また、これ以外のAssistant新機能は2019年の夏から出荷が始まる。

控えめの発表

いま個人情報管理に関しハイテク企業に厳しい目が向けられている。収集した個人データがどのように利用されているのか、GAFAに対して透明性が求められている。基調講演ではPichaiが自らGoogleの個人データ管理の指針とそれを実装したツールを説明した。講演はお祭りムードではなく、新製品発表は控えめに行われた。全体を通して、AI技法をアピールするより、開発された技術がどう生活に役立つかを示し、AI応用技術に軸足が移っているのを感じた。

誰でもプロのダンサーのように踊れる技術が登場、AIで映画スターになる!

自分が映ったビデオをAIに入力すると、それがプロのダンサーの動きに変換される。これはスタイル変換(Style Transfer)という技法で、AIがプロのモデルの通りに動く映像を生成する。例えば、Michael Jacksonをモデルとして使うと、自分がMoonwalkしているビデオが生成される。これをネットに投稿すると注目を集めること間違いなしで、一気にユーチューバー(YouTube Celebrity)になれる。🔒

出典: Caroline Chan et al.