GoogleはAIカメラ「Google Clips」 の販売を開始した。カメラにAIが搭載され、自動でビデオを撮影する。Google Clipsのアルゴリズムは、絵になるシーンを認識し、自動でシャッターを切る。実際に使ってみると、Google Clipsは独自のテイストを持っていて、子供や大人やペットが楽しんでいるシーンをビデオに収めていく。

出典: Google |
開発コンセプト
Deep Learningの進化で、アルゴリズムがオブジェクトの種類を高精度で把握できるようになった。この技術を応用して、人間に代わりAIが写真を撮影する技術が、次の開発テーマとなっている。Clipsはその一つの解で、カメラがシャッターチャンスを自動で認識し、プロ写真家のようにビデオ撮影することを目標に設計された。
家族やペットに反応
Clipsは家族やペットなどを撮影することを想定してデザインされた。Clipsはインテリジェントな機能を持ち、AIが人物やペットを識別する。Clipsに家族関係者を教えておくと、その人物を中心に撮影する。アルゴリズムは笑顔や動き (ダンスやハグなど) をシャッターチャンスととらえ、ビデオ撮影を始める。
操作方法
Clipsは小型形状のカメラでシンプルなデザインとなっている (上の写真)。カメラのレンズ (黒円の部分) を右に回すと撮影が始まる。撮影中は白いライトが点滅し、撮影していることを示す。Clipsが最適なシーンを選び、短いビデオ (6秒間のビデオクリップ) として収録する。レンズの下のボタンを押すと、マニュアルで撮影することもできる。
スマホアプリ
Clipsを被写体の近くに置き、レンズを回して撮影を開始する。被写体までの距離は3フィートから8フィート (0.9メートルから2.4メートル) が最適。130度の広角レンズを搭載しており、被写体に近づけて使う必要がある。Clipsにはファインダーはなく、スマホアプリ「Google Clips」でカメラが捉えた映像を見る (下の写真、左側上段の画面)。また、カメラのポジションもアプリで確認し、水平になっているかどうかをチェックする (同、右下の白枠)。

出典: Google |
ビデオの保存
撮影したビデオはClipsのストレージ(16GB)に格納される。これらビデオはClipsからアプリに送信され、スマホの上で閲覧する。ビデオでSaveオプションを選ぶと、写真クラウドGoogle Photosにアップロードされる (上の写真、右側中段)。ビデオは写真またはビデオクリップとして保存できる。プライバシー保護の観点から、撮影したビデオは、Save機能を使わない限り、デバイスに留まる。
実際に使ってみると
Clipsは人間に代わりAIが印象的なシーンを自動で撮影するので、スマホを持って被写体を追跡する必要はない。食事中にClipsをテーブルに置いておくだけで、絵になるシーンが撮影される。また、プールで遊んでいる子供を撮影するときは、Clipsを被写体に向けておくだけで、楽し気なシーンが撮影できる。ファインダーでシャッターチャンスを追う必要はなく、AIがこれを代行するので、写真撮影のスタイルが根本的に変わる。
AIの際立った特性
Clipsは絵になるシーンを捉える際に、際立った判定規準を持っている。Clipsは人が何かアクションを取っていることに敏感に反応し、シャッターを切る。例えば、飛び上がったり、ダンスしているシーンをシャッターチャンスだと理解する。また、お母さんと赤ちゃんが水に手を入れて、水しぶきを立てて遊んでいるシーンを逃さない。楽しそうに笑っているシーンは必ず撮影する (下の写真)。一方、Clipsは構図、色彩、ライティングについては考慮していない。つまり、AIは人やペットの自然なシーンを撮影するよう教育されている。

出典: Google |
シャッターチャンスの学習方法
アルゴリズムが最適なシーンを学習するため、Googleは教育データを生成した。ビデオから多くのセグメントを抽出し、そこからシーンのペアをつくり、プロ写真家がそれぞれのペアを比較し、どちらが絵になるかを判定した。これが教育データとなり、アルゴリズム教育で使われた (下の写真)。ニューラルネットワーク (MobileNet Image Content Model)がシーンの中のオブジェクトを判定し、機械学習の手法(Segmented Regression) でどちらのシーンが絵になるかを判定。このプロセスを繰り返し、アルゴリズムがプロ写真家のテクニックを学習した。

出典: Google |
Google Clipsはプロを超えたか?
実際に使ってみると、Clipsは子供や大人が楽しそうにしている顔の表情や、体全体のアクションを確実に捉え、生活の一部が切り取られたように、印象的なビデオを作り出す (下の写真)。筆者が撮影したビデオと、Clipsが撮影したものを比べると、Clipsの画面は生き生きしているシーンが多い。素人写真よりもテクニックは上で、プロの技を伝授された面影を感じる。人間の仕事は、Clipsが撮影したビデオの中から、気に入ったシーンをより分ける作業となる。

出典: VentureClef |
インスタ映えする写真はAIが撮る
ただ、ClipsのAIは子供や大人やペットに反応するが、その他のオブジェクトを自動撮影することはできない。観光スポットや綺麗な洋服を撮影する仕様ではなく、AIはこれらの被写体を撮影対象とは理解していない。今すぐに、写真撮影がAIに奪われることはないが、人間の技量がまた一つAIに置き換わる方向に進んでいる。インスタ映えする写真は人間ではなくAIが撮影する時代はもう目の前だ。