Google Assistantがバイリンガルに進化、AI家電は多言語対応が必須機能となる

Googleの仮想アシスタント「Google Assistant」がバイリンガルとなった。今までは単一言語しか使えなかったが、これからは二か国の言語で話しかけることができる。Google Homeに、日本語で問いかければ日本語で答え、イタリア語で質問するとイタリア語で答える(下の写真)。世界でバイリンガル家族が増える中、Google Homeはバイリンガルに進化した。

出典: Google

スマホで利用する

バイリンガルのGoogle AssistantはスマートフォンPixel 2で利用できる。この機能を使うには、専用アプリ「Home」で使う言語のペアを設定する(下の写真左側、英語と日本語を選定)。この設定で、東京時間を英語で尋ねると、Google Assistantは英語で答える(下の写真、右側上段)。また、日本語で尋ねるとGoogle Assistantは日本語で答える(右側下段)。英語と日本語の他に、フランス語、イタリア語、スペイン語、オランダ語の六か国語をサポートしており、この中から二つの言語を選びバイリンガル機能として利用する。

出典: VentureClef

Google Homeで利用する

Google Assistantを搭載しているGoogle Homeでバイリンガル機能が威力を発揮する。筆者宅ではGoogle Homeを家電を制御するハブとして使っており、家の中のLEDライトをオン・オフするときに、英語と日本語で指示できる(下の写真左側)。また、テレビを操作するときも、英語と日本語で指示できる(下の写真右側)。

出典: VentureClef  

バイリンガル世帯

Googleが二か国語機能を投入した理由は、米国や世界でバイリンガル家族が増えているためである。米国では全世帯の二割がバイリンガルと言われている。カリフォルニア州では五割を超えると思われる。バイリンガル世帯では家の中で二つの母国語が使われる。例えば、メキシコからの移住が多い米国では、家庭内で英語の他にスペイン語が使われる。今までは、使う言語によりGoogle Homeの設定を変更していたが、これからは一回の設定で二か国語を使うことができる。

バイリンガル技法

Google Assistantは既に多言語に対応しているが、バイリンガル処理に進むには大きな課題をクリアーする必要がある。課題は二つあり、指示された音声の言語を特定することと、リアルタイムで指示内容を把握しアクションを取ること。

音声の言語を特定

Googleは話しことばの言語を特定する技術を2013年から開発している。これは「Language Identification (LangID)」 と呼ばれ、ニューラルネットワークで話しことばの言語を推定する。話しことばを前処理し、それをRecurrent Neural Networkに入力すると、言語の種類を判定する。 (下の写真、「hey thank you for calling me」という話し言葉をLandIDに入力すると、ネットワークは8か国語のうち、どの言語が話されたかを推定する。ネットワークはフレームごとに推定処理を続け、ここでは英語(濃い青色の部分)が話されたと推定。)

出典: Javier Gonzalez-Dominguez et al.

リアルタイム処理

Google AssistantはLangIDで言語を特定すると、次に、その言葉の意味を把握し、指示されたタスクを実行する。このプロセスは大規模な演算が必要となり、それをリアルタイムで実行することはできない。このため、Googleは二つの言語処理を並列で実行しておき、言語の判定結果がでると、その言語の処理だけを実行する。具体的には、言葉が語られると、二組のLangID処理と言語解析を並列で走らせ、その結果をアルゴリズム(Ranking Algorithm)で評価し(下の写真、中央部)、どちらの言語が語られたかを判定する。言語が確定すると、その言語だけを処理し、もう一方の処理は中止する。対象言語の処理は既に途中まで進んでおり、この技法でリアルタイムに応答できるようになった。

出典: Google

GoogleがAmazonを抜く

GoogleはAmazon Echoのアイディアを借用してGoogle Homeを開発した。Amazonが先行しているAIスピーカー市場で、Googleは高度なAIを武器にGoogle Homeの売り上げを伸ばしてきた。ついに形成が逆転し、GoogleがAmazonを抜き首位の座を奪った。2018年第二四半期、Google Homeの出荷台数は540万台で、Amazonは410万台にとどまった。三位と四位にはAlibabaとXiaomiが入り、中国企業が急速にシェアを伸ばしている。AIスピーカー市場ではGoogleが首位を奪うものの、これからは中国企業との戦いとなる。

多言語対応に向かう

Googleはバイリンガルの次にはトライリンガル機能を投入するとしている。更に、対応する言葉の種類を順次増やし、最終的には主要言語の殆どをカバーすることになる。つまり、Google Assistantは言語の制約がなくなり、どの言語で話されてもそれに対応できるよう進化する。これからのAIスピーカーやAI家電はマルチリンガル対応が必須の機能となることを示している。

出典: E&T Magazine

マルチリンガルな案内ロボット

マルチリンガル機能の応用分野は幅広く、ロボットの対話能力を大きく押し上げる。観光案内ロボットが数多く登場し、ツーリストは対話しながら情報を得ることができる。このプロセスでは、まず、会話する言語を入力する必要がある(上の写真、ピョンチャン冬季五輪の案内ロボットで英語か韓国語を選択する)。LangID技法を応用すると、案内ロボットにいきなり話しかけても、AIが言語の種類を把握し、質問された言語で案内する。東京オリンピックではマルチリンガルな案内ロボットが登場し、世界各国からの旅行者のコンシェルジュとなりそうだ。