Meta社(旧Facebook社)の人工知能研究所Meta AIは、文字で書かれていない言語に対して、AIを搭載した初の合成音声翻訳システムを開発した。喋った言語をリアルタイム翻訳し、合成音声で相手とコミュニケーションを取ることができる。

  • 喋った言葉をリアルタイム翻訳、合成音声で会話できるAIが話題 ネット「ほんやくコンニャク!」

    Facebookのメタ社が、喋った言語を翻訳し、合成音声で相手とコミュニケーションを取れるシステムを開発

これまでAI翻訳は、主に書き言葉を対象としてきたが、世界に存在する7,000以上の言語の約半数は主に口語であり、標準的な文字体系がないという。そのため、AIモデルに学習させるための情報が足りず、機械翻訳ツールを構築するのは不可能だった、と同社は指摘。この課題に取り組むために、標準的な書き言葉を持たない中国語圏の言語である福建語として、初のAI翻訳システムを構築したという。

同翻訳システムは、多くの言語間でリアルタイムの音声間翻訳を可能にするUniversal Speech Translator (UST)プロジェクトの一環だ。リアルタイムに、福建語を話す人が、英語を話す人と会話することができるというもの。Meta社のマーク・ザッカーバーグCEOがInstagramにて、デモ動画を投稿しているので見てみてほしい。動画では、喋り終わると、翻訳された言語が、合成音声によって再生され、リアルタイムのコミュニケーションを可能にしている。

同社によれば、多くの音声翻訳システムは、書き起こし原稿に依存したシステムか、音声からテキストへの変換システムだが、書き言葉を持たない口語にとっては、書き言葉を翻訳出力として生成することは、うまくいかなかったという。そこで、音声から音声への翻訳に着目したそうだ。福建語は低リソース言語であり、スペイン語や英語などに比べて学習データが豊富ではなく、英語から福建語への翻訳者も少ないため、AIモデルが学習するデータを収集することが困難だったそう。そこで、中間言語として、北京語を利用し、英語(または福建語)の音声を北京語のテキストに翻訳した後、福建語(または英語)に翻訳するという手法をとったのだそう。

同社は同翻訳システムについて、福建語の翻訳モデルはまだ完成しておらず、一度に全文を翻訳できないが、言語間の同時翻訳を可能にする未来への一歩となるとしている。また、本システムの技術は、他の多くの口語や、記述された言語に拡張することが可能だとしている。今後は、研究を拡大し、より多くの人にこの技術を提供したいとのことだ。

ちなみに、福建語の翻訳モデル、評価データセット、研究論文などをオープンソースとして公開している。他の研究者が福建語の音声翻訳の研究に取り組むことを奨励し、この分野のさらなる発展を目指すとか。

ネット上では「これ、マジでスゴい!」「MetaからでたAI通訳、精度とスピードやばいね。」「ほんやくコンニャクきちゃ!」などの声が寄せられた。