Googleは10年前となる2006年、後に「Google翻訳」としてサービスが公開されることになる機械翻訳サービスを発表した。Google翻訳はそれまで機械翻訳で主流だったルールベースの翻訳ではなくフレーズベースの機械翻訳を使ったシステムとして登場。当初はアラビア語と英語の翻訳システムが公開されていた。サービスが公開されてから10年が経つが、機械翻訳の精度向上は引き続き、大きな課題とされている。
こうした課題を解決すべく、同社ははこのほど、「Research Blog: A Neural Network for Machine Translation, at Production Scale」において、新たな機械翻訳技術「Googleニューラル機械翻訳システム(GNMT; Google Neural Machine Translation system」を発表した。新技術は従来のフレーズベースの機械翻訳よりも高い翻訳精度を実現されているとのことで、すでに中国語と英語の翻訳に採用されている。翻訳技術の詳細は「Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation」にまとまっている。
Googleが今回発表した技術は翻訳対象となるテキスト全体を評価の対象として学習を行う。従来のフレーズベースの機械翻訳では翻訳対象をいくつかのフレーズに分割してから機械翻訳を実施しているが、新しい方法では全体を翻訳の対象としている。実験段階では翻訳エラーを従来の方法と比較して55%から85%ほど削減することができたと説明がある。中国語と英語の翻訳に利用しているという説明はあるが、同技術が日本語と英語の翻訳などに対して効果があるかどうかは説明が行われていない。