東芝は10月29日、外国人とのビジネス会議などにおいて、翻訳結果をリアルタイムでパソコンやタブレットなどに字幕表示し、外国語コミュニケーションを支援する日英・日中の通訳機能を備えた会議支援システムを開発したことを発表した。まずは同社グループ内で同システムの運用を行い、2016年の実用化を目指すとしている。
同社は、従来翻訳が難しかった日本語の話し言葉を、翻訳しやすい単位・表現に変換する整文技術と、専門用語や社内用語などの訳語を事前に登録するために、会議資料などから自動でシステムに登録されていない言葉を抽出する技術を開発。これにより、会議参加者の外国語会議における内容理解度の向上が確認されたという。
同システムで用いられる整文技術は、さまざまな話者に共通する話し言葉特有の表現を把握する規則ベースの手法と、多様な表現を事例から漸増的に学習する統計ベースの手法を組み合わせており、広範な表現を翻訳に適した表現や長さの文章に変換するという。統計ベースの手法では、学習事例の量と質が精度に影響を与えるが、整文事例作成ツールをWebアプリケーションとして開発したことにより、整文事例の収集と整文結果の評価を効率化するとともに、事例増強によって精度を向上させているという。
また、未知語に起因する音声認識精度や翻訳精度の低下を防ぐため、専門用語など会議通訳に必要な語彙を会議資料などから自動で抽出する語彙獲得技術も開発。整文した文章を、語彙獲得技術と、統計ベースの手法と規則ベースの機械翻訳手法を組み合わせた、同社のハイブリッド機械翻訳方式で処理することにより、高品質で、話者ごとの話し方の違いにも対応できる翻訳となっているという。
さらに、これらの技術を取り入れた遠隔会議、対面会議、プレゼンテーションを支援する通訳システムも同社では開発しており、同システムを用いた日本語会議の中国語通訳の結果では、日本語検定2級以上の中国人被験者の会議内容理解度が約60%から約80%に、日本語検定2級未満の被験者では約30%から約60%に改善する効果が確認されているという。