東芝は7月2日、音声や映像に含まれる言葉や人物を捉えてその意図や状況を理解し、人にわかりやすく伝えるクラウド・サービス「RECAIUS(リカイアス)」を発表した。その第1弾として、音訳エディタと音声書き起こしエディタのサービスを2015年10月から開始し、営業活動を開始した。

RECAIUSの機能要素

新サービスは、人がICTを意識して利用するのではなく、ICTが人の意図や状況に合わせて適切に動作するための仕組み作りに貢献するとしている。同社は、人が持つ「見る」「聴く」「話す」といった能力をICTで補完することにより、言語や表現などの言葉の違いや音声・映像・文字といった形態の違いを超えて、多くの人が安心・安全・快適に過ごせる社会の実現を目指しているという。

なお、「RECAIUS(リカイアス)」という名称は、人の言動を理解し人に分かりやすく伝えることで、人と人との理解を支援したいという想いから名付けた同社の造語とのことだ。

同サービスは、同社が長年培ったとする音声認識や音声合成、顔・人物画像認識、知識処理技術を融合して、これらの能力を最大限引き出せるよう、必要な知識を日々進化させることが可能なクラウド上で構成しているとのこと。

さまざまな言葉の表現や人の動き・態度から意図や状況を理解して、要約・翻訳・音声対話・音声合成を利用して、人にわかりやすく伝えるという。例えば、カメラに写った人に合わせて情報を提示する案内システムや、音声記録をテキスト化して重要な発言だけをチームで共有するなど、幅広い業務や用途で活用できるとしている。

RECAIUSの利用シーン

同社は同サービスを、自治体・図書館向けの音訳支援サービス、金融業向けの対話サービス、フィールド作業支援など、各種サービスへの適用に向けて提案していくという。

10月開始予定のサービス2種類のうち、「RECAIUS音訳エディタ(DaisyRings(デイジー・リングス))」は、視覚障害やディスレクシア(識字障害)により文字を読むことが困難な人のための音訳コンテンツを、簡単に作成できるというクラウド・サービス。

Webブラウザ上でテキストをアップロードして音訳でき、編集結果をデジタル録音図書の国際規格であるDAISY形式のファイルでダウンロードできる。音声合成の読みやアクセントも修正可能。図書館や学校、行政機関での利用のほか、一般企業でも製品マニュアルなどドキュメントの音訳に利用できるとしている。

なお、2016年4月施行の「障害者差別解消法」では障碍者差別解消のための合理的配慮が、行政機関では義務、一般企業などでも努力義務として求められているという。同サービスは全国の大学や障害者団体などで実証実験を実施し、使い勝手を高めてきたとのことだ。

もう一方の「RECAIUS 音声書き起こしエディタ」は、講演や会議などの録音データをブラウザ上で人が聴いて書き起こす作業を支援するサービス。

アップロードした音声データを再生しながらテキスト入力する際、テキスト未入力の箇所を特定して自動的に音声を再生したり、音声認識によるテキスト入力の候補を提示したり、話者の切り替えを推定したりすることで、音声をチェックしながら書き起こしを効率よく行えるとのこと。本サービスも実証実験を実施し、使い勝手を高めてきたという。

さらに同社は今後、「RECAIUS 音声ビューア」「RECAIUS 音声クリエータ」「RECAIUS 音声対話」「RECAIUS 同時通訳」「RECAIUS 人物ファインダ」といったサービスをSaaSで提供する予定だ。

また、RECAIUSの次世代サービスの充実に向けて、同社の研究開発センターで各種の技術開発に取り組んでいます。その一例として、話者の音声に似た声で多様な感情音声を生成する「感情付き似声生成技術」や、カメラで撮影した看板・標識・メニューなどの画像から複数文字列を同時に認識する「情景文字認識技術」などを開発しているとのこと。