NTTアイティは、人の声を特徴付ける「話者」と「口調」を自由に組み合わせて合成音声を作成する、音声合成サービス「FutureVoice Crayon」を7月1日にリリースすると発表した。

従来技術の音声合成製品は、限られた声や感情表現の中から選択して合成音声を作成するため、多様なニーズに十分に応えることができなかったが、今回リリースする「FutureVoice Crayon」は、話をする人の声質である「話者」と、声の出し方や言葉の使い方などの「口調」の特徴を別々に抽出し、合成音声に反映することを実用化した。

これにより、さまざまな「話者」と「口調」を組み合わせて、バリエーション豊かな合成音声を実現。リリース時点では、150人の「話者」と「口調」を用意しており、「話者」と「口調」の組み合わせで2万パターン以上の合成音声を利用できる。

 「話者」と「口調」の組み合わせイメージ

利用シーンとしては、対話・ゲームなどのアプリケーション、e-Learningなどのコンテンツ、コミュニケーションロボット、キャラクター連動型デジタルサイネージなどを想定している。

価格(税別)は、クラウド製品が月額1万円より、オンプレミス版はオープンプライスとなっている。