KDDI研究所は29日、日本語音声合成ソフトウェア「N2」のWindows版およびLinux版ソフトウェア開発キット(SDK)を発売した。これにより、スマートフォンやタブレットに加え、ロボットやIoTデバイスにも音声読み上げ機能を搭載できるようになった。

「N2」はKDDI研究所が独自開発した、インターネット接続なしにデバイス単体で動作が可能な音声読み上げソフトウェア。HMM音声合成方式とよばれる、統計的な音声モデルを用いる音声合成方法により、品質を高く保ちながら必要なデータサイズを抑えることが可能なため、端末上で音声合成に必要な高速処理・省サイズを実現できる。2011年より、Android版の「N2」TTSライブラリSDK、日本語TTSアドオン「N2 TTS」の提供を開始。2013年からは、iOS版TTSライブラリも提供している。

実装例として、auの音声アシスタント「おはなしアシスタント」のほか、KDDIのクラウドサービス「クラウドオートコール」での音声メッセージ合成などのサーバシステム、KDDIホームページに掲載している社長メッセージの音声読み上げにも利用されている。

今回のWindows版およびLinux版の提供により、対応OSは、Windows Vista以降、RHEL 6以降、Debian GUN/Linux 7以降、Ubumtu 12.04 LTS以降、Raspbian、Android 1.6以降、iOS 5以降となる。入力文字コードはUnicode(UTF-16)、出力形式は32kHzサンプリング、16bitリニアPCM。声質は男声10種類と女声10種類が用意されている。