5月10日より東京ビッグサイトで開催されている日本最大級のIT展示会「2017 Japan IT Week 春」。約1,600社に上る出展企業が最新のテクノロジーを駆使した製品やハードウェア、サービスやソフトウェアが一堂に会した本展示会場で、筆者のアンテナに「ビビビッ!」と飛び込んできたものをピックアップして紹介していこう。

東芝ブースの様子

第一弾として筆者がピックアップしたのは、東芝の音声合成ミドルウェア「ToSpeak」だ。この「ToSpeak」は、同社の音声・映像活用AIクラウドサービス「RECAIUS(リカイアス)」の技術を活用し、読み上げさせたいテキストを用意するだけで多様な電子デバイスで自然な合成音声を出力することが可能になるというもの。既に、「Yahoo! カーナビ」でも採用されており、「あの音声はこの技術を使っていたんだ!」と思われた読者もいらっしゃるのではないだろうか。

コミュニケーションAI「RECAIUS(リカイアス)」の技術を活用した音声合成ミドルウェア「ToSpeak」

しゃべらせたいテキストを用意するだけで自然な読み上げを可能にする「ToSpeak」。実際に聞かせてもらった音声は若干気になる部分はあったものの、他の合成音声と比較すると非常になめらか。チューニングを行うことでより自然なものへと高めることもできるそう

また、この「ToSpeak」のユニークな点のひとつに、収録時間わずか1時間程度のサンプルデータがあれば、任意の声で自然な合成音声が作り出せることにある。言葉を換えるならば、サンプルデータさえ用意できれば声優や俳優、著名人の声で任意のフレーズを喋らせることができるのだ。

導入事例。小林克也さんの声は「非常に似ていた」と評判だったそう。すごい時代がきたものだと感心してしまった

音声が大事なファクターになる数々のゲームだが、限られたゲームのハードウェアスペックで膨大な音声を作り出せないことが課題となるが、これを「ToSpeak」が解決している。小さなメモリサイズで発話できることで、ゲーム自体の特徴が大きく活かされる事例(東芝の音声合成ミドルウェア「ToSpeak」製品紹介ページ内事例紹介より)

エンターテインメント分野、とくにゲームなどでは、ユーザーにより良い体験を提供するため「今をときめく声優○○をCV(キャラクターボイス)に採用!」といったように、“音声”というかたちで付加価値を高めている向きもある。昨年末にカプコンより登場したニンテンドー3DSシリーズ向けソフト「めがみめぐり」では、プレーヤーとともに旅をする「ツクモ」の音声に「ToSpeak」が活用されており、キャラクターとあたかも会話しているかのようなコミュニケーションを楽しむことができる。

メカメカしさのない自然な音声でありながら、クオリティの高い音質で音声データサイズが小さいという「ToSpeak」のメリットは、ゲームのみならずデジタルサイネージや家電製品との親和性も高そうだ。例えば、駅に設置されている観光案内看板からご当地キャラが自然に話しかけてくる、目覚まし時計が毎朝自分の名前を呼びながら起こしてくれるといった、今までの製品にはない新たな価値を提供してくれるかもしれない。

説明員の方にお話を伺ったところ、今後この「ToSpeak」はより自然な音声を追求していくとのこと。将来的には、地域によってことなる言葉のイントネーションや喜怒哀楽といった感情表現、関西弁や津軽弁といった方言なども自在に、そして合成でありながら自然な音声として再現してくれる。……そう考えるだけで、いろいろな可能性が広がっている「ToSpeak」の進化には大いに期待したい。