機械学習、そしてディープラーニングの登場により、社会現象と言えるほどのAI(人工知能)ブームが巻き起こっている。そこかしこでAI活用の可能性について語られてはいるが、現段階において、具体的にどんなことができるのだろうか。

「あったらいいな」からスタートし、AIとの出会いによって具現化への道が開かれたのが「ANIMEGAPHONE(アニメガホン)」だ。TBWA HAKUHODO、ユカイ工学、KOTOBUKISUN、クリムゾンテクノロジーの4社から成るアニメガホン制作委員会は2月8日、音声変換AI技術「リアチェンvoice」を搭載したアニメガホンの製品情報を発表、コンセプトムービーを公開した。

同製品を使って発声すると、リアルタイムボイス変換AI技術によって(事前に登録しておいた)他者の声に変換されて発信される。つまり、イントネーションなどの情報は保たれたまま、声質だけが別人のものに即時変換されるわけだ。これにより、男声が女声で呼びかけたり、従業員が社長の声で訓示を読み上げたりといったことも可能になる。

このマンガに出てきそうな”夢のツール”、アニメガホンはいかにして実現されたのか。

アニメガホン制作委員会の市川直人氏(TBWA HAKUHODO CD/Copy Writer)、三桝祐哉氏(同 Producer)、小川貴之氏(同 Art Director)、飛河和生氏(クリムゾンテクノロジー CEO/Technical Director)の4氏にお話を伺った。

始まりは「問題提起」

――アニメガホンを作ろうと思ったきっかけを教えてください。

市川:初めは「テクノロジーを使って何か新しいモノを作ったり、問題解決をしたりできないか」という大きなところから入っていて、最初からメガホンに絞っていたのではなく、いろいろなものを考えていたんですね。

そうしたなかで群衆整理とか、人混みで声が届かないといった問題を解消できないかなというのが出発点になりました。実際にイベント会場などに足を運んでみて感じたのが、イベント会場や空港などで警備員がメガホンを使って何か指示していても、大きな声だけでは人にはちゃんと届かないんじゃないか……ということです。

「カクテルパーティー効果」というのがあって、パーティーのようにざわざわしている場所でも、人間は興味がある人の声や会話などは自然に聴き取れると言われています。例えば、コミケ会場ならばアニメの声優さんの声とか、コンサートならばそのコンサートで歌うアーティストの声だったら振り向いてしまいますよね。なので、声を大きくするだけでなく、声質も変えることができるメガホンが作れないかということでプロジェクトが始まりました。

TBWA HAKUHODO CD/Copy Writerの市川直人氏

――なるほど。4社共同の制作委員会は、どのような流れで生まれたんですか?

市川:このチーム(市川氏、三桝氏、小川氏)でまず考えたのですが、アイデアはあっても僕らはテクノロジーの会社ではないので、直接作ることはできません。技術的にできるかできないかもわからないので、とにかくインターネットで調べました。

三桝:調べたなかで、筑波大学に音声学に長けている方が3人くらいいらしたんですが、一番メディアに出ていて連絡をとれる可能性が高そうだった方にメールや電話でご連絡しました。そうしたら面白そうだと言っていただけたので、筑波まで行ってお話したところ、そういう話なら日本一の教授が名古屋にいると教えてもらったんです。

それで今度は新幹線で名古屋大学の戸田智基教授のところに伺ったら、「そういうことをやりたいならクリムゾンテクノロジーさんという会社があるよ」と紹介していただきました。「それはどこにあるんですか」と聞いたら「三軒茶屋ですよ」と。灯台下暗しだったなと思いました(笑)

TBWA HAKUHODO Producerの三桝祐哉氏

市川:技術ありきではなくアイデアからスタートしていたので、それを実現するためにRPGのように行ってはダメ、行ってはダメを繰り返して、やっとうまくつながったのがクリムゾンさんや、そのほかの(制作委員会を構成する)会社さんですね。

三桝:クリムゾンさんを紹介していただく前にも並行して調べていて、他社の技術も検討したんですが、僕達が考えるメガホンのレベルに達してないなと感じていました。調べたり、人に聞いたりしていろいろな企業にあたった結果、クリムゾンさんにたどり着いた、という感じです。ここまでで半年くらいかかりましたね。