マイナビニュースマイナビ

発想×AIで実現! 別人の声で話せる拡声器「アニメガホン」の可能性

[2018/02/26 08:00]伊藤正子 ブックマーク ブックマーク

AI音声変換の仕組みは? 外国語への対応は?

――そのクリムゾンテクノロジーの飛河さんは、最初にお話を聞いていかがでしたか?

飛河:まず「(メガホンの中に)入るかな」と思いました(笑)。(アニメガホンのメインCPUに搭載している)「リアチェンvoice」は、もともとPCやスマホ上で動作させていて、ハードに落とすことを想定していなかったんですね。なので、バッテリーで動かして携帯できるようにしたときに、どのくらいのサイズになるのかが見当もつきませんでした。

クリムゾンテクノロジー CEO Technical Director 飛河和生氏

――アニメガホンは、利用時に通信などは発生しないんでしょうか。

飛河:はい、この中で完結しています。

三桝:最初は僕らもスマホを使って通信で飛ばして……といったことを考えたんですが、メガホンは単体で成り立っているものなので、アニメガホンも単体で完結したほうがいいなと考えました。

――アニメガホンの音声変換の仕組みを教えてください。

飛河:あらかじめ声優さん(発信する人)の声と、利用する人の声を短い文章で200個ほど録音して、特徴をとっていきます。同じイントネーションで同じタイミングの時間軸上で両方の声を並べて、ある時間軸のときにどのくらい違いがあるのかをAIに学習させるんです。

「統計的声質変換法」と言うんですが、「『あ』から『う』に変わる」とか「『か』から『さ』に変わる」といった言葉の変化を統計的に学習することで、ある人が喋ったときの声の特徴をとることができます。これを使うことで、話している内容やテンポ、イントネーションはそのまま残して、声の質を入れ替えられるという仕組みです。

――だとすると、事前に利用者として録音していない人がいきなり使うのは難しいんですか?

飛河:簡易的にはできるんですが、クオリティは落ちますね。

市川:精度を100%出すにはあらかじめ録音した人が使ったほうがよいのですが、誰が使っても使えるには使えます。事前に利用者として登録(学習)した声との差によって精度が90%になったり、80%になったりしますが、まったく音が出ないといったことはありません。

飛河:機械学習していない声で入力すると間違って言葉を解釈することがあるんですが、事前に登録した声ならば、そうした変換ミスはかなり減ります。

少し大きめに発声する、など使い方には若干のコツがあると言うものの、実演では違和感なく男声から女声に変換されていた

――リアルタイム音声合成の難しいところは?

飛河:一番難しいのは、変換の時間を短くする部分です。今、最大100msで平均70~80msというところまで来ていますが、そこまで追い込むのが大変でしたね。男声から女声へも変換できるのですが、(声質を変えても)声の高さはそのままなので、オクターブ上げたりといった音程調整も含めて、全て同時にやっています。

今はまだ若干の遅れがあるので、例えば伴奏を聴きながらアニメガホンで歌おうとすると発声が少しだけ伴奏とずれて聞こえて歌いにくい状態です。これを最終的には違和感なく歌えるくらいにしたいと思っています。

――外国語などにも対応できるのでしょうか。

飛河:外国語はまだあまり実験していないのですが、いくつかの言語では使ってみてもらって「変換できている」というコメントをいただいています。学習のときに言葉の内容は理解しておらず、音で見ているので、変換後の声を登録する人がその外国語を話せる必要はありません。ただし、(言語によっては)日本語にはない特殊な発音などもあるので、ちゃんと正確に全部の言葉に対応できているかまではわからない、といったところです。

※ 本記事は掲載時点の情報であり、最新のものとは異なる場合がございます。予めご了承ください。

もっと知りたい!こちらもオススメ

【連載】教えてカナコさん! これならわかるAI入門 [18] 自由対話の難しさとは?

【連載】教えてカナコさん! これならわかるAI入門 [18] 自由対話の難しさとは?

前回、自由対話を実現するための方法をいくつかご紹介しました。しかし、実用に耐える自由対話を実現するには、解決しなければいけない難題がまだ多数存在しています。今回は、この自由対話の「難しさ」について、もう少し説明しておきたいと思います。

関連リンク

この記事に興味を持ったら"いいね!"を Click
Facebook で TECH+ の人気記事をお届けします
注目の特集/連載
[解説動画] Googleアナリティクス分析&活用講座 - Webサイト改善の正しい考え方
Google Workspaceをビジネスで活用する
ニューノーマル時代のオウンドメディア戦略
ミッションステートメント
次世代YouTubeクリエイターの成長戦略
教えてカナコさん! これならわかるAI入門
AWSではじめる機械学習 ~サービスを知り、実装を学ぶ~
Kubernetes入門
SAFeでつくる「DXに強い組織」~企業の課題を解決する13のアプローチ~
AWSで作るマイクロサービス
マイナビニュース スペシャルセミナー 講演レポート/当日講演資料 まとめ
セキュリティアワード特設ページ

一覧はこちら

今注目のIT用語の意味を事典でチェック!

一覧はこちら

会員登録(無料)

ページの先頭に戻る