カナダのLyrebirdというAI (人工知能)スタートアップが世界初というボイスイミテーション・アルゴリズムを発表した。同社によると、人の声を正確かつ自然に模倣でき、また話し声を記録したわずか1分程度の録音からでもスピーカーの声を分析して、そのデータから模倣した声で感情も加えてテキストを読み上げさせられる。同技術を元に、誰かの声のコピーまたは全く新しい声をデザインしてスピーチを生成するスピーチ合成ソリューションを企業や開発者に提供する計画だ。

Lyrebirdは、モントリオール大学のMILA研究所で開発されたディープラーニングモデルを土台にしている。個々の話し声の情報をユニークなキーに要約し、そのキーから模倣した音声を生成するとしているが、公開されている情報は少ない。技術サンプルとしてLyrebirdのWebサイトのデモページで、ドナルド・トランプ氏、バラク・オバマ氏、ヒラリー・クリントン氏がLyrebirdについて議論する同社作成のオーディオを公開している。不自然に聞こえる部分が少なくないが、予備知識なく聞いた人は3人の会話と思ってしまいそうだ。Lyrebirdは技術の用途として、デジタルパーソナルアシスタント、オーディオブック、発声が困難な人を助けるスピーチアシスタント、ゲームや映像コンテンツのボイスオーバーや音声などを挙げている。