有名人の声をクローンできるAT&T Labsの音声技術

  [2001/08/01]

米AT&T Labsは、同研究所初の商業製品「AT&T Natural Voices Text-to-Speach」を発表した。Natural Voicesは、人間が話しているように自然な発音を実現するテキスト読み上げシステムで、背後には実在の人物の声をコピーして利用できるというような、高度な音声技術が利用されている。

Natural Voicesは、TTS(Text to Speach:テキスト読み上げ)エンジン、音声ライブラリーで構成されている。電話でのカスタマー・サービス、ボイスポータル、ショッピングセンターのアナウンス・システムなどをターゲットとしている。また、自然な発音は非常に聞き取り易く、語学教育や目の不自由な人のためのサービス機関での利用なども検討されている。

Natural Voicesの自然な発音を可能にしているのは、AT&Tがスピーチ分野で所有している150以上の特許技術である。さらにマイクロプロセッサのスピード向上と価格下落のおかげで、自然で途切れることのないスムーズな読み上げが製品レベルで実現したそうだ。

Natural Voicesで、自然な読み上げ以上に話題となっているのが音声のコピーである。完璧にコピーするには、コピー対象者が10~40時間はスタジオにこもって、様々な発音パターンを録音し、その録音を元にデータベースを作成する必要がある。十分なデータが集まれば、まるで本人が話しているとしか思えないような読み上げが可能になるそうだ。AT&T Labs ResearchのLawrence Rabiner氏は「ハリー・キャリー(シカゴ・カブスの名物アナウンサー)のアナウンスをもう一度リグリー・フィールド(カブスの本拠地)に響かせられたら、すばらしいと思わないかい」とコメントしている。

音声コピー技術は、より聞きとりやすい声をNatural Voicesで利用するのが本来の目的である。しかし、誰かの声をコピーして利用することが可能であり、今後、声の権利という新しいライセンス問題を引き起こす可能性があるとRabiner氏は指摘している。

Natural Voiceのサイト(http://www.naturalvoices.att.com/)では、TTS技術の簡単デモを体験できる。

(Yoichi Yamashita)

AT&T Labs
http://www.att.com/technology/



IT製品 "比較/検討" 情報

転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

エプソン、幅45mmのウルトラコンパクトPC - 光学ドライブ搭載モデルも
[11:04 5/31] パソコン
「妊婦の歯周病が早産リスクを高める」 ‐ 子を持つ男女の7割は知らず
[11:02 5/31] ヘルスケア
日本HP、23.6型4K液晶を採用した一体型ワークステーション「HP Z1 G3」
[11:00 5/31] パソコン
経営者は「経済小説」がお好き? - 社員との意識比較調査発表
[11:00 5/31] マネー
【インタビュー】ティントリが注目するテクノロジーとは? - 米Tintri EVP Tony Chang氏に聞く
[11:00 5/31] 企業IT

求人情報