NECは25日、「能動的メディア処理技術」の研究開発に着手したと発表した。「多数の音声や映像が混在する状態でも注目した情報をより的確に認識できる感覚」の実現を目指すもので、遠隔コミュニケーションなどに利用できるという。30日から開催される「CEATEC JAPAN」にて、試作システムを展示する予定。
大勢の人が会話をしているような中でも、注目した人物の声は離れていても聴き取ることができる。これを「カクテルパーティ効果」と呼ぶが、テレビ会議のように、平面的な映像・音声になってしまうと、聞き分けることが難しくなる。今回発表された技術を使えば、このカクテルパーティ効果をメディア処理で実現できるようになるということで、試作システムを用いたデモの様子が披露された。
今回実現した技術は、(1)複数の人物が同時に発話している音声信号から、信号の独立性を分析することにより、それぞれの人物の音声を分離する技術、(2)発話している映像から人物の顔領域を検出し、発話位置を推定することで、分離された音声信号と人物を対応付ける技術、(3)注目したい人物を選択することで、その人物の音声を自分の前後左右の自由な位置に配置する技術、の3つ。
今後研究を続け、同社は2012年の実用化を目指すという。応用としては、快適な遠隔コミュニケーションや議事録システムといったビジネス向けのほか、ホームビデオの編集支援といった用途も考えられるそうだ。
| エンタープライズ向けCMS「eZ Publish 4.7」が公開 [07:30 5/28] |
| 理研、脳・脊髄形成に必要な神経板湾曲の仕組みを解明 [20:16 5/25] |
| 京大、「慢性閉塞性肺疾患」患者の労作時呼吸困難は鍼治療が有効と実証 [20:08 5/25] |
| 120Hz SHVカメラ用イメージセンサーを使った撮像装置 - SHVフルスペック化へ [18:10 5/25] |
| 京大、視覚による物体認知は前頭前野からのトップダウン信号が重要と確認 [17:45 5/25] |
|
東京駅丸の内駅舎が完成間近! ドーム内部・ギャラリー・ホテル客室を公開 [08:30 5/28] ライフ |
|
[スノーホワイト]“戦う白雪姫”の吹き替えは坂本真綾 浪川大輔、大塚明夫も [08:00 5/28] エンタメ |
|
【コラム】マネーのトリビア 第21回 決算ニュースに出てくる、粗利益、営業利益、経常利益、最終利益、どう違う? [08:00 5/28] ライフ |
|
【連載】発音も聞けちゃう、知って得するidiom情報 第15回 hit the books [08:00 5/28] ライフ |
|
マイナビクリエイター、スマートフォンゲームアプリ開発セミナーを6/23開催 [08:00 5/28] クリエイティブ |
4つの診断で、自分の適性を見つめなおそう!
働くこと・挑戦し続けることへの思いを綴ったインタビュー
あなたにピッタリのアドバイスを読むことができます。
転職に必要な情報が収集できます
企業からアプローチのメッセージが届きます。