ロームは9月26日、スマートフォンやカーナビゲーションなどで用いられるマイク向けに、2つの無指向性マイクで鋭い指向性を形成すること(ビームフォーミング技術)で音声品質を向上させることができるデジタル信号処理LSI「BU8332KV-M」を開発したことを発表した。

これまでも2つのマイクを用いて指向性を形成する技術はあったが、従来は指向性を上げるためマイク間距離を長くする必要があったため、小型のポータブル機器への搭載には適していなかった。また、デジタル信号処理による遅延時間や音質の劣化も課題となっていた。

そうした課題に対し同社はDiMAGIC Corporationの指向性制御技術を適用することで、周囲のノイズを低減することに成功。ビームフォーミング技術を用いて指向性を形成し、指向軸を目的音の方向へ向けることで目的音以外の音を低減させたほか、指向軸方向に残った定常ノイズはノイズサプレッション機能により低減させることで、目的音を明瞭とすることにより、背面方向の減衰量を、従来のマイクと比較して30dB以上改善することに成功した。

マイク間の距離は10mmで実現可能であるため、小型機器への搭載も可能なほか、処理の最適化によりビームフォーミング機能使用時の処理遅延時間を10ms以下にすることに成功。これにより、ほかのアプリケーションへの影響を最小限に抑えることを可能とした。

さらに、指向性の形状・鋭さの切り替えができるため、用途に応じて最適な指向性を実現できるほか、音声を劣化させずに周囲のノイズを低減することが可能であり、これにより周囲ノイズが存在する環境下における音声認識率の向上が可能となった。同社の測定では、周囲ノイズレベル55dBSPLの環境下における音声認識精度は従来の5%から90%に向上したという。

なお同製品はすでに量産を開始しており、当面は月産8万個体制で生産を行っていく計画としている。

BU8332KV-Mと従来マイクの指向性特性比較のためのポーラパターン。円は中心からの方向を示しており、赤線は各方向のゲインを示している。また、0°方向を目的音方向としている

BU8332KV-Mを使用した時の音声認識精度。未使用時にはノイズレベルが55dBSPLで認識率が急激に低下するが、使用時にはノイズレベルが65dBSPLでも45%の認識率を実現した