NECは4月18日、自動車走行中の雑音が多い環境下においても、音声による快適なカーナビ操作が可能な雑音除去技術を開発したと発表した。

機械により人の声(音声)を捉える音声認識の精度を高めるには、人の話し方や話題に対応する技術(適応技術)や、環境により変化するさまざまな雑音に対応する技術(耐雑音技術)が必要となる。これらの技術を組み合わせることで、より精度の高い音声認識が実現する。

同技術は耐雑音の領域にあたり、自動車内の環境に適用するもので、エアコンなど自動車内特有の雑音源の位置を考慮し、最適な場所にマイクを配置する。また、2段階での高精度な雑音除去処理に加え、独自の音声モデルを用いて音声認識に適した音声に調整することで、走行中など、雑音の多い環境下での音声による正確なカーナビ操作を可能にする。

具体的には、エアコンなど自動車内特有の雑音源の位置や車内に設置するマイクへの音の伝わり方を分析し、2つのマイクを前後に配置。前方から流れてくる雑音と話者の音声をより区別して拾いやすくし、効率的な雑音除去処理を実現している。また、2つのマイクで検知した信号(話者の声と雑音)に対し、2段階に分けた雑音除去処理を行う。第1段階で、2つのマイクに入る雑音の相関を利用して、時間とともに変化する雑音を正確に捉え、主要な雑音を的確に抽出・除去する。第2段階では、消し残した雑音を、2つのマイクに入る話者の声の相関を利用して除去する。こうした雑音の性質に応じた2段階の除去処理を行うことで、高精度な雑音処理を実現している。さらに、雑音除去を行ったことで、音に歪みが発生して認識が難しくなった音声に対して、独自の2つの音声モデルに基づいて、話者の声を強調する技術を開発。人が話す声の成分とその変化をモデル化し、音の歪みに応じて、2つのモデルを自動選択することで、音声認識に適した音に調整する。

今回の雑音除去技術の特徴