ALSOKは11月26日、人の話す声から誰が話しているかを認識して本人確認を行う、バイオメトリクス認証の1つである話者認識技術において、独自のアルゴリズムを開発したと発表した。

本人確認の手段として、暗証番号やIDカードなどが広く利用されている。これらは、暗証番号を忘れたり、IDカードを持っていないといった場合に、サービスを利用できないという不便さがある。これに対し、バイオメトリクス認証では、指紋や顔、静脈、虹彩などの身体的な特徴によって個人を特定するため、暗証番号を覚える、IDカードを持ち歩くといったことが必要なくなる。利便性が高く、高精度な本人確認の手段として期待されているが、課題もある。

今回、話者認識技術において、個人差に対応して、安定した認識精度を得る独自のアルゴリズムを開発した。これにより、子供から高齢者まで、年齢によらず高い認識精度を実現している。また、従来技術では、大量の音声を用いて登録者を学習していたため、登録作業に多くの手間と時間を要していたが、同技術では少ない音声データで登録が完了する。さらに、直近の話した声でデータベースを自動的に更新し、常に最新の声質に対応する独自技術を開発した。そのため、年齢とともに変化する声質にも対応できるという。

ALSOKでは、今後2年以内の実用化を目指し、研究開発を進めていくとコメントしている。

話者認識技術の応用例