ソフトバンクは、同社が開発した音声強調技術が、信号処理に関する国際会議「ICASSP 2026」併設の国際コンペで第1位を獲得したと2月19日に発表。慶應義塾大学の高道慎之介准教授をアドバイザーとする共同研究の成果。音声強調技術の発展は、音声AIの学習データの品質・精度向上や、コールセンターなどの通話音声改善による負担軽減などにつながるとしている。
ソフトバンクが1位を獲得したのは、「ICASSP 2026」(2026 IEEE International Conference on Acoustics, Speech, and Signal Processing)に併設された、音声強調に関する国際コンペティション「ICASSP 2026 URGENT Challenge」のTrack 1(Universal Speech Enhancement)。同成果をまとめた論文は、スペインで開催されるICASSP 2026の「SP Grand Challenges」(会期:現地時間5月4〜8日)で発表される予定だ。
このコンペティションは、世界各国の企業や大学などが参加し、さまざまな音声劣化条件に対応できる音声強調技術の性能を競い合うというもの。音声や信号処理分野のトップカンファレンスであるICASSPに併設され、各分野における重要課題に取り組むプログラムとして位置付けられている。
音声処理技術は、ディープラーニングの発展により大きく進展してきたが、一方でノイズや残響など、実環境で収録された多様な劣化音声に対し、安定して高品質な音声を生成することは依然として課題となっていた。ソフトバンクでは、複数の音声強調モデルを組み合わせることで、さまざまな劣化条件に対応可能な音声強調技術の研究開発を進めている。
音声強調技術の発展で、さまざまな環境で収録された音声を高品質に復元できるようになると、音声AI(人工知能)の学習データの品質・精度向上につながる。また、コールセンターなどにおいて通話音声の音質を改善することで、オペレーターの負担軽減や対応品質の向上、業務効率化に寄与することも期待される。
