日立製作所は11月5日、周囲の雑音に影響されず音に基づいて高精度に状況を認識することができるAI技術を開発したと発表した。

同技術では、周囲環境から発生するさまざまな音(以下、環境音)や周囲の物体や人から跳ね返ってくる音(以下、反響音)などの雑音が含まれる音を、音源の方向や音色の違いなどの複数の観点に基づいて分解し、分解された音をもとに状況認識を行う。これにより、設備の稼働状態や人の活動状態を高精度に認識することができるという。

工場では現在、センサーを使わない音を利用した設備点検において熟練者が音を聴いて経験に基づき設備の稼働状態を診断する方法が一般的だったが、熟練者不足などにより、自動診断サービスのニーズが高まっているという。

しかし、工場内など、さまざまな設備に囲まれた環境では、環境音や反響音など多様な種類の雑音が混在しているため、音に基づく正確な状況認識が難しく、設備の稼働状態を高精度に把握することが困難だった。

そこで、日立はさまざまな観点で音を分解することで、高精度に状況を認識することができるAI技術を開発した。

同技術では、まず、複数のマイクロホンで音を録音し、マイクロホン間での音が到達する時間差から推定される音源の方向や、音色の違いから推測される反響音かどうかなどの複数の観点に基づいて、雑音が混ざった音を分解する。

さらに、複数のディープニューラルネットワーク(DNN)*1に分解した音をそれぞれ入力し、設備や人などが置かれている状況と一致する可能性(確率)をそれぞれ計算します。最後にその計算結果の多数決により、総合的な状況認識結果を出力する。

  • さまざまな観点での音の分解と複数のDNNを用いた総合判断による状況認識のプロセス

同技術は、音に基づいて設備の状態を自動診断するサービスや人の活動状態を自動認識する見守りサービスなどへの応用が期待されるという。日立は、機能向上などの開発を進め、本技術の実用化を目指す。