国立環境研究所(環境研)は8月25日、AIと音響シミュレーション技術を組み合わせ、多数のセミが加わる複雑な大合唱からでもその種類を自動識別する技術を開発したと発表した。

  • 今回開発された技術のイメージ

    今回開発された技術のイメージ。セミは多種の多数の個体が同時に複雑な大合唱をし、野外録音には鳥の鳴き声や自動車の走行音なども含まれる。今回の研究では、音響シミュレーションで生成した合唱データをAIの訓練に活用することで、複雑な音響環境下でもセミの鳴き声の自動識別を可能にした(出所:環境研Webサイト)

同成果は、環境研 生物多様性領域 生物多様性保全計画研究室の岡本遼太郎研究員、同・小熊宏之室長ら2名によるもの。詳細は、計算生態学と生態学的データサイエンスを扱う学術誌「Ecological Informatics」に掲載された。

音響シミュレーションソフトを活用して開発

近年、野生動物研究では、鳴き声を自動録音しAIで解析する「音による生物調査」が、長期間の生態系モニタリングを実現する効率的な手法として注目されている。

しかしこの手法は、セミやコオロギ、キリギリスなどの昆虫への適用が遅れていた。その主な原因は、セミの大合唱に代表されるように、複数種の鳴き声が重なり合う状況での種識別の困難さにある。正確な種判別AIの開発には、含まれる種の組み合わせや個体数の違いによって生じる無数のパターンを網羅した膨大な教師データが不可欠だ。しかし、これを野外で録音し、人が種類を特定する作業は多大な労力を要する。

そこで研究チームは今回、音の混交や減衰を考慮した物理音響シミュレーション技術を用い、多種多様なセミの合唱パターンを自動で大量生成し、それらを教師データとして活用することで、課題解決を図ったという。

今回の研究では、環境研のある茨城県つくば市で一般的な5種類のセミ(アブラゼミ、ミンミンゼミ、ニイニイゼミ、ツクツクボウシ、ヒグラシ)を対象に、(1)音源の収集、(2)合唱シミュレーション、(3)AI訓練と性能評価、という3ステップで鳴き声識別AIの開発が行われた。

まず音源の収集では、YouTube、セミ図鑑の音声資料、野外録音から、各セミが単独で鳴く「個体音源」が、1種あたり10音源程度収集された。さらに、野外でセミの鳴き声と共に録音される可能性のある他の昆虫や鳥の鳴き声、車の走行音なども収集。マイク特有のノイズ、風や雨といった環境音も、合唱シミュレーションに反映させるために録音された。

次に、音響シミュレーションソフトウェア「Pyroomacoustics」を用いて、コンピュータ上に仮想録音空間が構築された。ランダムに選ばれた背景音源と、多数の個体音源、その他の音源を仮想録音空間上のさまざまな距離に配置し、現実にあり得る20秒間のセミの合唱が3000パターン生成された。

  • 開発された合唱シミュレーションソフトの概要

    開発された合唱シミュレーションソフトの概要。仮想空間に多数のセミの鳴き声を配置することで、さまざまなパターンの合唱がシミュレーションされた。その結果得られた20秒間の合唱音源3000パターンが、AIの訓練に用いられた(出所:環境研Webサイト)

最後に、生成された3000パターンのデータを用い、多種の鳴き声を同時識別するAIの訓練が行われた。訓練には、特徴を自動抽出・分類する機械学習手法「畳み込みニューラルネットワーク」が用いられた。そして開発されたAIの識別精度は、つくば市内で録音されたセミの合唱データで評価された。また、今回の手法の有効性を確かめるため、1回の合唱シミュレーションに含める個体音源の最大数を変える実験も行われた。

1回のシミュレーションに含めるセミの個体音源数を最大20に設定して訓練した際に、識別精度が最も高くなった。AIの分類性能を示す評価指標「F1値」で、平均83%という実用性十分な精度が達成された。これは、各シミュレーションに1つの個体音源のみを用いた場合と比べ、22ポイントの大幅な性能向上にあたる。

  • 合唱シミュレーションに含めた個体音源数と識別精度の関係

    合唱シミュレーションに含めた個体音源数と識別精度の関係。20秒間のシミュレーションに含める個体音源数の最大値を変化させ、AIの識別精度への影響が調べられた。1回あたり1音源のみの場合、AIの識別精度はF1値で60%を下回ったが、1回あたり最大20の個体音源を用いた場合のF1値は83%と最も高い精度となった(出所:環境研Webサイト)

注目すべきは、種あたりわずか10録音程度の少ない教師データで、この高い精度が実現された点だ。野外で録音されたデータの約40%で2種以上のセミが同時に鳴いており、最大4種が同時合唱する複雑な状況も確認された。このような条件下でも高い識別性能を持つことは、今回の手法が生物調査ツールとして十分な実用性を示すものとした。

応用例として、環境研構内で2024年7月~9月に連続録音された音源に対し、開発されたAIが適用された。セミの鳴き声の時系列変化が調査された結果、明確な季節変化と一日の中での時間的パターンがあることが判明した。今後は、気候変動によるセミの活動時期の変化を継続的に観測することや、セミの詳細な行動研究への応用が期待されるとしている。

  • 環境研構内での録音データに対する適用例

    環境研構内での録音データに対する適用例。円グラフは、中心からの距離が日付、角度が時刻、色の濃さは各セミ種の鳴き声が含まれる割合(1時間ごとに集計)が示されている(出所:環境研Webサイト)

今回の手法は、他の大合唱する生物の鳴き声検出にも広く応用可能だ。これにより、これまでAIによる自動識別が難しかった生物に対しても高精度な自動観測が実現し、音による効率的・持続的な生物活動の観測が可能となる。その結果、気候変動などによる生態系への影響評価に、大きく貢献できる可能性があるとした。

また、大合唱環境下でも頑健な今回の手法による大規模観測データは、他種の鳴き声や道路騒音などが特定の生物の鳴き声に干渉する「音響マスキング」効果を回避する生物のコミュニケーション戦略の解明や、人間活動が音環境を通じて生物に与える影響の定量的評価にも貢献も期待されるとしている。