鶯や雀や鳩くらいはなんとか把握できそうな鳥の鳴き声。しかし地球上には約9,000種の鳥類が生息しているという。この鳥の鳴き声の分類にも機械学習が役立っているそうだ。オープンソースの機械学習モデルTensorFlowを提供するGoogleは、私たちはただ誰にでも使ってもらいたいと機械学習の事例を公式ブログで紹介している。

3年にわたりニュージーランドの鳥の聖地"ZEALANDIA"で数千の鳴き声を録音したのはビクトリア大学ウェリントン(Victoria University of Wellington)のVictor Anton氏。ニュージーランドインコ(マリオ語/Kākāriki)、スティッチバード(マリオ語/Hihi)、サドルバック(マリオ語/tieke)など絶滅も危惧される希少な鳥の生態を把握するためにチームと行った録音は、50カ所にセットを配置している。

  • ニュージーランドインコ(マリオ語/Kākāriki)、スティッチバード(マリオ語/Hihi)、サドルバック(マリオ語/tieke)などニュージーランドの希少な野鳥(Google公式ブログより)|

    ニュージーランドインコ(マリオ語/Kākāriki)、スティッチバード(マリオ語/Hihi)、サドルバック(マリオ語/tieke)などニュージーランドの希少な野鳥(Google公式ブログより)

  • 野鳥の聖地50カ所に設置された録音セット

    野鳥の聖地50カ所に設置された録音セット(Google公式ブログより)

想像以上に多くの鳴き声を収録する成果を収める嬉しい成果だが、課題が浮上する。"私たちはデータの中にとても貴重な鳴き声があることは把握していたが、私たちにこれをマンパワーで解決する術は持ち合わせていなかった"とVictor氏。この課題解決に機械学習の力を取り入れることになる。

ノイズが混ざった精度の低い特定のラベルデータであっても学習させることで精度を高め、大量の音声データから特定の希少種の鳴き声を確定させていく様子を公式ブログでは紹介。オーディオデータを分単位の長さに分け、スペクトログラム(Spectrogram)に反映させる。さらに秒以下のチャンクに分けてニューラルネットワークで機械学習し、この結果を分単位でのロングセグメントで追いかけるとこの希少な鳥の動きが把握できたのだという。

  • 3種の分析結果(Google公式ブログより)|

    3種の分析結果(Google公式ブログより)

大きな成果を上げた今回の事例、まだ始まったばかりの試みだが採取した録音データにはまだ解析していない部分も多く、また他の地球上の希少な生き物の状況確認にも役立つことになっていくとしている。学術や研究はもちろん、データを収集することで課題を解決できる可能性を秘める機械学習の魅力。意外に身近なところにも発見が眠っているのかも知れない。