ソシオネクストと東北大学は10月12日、自律制御を行う装置に必須の技術である自己位置推定と環境地図作製を行うためのSLAMに必要な処理時間を従来技術の約1/60にまで削減できる新しい手法を開発したと発表した。
同成果は、ソシオネクストの田中哲也氏、同・笹川幸宏氏、東北大大学院 情報科学研究科 システム情報科学専攻の岡谷貴之教授らの共同研究チームによるもの。詳細は、10月11日から17日までオンラインで開催中のコンピュータビジョンに関する会議である「ICCV 2021」にて発表される。
SLAMは、周囲の3次元情報を取得するセンシングの違いにより、LiDARを用いる方法とカメラ映像を用いるVisual SLAMに大別される。このうち、Visual SLAMはカメラ自体が比較的安価であること、自己位置推定に加えて画像認識による制御との組み合わせにより、さまざまなアプリケーションの拡大が期待できることから注目を集めている。
また、ディープラーニングの進展もあり、Visual SLAMの進化にもその活用が期待されているが、これまで提案されてきた手法には、特徴点やカメラ姿勢に基づいて、ランドマークの未知の3次元情報を最適化する「バンドル調整」に膨大な計算処理時間が必要とされ、エッジ向けSoCでの実用的な処理が難しいとされていた。
そこで研究チームは今回、その課題を解決する方法として、グラフニューラルネットワークの一種である「Graph Network」(GN)を用いた推論による近似計算手法の提案を行うことにしたという。
同手法は、GNブロックによるキーフレームとランドマーク情報入力からの更新情報の推論、および多段のGN構造による最終的な値への収束から構成されており、従来のLevenberg-Marquardt法を用いた一般的なバンドル調整に対し、計算量を抑えた推論処理が可能になるという。
実際に、この推論手法を用いてVisual SLAMのバンドル調整を実装し、現在広く使われている「g2o」との比較を実施。PCによるシミュレーションで処理時間を計測した結果、今回開発された手法を用いることでg2o比で1/60まで削減できることが確認されたという。
なお、ソシオネクストは、今回の研究成果を踏まえ、Visual SLAM技術を自社のSoCソリューション向けの要素技術として確立し、産業機器やモビリティなど、画像認識を必要とする分野で顧客システムの性能向上に向け提案していくとしているほか、新しい推論手法による処理効率の向上について、画像認識以外の新しい顧客アプリケーションへの応用も検討していくとしている。