西日本旅客鉄道(JR西日本)は8月20日、生成AI「VLM」を活用した画像解析ソリューションを開発していると発表した。
JR 西日本グループは、「長期ビジョン 2032・中期経営計画 2025」の柱の一つである「アウトバウンド型のオープンイノベーション」の一環として、データソリューションを内製で開発し、鉄道分野だけでなく製造業や大規模施設など幅広い分野での活用を進めている。
画像解析AI「mitococa」
JR西日本は「アウトバウンド型オープンイノベーション」の取り組みにおいて、鉄道現場で培ってきたノウハウや技術を活用し、画像解析 AI「mitococa(ミトコカ)」シリーズを内製開発してきた。
同シリーズは、駅構内や作業現場のカメラ映像から不安全行動や異常を検知するが、未学習の対象を検出できず、シーンや状況を踏まえた判断が難しいと いう課題が徐々に見えてきたという。
生成AI「VLM」の特長を生かす
「mitococa」で解決できない課題に対処するため、同社は VLM(Vision-Language Model)に注目した。VLMは視覚情報と言語情報を統合的に処理できる生成AIモデルで、世界中の画像と説明文を大量に学習することで、視覚と言語の両方にまたがる意味や文脈を理解することが可能。
同社は、VLMを活用して現場での使いやすさと解析精度の高さを両立するソリューションを開発している。
例えば、映像の静止画をすべてVLMで推論すると処理対象が膨大になり、誤検出や負荷が増大する。そこで、VLM推論に必要な場面のみをあらかじめ抽出することで、低負荷かつ高度な解析を両立している。
ケースに応じて、この前処理段階で「mitococa」を活用することで、人や物体を高精度に検出し、VLM 推論の対象を的確に絞り込む。
また、現場業務に組み込みやすいよう、シンプルで直感的な操作画面となっている。
