北大が砂糖と塩の混合比を画像から予測するシステムを開発 - 熟練者の眼を再現

北海道大学(北大)は8月25日、熟練研究者の経験と勘をも超えうる高い精度を持つ、機械学習により固体混合物の画像から混合比率を予測するシステムを開発したことを発表した。

今回開発された、画像を用いた機械学習システムのイメージ。(出所:北大プレスリリースPDF)

同成果は、北大創成研究機構化学反応創成研究拠点の猪熊泰英教授、同・瀧川一学特任教授、同・井手雄紀特任助教らの研究チームによるもの。詳細は、アメリカ科学学会が刊行する産業とエンジニアリングに関する化学の全般を扱う学術誌「Industrial & Engineering Chemistry Research」に掲載された。

高性能な分析装置が数多く開発されている現在でも、研究における重要な発見は、研究者の目視観察から始まることは決して少なくない。そのような観察眼は熟練の研究者ほど鋭いものを有するわけだが、それをデータ化して共有することは容易ではない。経験の少ない研究者に、熟練研究者と同等の観察眼と勘を与えることは現代の技術でも難しく、今でも長い時間をかけて成功と失敗の経験を積まなければ得られないのだという。

そうした中で研究チームは今回、継承が困難とされる、熟練の研究者たちが視覚的な情報を基に長い時間をかけて培ってきた経験と勘を、機械学習によって再現することに挑戦。そして人間の観察力を超える精度と再現性で、画像から化合物の成分比率を予測することに成功したとする。

今回の研究では、熟練研究者が時として“混合物から目的物の含まれる割合を瞬時に予測する”という観察眼が着目され、シンプルな機械学習の課題が設定された。その題材は、最も身近な化合物であり、見た目の違いがほぼ無いためにとても混同しやすい砂糖と塩とし、その混合比予測が行われた。

今回の研究で使用された砂糖と塩の混合化合物画像。(出所:北大プレスリリースPDF)

まずヒトが学習する時と同様に、さまざまな比率で混合した砂糖と塩の画像を300枚撮影し、それぞれの成分比率とセットにすることで機械学習の教師データを作成。そのデータを基に畳み込みニューラルネットワークを用いて機械学習モデルを作成し、テスト用の画像100枚を用いて混合比率予測の精度の評価を行ったとのこと。すると、実際の混合比と機械学習による予測値の平均誤差が約4％という高い精度が得られたといい、研究チームによるとこれは熟練した研究者の観察眼をはるかに上回る予測精度だとする。

今回の研究で使用された画像を用いた機械学習システムの概要。(出所:北大プレスリリースPDF)

また、この機械学習による予測システムは、最先端の研究にも十分活用できることもわかったという。専門的な装置を使っても判別が難しいとされる結晶多形の混合比や鏡像異性体比までも、画像1枚から誤差10%未満の精度で予測できることが確認されたのである。教師データとして、分析する固体化合物ごとに300枚程度の画像を必要とはするものの、機械学習モデルを一度構築してしまえば、100枚の画像であっても2分程度で一気に比率を予測することが可能だとしている。

結晶多形の異なるグリシン及び鏡像異性体の酒石酸の混合比率予測。(出所:北大プレスリリースPDF)

また、予測対象を化学反応の原料と生成物に置き換えることで、固体反応の収率をモニターするシステムにも応用することもできたという。さらに、この予測システムに用いる画像はスマートフォンのような携帯端末に付属しているカメラ画像でも適用することができたとのことだ。

加熱による固相反応における画像を用いた機械学習システムを用いた反応収率予測の結果。(出所:北大プレスリリースPDF)

なお、今回開発された予測システムのソースコードは一般公開中で、Googleが提供するGoogle Colaboratoryからでも利用することが可能となっている。

今回の機械学習システムは、化学プラントでの反応モニタリングやロボット合成における分析手段など、迅速に多くのデータを絶え間なく分析する必要があるシーンでの応用が期待されるとする。また、初心者が熟練研究者の経験と勘を素早く修得するための補助的な役割も担えるとしたうえで、さらに技術が進めば、目の不自由な人が研究を行う際の目視観察ツールとして活躍する可能性もあるとしている。

そして研究チームは、この技術は決して研究者の仕事を奪うものではないとしており、これまで経験と勘の修得のために膨大な時間を費やしてきた研究の一部を迅速化し、より良い研究成果を出すための一助となることが期待されると説明している。