東京工業大学(東工大)と東北大学の両者は3月29日、高精度と高速を両立させた最新の第一原理計算により生成した大規模な理論計算データおよび機械学習を用いて、無機材料表面の基本的な電子構造を網羅的に予測することに成功したと共同で発表した。
同成果は、東工大 科学技術創成研究院 フロンティア材料研究所の清原慎 JSPS 特別研究員(現・東北大 助教)、同・大場史康教授、産業技術総合研究所 エネルギー・環境領域 電池技術研究部門の日沼洋陽主任研究員らの共同研究チームによるもの。詳細は、米国化学会が刊行する機関学術誌「Journal of the American Chemical Society」に掲載された。
固体の表面とバルク(内部)とでは、原子の配列や電子の状態の違いにより、大きく異なる性質が発現する。それを調べるには、半導体や絶縁体の電子状態に関する基本的な物理量である「イオン化ポテンシャル」(IP)と「電子親和力」(EA)などを調べることがとても重要だが、固体表面には不純物が吸着しやすいため、実験により清浄な表面を用意して精度良く実測することは容易ではないことが課題だった。
それに対して第一原理計算は、現実には難しい理想的な表面を扱えることから、IP・EAを確認するための強力なツールとされる。とはいえ、高精度に値を求めるには膨大な計算量が必要とされることが課題。さらに、1つの物質においても表面はさまざまな面方位や原子配列を持ち、このような表面の多様性を考慮して網羅的に理論計算を実行することは、計算量が膨大になりすぎて現実的ではないという。
そこで研究チームは今回、こうした背景を受け、さまざまな固体表面を対象に、IP・EAを高精度かつ高速に予測する手法の開発に取り組むことにしたとする。
今回の研究では、高精度と高速を両立させた最新の第一原理計算手法が用いられ、まず、約2200種類の二元系酸化物無極性表面のデータベースを構成。IP・EAの実験値が報告されている酸化物表面を対象に、理論計算値と実験値(文献値)の比較が行われたところ、よく一致していることが確認された。これほどの高精度かつ大規模な表面特性の第一原理計算データベースの構築は他に類を見ないという。
次に、上述の二元系酸化物表面データベースを用いて、構造緩和前の表面原子配列から構造緩和後のIP・EAを予測するニューラルネットワーク(NN)を構築。原子配列の記述子として、NNに接続することで構成元素の数に対してスケーラブルになるように「SOAP」(Smooth Overlap Atomic Positions)を拡張した「L-SOAP」(Learnable SOAP)が開発され、原子配列のベクトル化が行われた。第一原理計算値とNNによる予測値が比較された際、訓練データ・テストデータの多くの点が対角線に近い位置にあり、IP・EAの第一原理計算値を高精度に予測可能なことが確認されたという。さらに、今回の手法はアテンション層が導入されているため、どの原子がIP・EAに大きな影響を与えるのかを推定することも可能となったとした。
さらに、三元系酸化物表面への展開が行われた。同酸化物は多くの場合、二元系酸化物より複雑な結晶構造を持つことから、その表面について大規模な理論計算データを生成することは困難だという。そのため、今回の研究では約700種類の三元系酸化物無極性表面の理論計算データを用意し、二元系酸化物表面について構築したNNをベースとして転移学習が行われた。
結果、訓練データの割合が増えるにつれて誤差が小さくなり決定係数が1に近づいていること、つまり、予測精度が向上していくことが確認された。今後、三元系酸化物表面の理論計算データが増えることで、さらなる精度改善が期待できるという。また、通常のSOAPに比べ、L-SOAPを用いて転移学習を行う方がはるかに予測精度が高いことも判明。今回開発されたL-SOAPは、転移学習に向いているといえるとした。
今回の研究は、近年注目されているマテリアルズインフォマティクス的アプローチにより、この状況を打開するものであり、今後の材料探索やデバイス設計を加速することが期待できるという。
研究チームは今後、今回の研究において開発された手法をバンドアライメントの観点での酸化物材料のスクリーニングに応用していくと同時に、硫化物・窒化物など、ほかの物質系の表面特性の予測へと展開してくいくとした。さらに、今回の手法の適用範囲は表面に限られないため、表面以外の特性の予測にも応用していくとしている。