結晶構造解析の難しさ

物質・材料の機能と性質の多くは、結晶構造(原子の並び方)によって決定されます。例として、ダイヤモンドと黒鉛はいずれも炭素原子からなる物質ですが、結晶構造が異なるため、見た目や硬さ、電気伝導性など、その物性は大きく異なっています。このように結晶構造を知ることは物質・材料研究の出発点であり、結晶構造の詳細な解析はさまざまな物理現象の理解や高機能な材料の開発につながります。

結晶構造を知るためにはいくつかの手段がありますが、最も普及しているのはX線を利用した手法です。物質にX線を照射すると、X線は物質を構成する原子の周りにある電子により散乱されます。原子や分子が規則的に並んだ物質(結晶)の場合、散乱されたX線は原子や分子の並び方(結晶構造)に応じて回折パターンと呼ばれる独特な強度分布を示します。この現象を利用して結晶構造を調べることができます。

X線回折(XRD)は、ひとつの結晶(単結晶)を対象とする場合と結晶を砕いた粉末試料を対象とする場合に大別されます。後者は粉末X線回折(PXRD)と呼ばれ、試料の準備や測定が簡便なことから物質・材料研究において広く用いられる一般的な測定手法となっています。しかし、測定したPXRDパターンは次の図に示すように1次元の複雑なパターンであり、これを人の目で見ても結晶構造(3次元の原子配列)情報を直接読み取ることは困難です。したがってPXRDパターンから結晶構造の情報を得るためには、何らかのデータ解析が必要です。

PXRDパターンの例

多くの場合、PXRDパターンのデータ解析は、あらかじめ仮定した結晶構造や測定装置の特性を考慮した物理モデルから計算されるPXRDパターンが、実際に測定されたPXRDパターンに一致するようにモデルのパラメータの更新を繰り返すという「リートベルト精密化法」でなされます。この方法によるデータ解析は結晶構造の精密な情報を得ることができる一方で、本来の目的である結晶構造情報以外の多数のパラメータを調整しつつ試行錯誤を繰り返す必要があり、解析作業の人的・時間的コストの高さが問題となります。

PXRD測定の効率化が進んだ実験施設では、1日に数千件以上の自動測定が可能となっている一方、パラメータの手動調整を伴う解析は熟練者でも1件に1日を要することから、データ解析の自動化や効率化が強く望まれていました。

機械学習でパラメータ調整の課題を解決する

我々は、以前より機械学習や数理最適化の技術を材料のデータ解析に応用する研究に取り組んできました。そのようななかで、我々がリートベルト精密化において抱えている問題と類似の課題が、機械学習コミュニティにおいてすでに解決されていることに気付きました。

一般に、機械学習モデルはハイパーパラメータと呼ばれるいくつかのパラメータを持ちます。ハイパーパラメータの設定はモデルの性能を大きく左右するため、この調整作業は、相応の知識と経験が必要かつ非常に時間のかかるものであり、思ったような性能が出せない、先行研究の結果が再現できないといった問題を引き起こし、長年多くの研究者を悩ませていました。

しかし、近年機械学習コミュニティにおいて、この調整作業をブラックボックス最適化手法の一種であるベイズ最適化によって実現する方法が提案され、短時間で専門家を上回るモデル性能を達成することができるようになりました。

この成功例に着目した我々は、同様にしてブラックボックス最適化を用いることで、リートベルト精密化におけるパラメータ調整の課題を解決することができるのではないかと考え、本研究に着手し始めました。

ブラックボックス最適化によるリートベルト精密化の自動化

数理最適化問題のうち、目的関数や制約条件が解析的に与えられないようなものを、 ブラックボックス最適化問題と呼びます。ブラックボックス最適化は、先に述べた機械学習モデルのハイパーパラメータの自動調整など、複雑なプログラムやシステムを対象とした実問題において実績があります。ブラックボックス最適化問題を解くためのアルゴリズムをブラックボックス最適化手法と呼び、代表的なものにベイズ最適化などがあります。本研究で我々は、ブラックボックス最適化をリートベルト精密化のパラメータ調整に適用する、次のような手法を提案しました。

リートベルト精密化のパラメータ調整をブラックボックス最適化によって実現するためには、適切に最適化の対象とする変数および目的関数を定める、定式化が必要となります。我々は、リートベルト精密化における物理モデル設定を、リートベルト精密化結果の良し悪しの指標として用いられるR因子(Rwp)を最小化する目的関数として定めました。

R因子は物理モデルからシミュレーションされたPXRDパターンと、実際に測定されたPXRDパターンの相対誤差を表します。一般に、この値が小さいほど物理モデルが実験結果をよく説明していることを表します(ただし、R因子が小さいモデルが常に物理的に妥当であるとは限らないため、専門家による検証は別途必要です)。

我々の手法を図で説明すると次のようになります。ブラックボックス最適化手法により、物理モデル設定(バックグラウンド関数の種類、精密化する変数のスコープなど)を生成し、それをもとにリートベルト精密化を実行します。このとき、物理モデルにおける初期パラメータ(初期結晶構造、装置パラメータなど)は最適化の対象外であり、あらかじめ設定を与えておきます。リートベルト精密化の結果として、与えた物理モデル設定に対応するR因子が計算されます。

ブラックボックス最適化手法は、今回のリートベルト精密化の実行結果情報を活用して、より小さいR因子を達成できる見込みのある新たな物理モデル設定候補を生成する、という手順を繰り返し実行することで最適化が進んでいきます。

ブラックボックス最適化を用いた自動リートベルト精密化のワークフロー概要

解析を高速化し、結晶構造の新たな候補を見つけ出す

こうしてリートベルト精密化のパラメータを自動で設定できるようになり、実験を始めたところ、驚くべき結果が得られました。

まず物理モデルのあてはまりの良さという点では、熟練者が試行錯誤して得た手動設定を超える性能が得られることがわかりました。次の図では最適化の進行に伴うR因子の変化をプロットしています。繰り返し実験を行い、平均しておおよそ100回の試行で熟練者相当の結果を得られることがわかりました。

提案手法による設定探索の履歴の例(Y2O3

またPXRDの図を見ると、R因子が小さいだけでなく良好なあてはまりを得られたことを確認できます。熟練者相当の結果を得るために要する計算時間は一般的なPCを用いて30分~1時間程度であるため、これまで熟練者が1日がかりで調整していたことを考えると大幅な高速化がなされたことになります。

提案手法を用いた解析結果の例(Y2O3のリートベルト精密化結果)

さらに、我々の手法で自動で得られた結果を解析したところ、これまでの熟練者の戦略では発見できなかった結晶構造の候補を見つけ出せることもわかりました。次の図は、リートベルト精密化の結果として出力された結晶構造100種類と熟練者による解析で得られた結晶構造について、その類似性を可視化したもので、各点がひとつの結晶構造に対応しています。この図を見ると、右下には多くの結晶構造が集まっており、熟練者による結果とほぼ同じ結果が自動で得られていることがわかります。

ここで注目していただきたいのは、左上にぽつんと位置している結晶構造です。これは我々の手法で自動で見つかった結晶構造の候補のひとつで、初期値として与えた構造や他の候補とは原子位置が大きく異なる結晶構造です。構造が大きく異なっているにも関わらず、R因子では熟練者による解析結果よりも良好な値を得ており、実験データを十分良く説明する構造と考えられます。

多次元尺度構成法による低次元空間での結晶構造の可視化

熟練者による通常のリートベルト精密化ではこのようなまったく異なる構造の候補は検討されないため、本研究においてこのような大きく異なる結晶構造が見つかったことは、人間の先入観を除いた自動解析によって、これまでは見逃されてきた新たな発見を導く可能性を示しており、重要な進歩と考えられます。

Materials Informaticsの発展に向けて

本研究で提案するブラックボックス最適化を用いた自動データ解析手法は、物理モデルを計測データにフィッティングする操作が含まれるさまざまなデータ解析に容易に応用が可能です。このような状況は、材料計測に限らず一般のデータ解析において普遍的に生じていることから、本手法は幅広い分野におけるデータ解析への応用ができると期待しています。

また、今回我々は、材料科学と情報科学の両方の視点から問題を俯瞰することで、ブラックボックス最適化を用いたデータ解析手法を具体化できました。これは異なる視点で問題を捉え直すことで解決に至った好例と考えています。情報科学を材料科学に応用するマテリアルズ・インフォマティクス(Materials Informatics)の研究では、計算機とアルゴリズムを用いて解決可能にも関わらず、手つかずとなっている材料科学の問題が数多くあると感じています。

材料以外の分野からの研究者の参入や、情報科学を学ぶ材料科学者も増えており、今後もマテリアルズ・インフォマティクスの飛躍的な発展が続くと見込まれます。より多くの材料科学の問題を効率的に自動で解けるようになれば、研究は飛躍的に加速し、より困難な課題も解決できるようになります。そのような世界の実現を目指し、我々も引き続き研究に取り組んでいく所存です。

参考文献
Ozaki, Y., Suzuki, Y., Hawai, T., Saito, K., Onishi, M., and Ono, K. “Automated crystal structure analysis based on blackbox optimisation” npj Comput. Mater. 6, 75 (2020). https://doi.org/10.1038/s41524-020-0330-9

この記事を書いた人

尾崎 嘉彦, 鈴木 雄太
尾崎 嘉彦, 鈴木 雄太
尾崎 嘉彦(写真左)
産業技術総合研究所 人工知能研究センター / グリー株式会社
2017年筑波大学大学院システム情報工学研究科博士前期課程修了。同年グリー株式会社入社。2018年より産業技術総合研究所人工知能研究センター特定集中研究専門員(兼務)。ブラックボックス最適化、AutoMLの研究に従事。Webサイト:https://y0z.github.io/

鈴木 雄太(写真右)
総合研究大学院大学 高エネルギー加速器科学研究科 物質構造科学専攻
2019年3月東京理科大学 基礎工学研究科 材料工学専攻 修士課程修了。2019年4月より現所属、修士(工学)。機械学習を応用した物質計測技術の開発、材料計測データのデータマイニングなど、Materials Informaticsに関する研究に従事。JSPS DC1およびJST ACT-I研究者。Webサイト:https://resnant.github.io/