1
はじめに
コニカミノルタでは4つのコア技術である「材料」、「画像」、「微細加工」、「光学」を活用し、革新的な製品やサービスを提供している。「材料」分野では、写真用材料を開発していた時代から分子シミュレーションを活用した技術開発に取り組んできた。それによって、シミュレーション専門家だけでなく、合成化学者自らが分子シミュレーションを実施する研究風土が定着している。分子シミュレーション、合成、解析が三位一体となることで、合成技術者、解析技術者との共創が進み、分子シミュレーションによる材料分野の成果も創出することができている (Fig. 1)。近年はマテリアルズ・インフォマティクス (MI) を材料開発プロセスに取り入れ、効率的かつ迅速な材料開発を進めており、分子シミュレーションとMIを融合させた取り組みも推進している1)。
本稿では、分子シミュレーションとMIを駆使・融合して取り組んだ以下の材料開発事例について紹介する。
- MI予測モデルと遺伝的アルゴリズムを用いた樹脂の添加剤探索
- MI予測モデルによるOLED材料探索
- 分子シミュレーションを用いた大規模計算による化合物記述子のデータベース化とそのMI活用
上記の事例は、材料開発にMIを取り入れて以降の実施例順となっている。なお、3.の事例については現在も継続してデータベースを拡充する取り組みを続けている。
各事例に共通するのは、探索範囲を既存の市販化合物・自社開発化合物とし、ドラッグ・リポジショニングの考え方を取り入れたMIによる材料探索を行っていることである。ドラッグ・リポジショニングとは、既存、または開発中止になった医薬品を別の治療に転用することである。安全性や薬物動態などのデータが既にあり、新規開発に比べて開発期間の短縮化・開発費用のコストを大幅に削減できることから、既に広く用いられ、成功を収めている。例えば、抗てんかん薬として販売されていた薬にパーキンソン病に対する効果があることが分かり2)、同一使用量でてんかん薬の140倍の価値で販売された。我々は分子シミュレーションとMIの技術を融合させることで、材料版のドラッグ・リポジショニングとなるマテリアルズ・リポジショニングを提案・検討し、有効性を示してきた。従来では探索し得なかった広大な化合物空間を探索可能になっただけでなく、既存化合物のこれまで知られていなかった可能性を材料開発・分子設計に活かすことができる。
本稿で示す事例の通り、我々は材料開発に分子シミュレーション、MI技術などの最新の技術を取り入れるだけでなく、既存技術や自社のコア技術と融合させることで化合物探索と材料設計の新たなパラダイムを常に模索し続けている。
2
材料開発・化合物探索事例
2.1 MI予測モデルと遺伝的アルゴリズムを用いた樹脂の添加剤探索
我々は、MIが物性予測精度・速度ともに従来の分子シミュレーションを凌駕する可能性を秘めていることに早期から着目していた。一方で、材料開発の現場ではMIに用いる初期データ量の少なさ、データを蓄積するスピードに課題があった。一般的に、機械学習では50以上、深層学習ともなると少なくとも1万以上ものデータが必要になると言われており、材料開発の現場における典型的な社内テーマでは圧倒的にデータ量が少ないのが現実である。本事例の目的は、MIを材料開発に適用する黎明期に少数の公知データから始め、材料探索をどれだけ加速できるかを検証することであった。
樹脂の性質を改質する際に、有機・無機の添加剤を加えることは一般的に行われている。加工性や安定性、機械的強度を向上させるなど、特定の性質を付与する目的の添加剤が多く知られている一方、マテリアルズ・リポジショニングによって、無数に存在する化合物を所望の性質を付与する添加剤として転用できる可能性は大いにある。本事例は、少数のデータからスタートし、短期間で既存化合物からマテリアルズ・リポジショニングによって有機添加剤を探索することで、MIの材料開発における有用性を実証することを目的とした我々の初期の取り組み例である。そこで、公知の文献3)からポリカーボネートフィルムに添加する反可塑剤34種の化合物に対する実験値を学習データとして用い、反可塑剤を入れることによるヤング率の変化ΔModulus (GPa) を目的変数とした。説明変数には化合物の分子構造から計算されるFingerprintを用いて予測モデルを作成した。樹脂のヤング率を有機添加剤で変化させる現象は非線形性が高いと考えられるため、予測モデルにはKernel-based Partial Least Squares Regression (KPKS)4-6) を用いた。Fig. 2に34種のうち8割を訓練データとした結果を示した。
続いて、得られた予測モデルを使った遺伝的アルゴリズム7-8)による新規構造生成を行った。遺伝的アルゴリズムでは、初期構造 (第0世代) からスタートし、単結合部位での結合切断、生成を繰り返し、部分構造を次世代に継承することで所望の性質を最適化する。元素や置換基レベルではランダムな突然変異 (同族元素への変化など) も発生し、何世代も経ることで最適化された性質を有した新規の構造を生成できる。各構造が継承されるか否かは、予測モデルによる予測値をもとにして判断される。遺伝的アルゴリズムによって生成される化合物は、しばしば合成不可能など、非現実的な化合物も含まれる。そのため、生成された構造のうち、何世代にも渡って継承されている部分構造に着目し、その部分構造を含む市販化合物を選定して実評価を行った。学習データを拡充する際には、予測モデルを作成したFingerprintによって文献化合物、市販化合物、社内化合物を分類し、未評価の構造群の実測評価値を増やすことで学習データの構造多様性を担保した。これらの評価データでアップデートした予測モデルを用いて再度同様のサイクル (MI予測モデル構築→化合物選定→評価/計算→予測モデルの更新を以後MIサイクルとする) を回すことで、これまで反可塑剤として機能することが知られていない化合物を短期間で発見することができた。本事例では、我々の典型的な添加剤選定の10~20倍程度の高速化を果たしたことになる。
本事例では、34種の少数の公知データからスタートしたMI材料開発でも短期間で、文献構造にはない構造を発見することができた。少数データでも実験とMIサイクルを回すことで開発スピードの高速化とともに、別用途の化合物の転用という効率化も実現できるという可能性を示唆する事例となった。
2.2 MI予測モデルによるOLED材料探索
本事例では、OLED素子の電極仕事関数を制御するための添加剤探索を行った。陰極の仕事関数と電子輸送層のLUMOとのエネルギー障壁 (ΔE) が大きいことが、界面電子注入性の低下を引き起こし、OLED素子の性能低下要因であると仮定した (Fig. 3)。そこで、電極の仕事関数の制御により界面電子注入性を制御することで、OLED素子の性能低下を抑制できると仮説をおいた。これまで金属表面に自己組織化単分子膜を形成することで、金属の仕事関数を変化させられる9)ことが知られている。そこで、マテリアルズ・リポジショニングによって電極―有機層界面に添加することで、電極仕事関数を低下させる低分子表面修飾剤を探索することを本事例の目的とした。
社内評価と文献データをあわせた124データを学習データとして用い、金属の仕事関数を目的変数とし、説明変数にFingerprintを使い、8割を訓練データとしたKPLS回帰を行った (Fig. 4)。得られた予測モデルを社内ライブラリ化合物に適用し、仕事関数を低下させる化合物を抽出して実測を行うMIサイクルを3回行った。
Table 1に本事例のMI探索結果をまとめた。MI予測モデルによって抽出した社内ライブラリ化合物のなかには、仕事関数を低下させる効果が既知である化合物とは異なる構造や、社内実測での仕事関数最低値を更新する化合物も発見することができた。本事例での3サイクルで実測評価したのは社内ライブラリ化合物の1%以下であり、マテリアルズ・リポジショニングで社内過去資産を有効活用できることが示された。材料においても、別用途で作られた化合物が他の用途に転用できることで、材料開発を短縮化・低コスト化することが可能であるだけでなく、自社製の化合物であることから特許による権利化という知財面、その化合物に対する蓄積されたノウハウ・周辺化合物の利用も可能になるなど副次的な利点もある。
Table 1 Summary of MI exploration results.
2.3 分子シミュレーションを用いた大規模計算による化合物記述子のデータベース化とそのMI活用
従来の分子シミュレーションやFingerprint、2Dの記述子を使ったMIにおいては、溶解性など材料開発において基礎的な物性値であっても十分な予測精度が得られないものがあった。近年、DFTをはじめとする量子化学計算から得られるパラメーターを記述子として用いることで、これまで予測困難であった物性においても予測精度の向上が見られることが報告されている10)。MIの普及により、数万化合物以上を母集団として化合物探索をすることが日常的に行われている。量子化学計算により記述子の利用は、高精度の予測モデル構築を可能にし、これまで以上の精度で新規化合物を探索できる可能性を秘めている。一方で、予測モデルを構築した際の量子化学計算記述子を母集団化合物全てにおいて計算するにはしばしば莫大な計算コストがかかり、非現実的である。我々は、このことを分子計算とMIを融合させる際の課題の一つと認識している。この課題解決の一つとして、計算サーバーの有閑期や一部のリソースを占有化することで、DFT計算7-8)による化合物の記述子 (以下、DFT記述子とする) 計算とデータベース化を進めている。
DFT記述子の有効性を示す事例として、金属―有機分子間の結合エネルギー予測がある。樹脂と金属の接着性を向上させる有機分子添加剤を探索・分子設計する上で、金属と有機分子の結合エネルギーは有効な設計指針の一つである。有機分子が複数の相互作用点を有する場合、相互作用点の特定とその部位での金属との相互作用エネルギーを評価する必要がある。これには、有機分子周りにランダムに金属を配置させ、その点での金属―有機分子のエネルギーを比較することで最安定な相互作用点を同定7-8)した後、結合エネルギーを計算する必要がある。本事例で扱った有機分子1つに対し、100点程度のGrid計算を行い化合物数x~100点のDFT計算と得られた安定点での結合エネルギー計算を行った。
本事例で検討した111化合物の結合エネルギーを目的変数とし、化合物から計算できる2D記述子とDFT記述子を説明変数とし、8割を訓練データとしたLASSO回帰の結果をFig. 5に示す。目的変数は金属―有機分子間の結合エネルギーであるが、説明変数には金属の情報、結合部位の情報は含まれていない (有機分子から計算される記述子のみ) にも関わらず、高精度な予測モデルが構築できたことは特筆すべき点である。結合エネルギー計算には数ヶ月の計算時間を要したが、説明変数のうち計算コストの高いDFT記述子はデータベースとして計算済みであるため、高精度かつ高速な結合エネルギー予測が可能となった。
DFT記述子データベースを使った事例の2つ目は、上記で説明した樹脂と金属の接着性を向上させる有機分子添加剤の既存化合物中からの探索である。接着性を定量化した独自変数を目的変数とし、説明変数にはDFT記述子を含む分子構造から計算される記述子を用いた。目的変数をガウス過程回帰によって回帰し、ベイズ最適化によって探索空間中を大域的に探索した後、局所的探索に切り替え、3ヶ月で目的変数を向上させる化合物を発見することができた。探索初期には偏りなく大域的に探索化合物から評価化合物を抽出し、得られた評価値で予測モデルを複数回更新した後、蓄積データのうち上位の化合物だけで予測モデルを構築し、ベイズ最適化で局所最適化を行った。本検討では、探索空間の約0.45%の化合物を実評価することで、目的変数の最大値を2度更新することができた。Fig. 6に目的変数の推移とMI試行回数を示す。
DFT記述子を含む化合物の記述子のデータベース化は、材料開発におけるMI予測に対する良質な説明変数と、その良質な説明変数を用いた幅広い化合物探索空間を提供することで、研究開発の効率化と加速化に大きく貢献する結果となっている。
3
まとめ
本稿では我々の材料開発における分子シミュレーションとMIの融合活用について時系列で事例を紹介した。我々は、研究風土として確立してきた「分子シミュレーション」、「合成」、「解析」が三位一体となった開発スタイルに、新たにMIを融合させるスタイルの確立を進めている。事例として紹介した、樹脂の添加剤探索、OLED材料探索、分子シミュレーションによる大規模計算と化合物記述子のデータベースを利用した材料探索では、既存化合物から未知の物性・特性を持つ化合物を探索し、分子設計に活用することが可能となっている。このマテリアルズ・リポジショニングをはじめとして、我々は材料開発における新しいパラダイムを模索し続けている。本稿の事例から、MI技術と分子シミュレーションを融合させたマテリアルズ・リポジショニングは、材料開発において革新的な可能性を秘めていることが明らかになった。我々はDFT計算による高精度な分子記述子のデータベース化は、効率的な探索と開発を実現可能にするための鍵の一つとなっていると捉えている。