MatVAE: 少量の実験データでも学習可能な実験候補化合物を提示するための入れ子型変分オートエンコーダ

書誌事項

タイトル別名
  • MatVAE: Nested Variational Autoencoders for Generating Compounds with Small Experimental Dataset

説明

国際的に高性能かつ低環境負荷な材料の開発が急務であり,人工知能技術やデータ分析技術により材料開発効率化を図るマテリアルズ・インフォマティクス(MI)に注目が集まっている.特に,試作実験前に予め有望な材料を実験候補として提示し,要求性能を満たす新材料を短期間で見つけるため技術として,性能改善確度の高い化合物を生成する深層生成モデルがいくつか提案されている.しかし,一般的にこうしたモデルは十分な精度を得るために膨大な実験データを必要とする.現実の材料開発現場では多くても千件程度しか蓄積できないことが多く,少量の実験データでも適用可能な手法が必要だ.そこで報告者は,大規模オープンデータを用いて化合物の構造的特徴を学習する外側の VAE と,前記 VAE を介して得られる潜在変数と物性値の関係性を小規模実験データから学習する内側の VAE をネストして構成する深層生成モデル MatVAE を提案した.本研究では,学習データの範囲を超える高性能な材料を生成させるため,内側 VAE の学習時に潜在変数の所定の成分 z[k] と物性値が強い相関をもつような損失関数 L_cor を導入した.オープンデータによる検証では,候補生成時に z[k] を操作することで,生成化合物の物性値も制御可能であることが確認できた.さらに,過去の実験データを用いた模擬的新材料探索実験では,高性能な新材料の発見に要する実験回数を従来比 1/4 に削減した.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ