金属-有机骨架Metal–organic frameworks,MOFs是一类晶体多孔材料,因其具有不同拓扑结构的可调分子构建块,因此展现出巨大的化学空间。原则上,可以合成无限数量的金属-有机骨架材料MOF。机器学习方法,可以通过从结构-性质关系中,识别具有所需性质的最佳候选者,以有助于探索这一巨大的化学空间。
近日,韩国科学技术院(Korea Advanced Institute of Science and Technology)Yeonghun Kang, Hyunsoo Park,Berend Smit & Jihan Kim,在Nature Machine Intelligence上发文,报道了金属-有机骨架智能体MOFTransformer,这是一种多模态智能体编码器Transformer encoder,预先训练了100万个假设的金属-有机骨架材料MOF。该多模态模型,利用集成的基于原子图和能量网格嵌入,以分别捕获金属-有机骨架MOFs的局部和全局特征。通过使用5,000到20,000个金属-有机骨架材料MOF的小数据集,对预先训练的模型进行微调,该项模型实现了最先进的结果,用于预测各种性质,包括气体吸附、扩散、电子性质,甚至文本挖掘数据。除了其通用的迁移学习能力之外,金属-有机骨架智能体MOFTransformer,还通过自我注意层内的注意力得分,分析特征重要性,从而产生化学见解。因此,该模型可以作为其他了金属-有机骨架MOF研究人员的平台,从而开发新的机器学习模型。 A multi-modal pre-training transformer for universal transfer learning in metal–organic frameworks. 金属-有机骨架中,通用迁移学习的多模态预训练智能体。图1:金属-有机骨架智能体MOFTransformer的整体原理图和架构。
图2:全局和局部特征与金属-有机骨架MOF材料属性之间的关系。
图3:预训练和微调的结果。
图4:IRMOF-1中,注意力得分示意图。
图5:基于注意力分数进行特征重要性分析。
https://www.nature.com/articles/s42256-023-00628-2https://doi.org/10.1038/s42256-023-00628-2