6f

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享


MIT团队化学发现落地经验总结

01 自动化和机器学习结合

  1. 自动化和机器学习的结合可能是实现快速、多样化分子化学发现的基础
  2. 针对设定特定属性的分子,可以先在非生物系统上进行验证,因为底层工作流是相同的,但更容易启动
  3. 机器学习可以用在Reaction Discovery、Process Optimization、Molecular Discovery

4. 分子图表征能够系统地捕捉更多信息

02 分子生成

  1. 为了生成新的分子,可以使用graph-to-graph模型,以迭代方式将性能较差的分子推向性能较好的分子
  2. 使用迭代graph-to-graph translation方法可以提高目标结构的溶解度
  3. 对于分子图生成,通过使用带有基序的编码器-解码器可以避免逐个原子生成的限制
  4. 基于基序的层次图完成模型可以在不需要逐个原子构建分子的情况下完成包含环分子
  5. 生成模型是生成大量待考虑候选分子的通用工具

03 分子属性预测器

  1. 使用基于消息传递神经网络的Chemprop来设计一般化学性质的空间并建立筛选模型,可以从集成的Chemprop训练模型中获得明显预测确定性的估计
  2. graph-completion生成可合成的分子,可以覆盖目标属性空间的广泛区域

04 反应路径

一旦选择了分子,需要确定在自动化管道中合成分子的路径

  1. The Jensen lab and others at MIT已经为有机合成预测开发了ASCKOS工具,包括了许多软件包,可以对反应和过程化学进行深入分析和预测,使用ASKCOS,借助计算机辅助合成规划软件可以自动生成反应路径

05 分子选择

1. 通过有策略地选择产物,可以找到具有共同节点和多样化功能路径的反应树

06 机器人执行

构建了基于well-plates的批量合成平台

1. 平台中间纯化和高效液相色谱分离的组合用于研究在平台上执行化学反应

2. 基础光谱测量在平台上完成自动化,可以用于表征其他与染料相关的特性

07 实验数据

1. 利用基本光谱测量,导出了其他相关性质,如分配系数和光稳定性

2. 直接光解活化能的测量可以作为用chemprop选择耐光染料的指导分子特性

08 Data from Experiments-->Property Predictors

1. 通过实验实现选定的分子,可以将表征数据反馈到模型中,用于指导额外的迭代

油管视频请关注该微信公众号

利用属性预测模型和计算机辅助合成规划来驱动自动多属性分子发现平台


01 自动化和机器学习结合

1. 自动化和机器学习的结合可能是实现快速、多样分子化学发现的基础

将传统的高通量实验和机器学习化学发现结合起来,吸收各自优点,弥补不足

传统的高通量实验

优点:快速、自动化、一致、范围窄

缺点:试验设计慢

文献:Santanilla, A.B., et al. Science 2015

机器学习化学发现

优点:快速的试验设计,多样性的

缺点:慢的试验验证

文献:Tkatchenko, A., et al. Nature Comm., 2020

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

2. MIT在机器学习和机器人技术的界面上自主设计具有多个属性目标的新分子

多属性包括:

(1) Organic Electronics

Singlet-Triplet Splitting、Oscillator Strength、Excited State Lifetime、Spectra

文献:Gomez-Bombarelli, et al. Science, 2016

(2) Reaction Discovery

Structure characterization, Mechanism discovery, substrate scope studies, Process chemistry

文献:Bort, et al., Scientific Reports, 2021

(3) Pharmaceuticals

Bioactivity, Biotoxicity, Solubility, Stability

(4) Energetic Materials

Heat of formation, Detonation pressure, Detonation velocity, Density

文献:Elton, D.C., et al. arXiv, 2018

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

3. MIT:有多种工具正在积极构建和改进,可用于驱动自主化学发现平台

机器学习模型正在开发应用不同的化学模块

(1) Reaction Discovery(new and /or more efficient pathways)

(2) Process Optimization(describe the yield-condition response surface)

(3) Molecular Discovery(new molecules using know chemical transformation)

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

4. 化学发现周期从确定目标开始,以评估分子和模型的性能

(1)如何设计针对特定属性的分子

(2)MIT证明所有的部分都可以在非生物系统上工作

(3)对于非生物系统,底层工作流是相同的,但更容易启动

初始的发现任务:

Target -增加数据集的最大吸收

Constraints-约束吸收最大值(FA3),SAScore

Molecule Selection-基于新颖性的分子选择手动过滤器

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

5. 分子图表征能够系统地捕捉更多信息

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

02 分子设计

6. 为了生成新的分子,我们可以使用Graph-to-graph Translation,以迭代方式将性能较差的分子推向性能较好的分子

Graph-to-graph Translation

对于多属性目标,分子的各个部分通常会贡献自己的功能

通过提取好的分子片段并以有趣的新方式排列它们来产生新的目标

文献:Jin, W., et al., arXiv preprint arXiv:1812.01070(2018)

代码:https://github.com/wengong-jin/iclr19-graph2graph

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

7. 使用迭代使用Graph-to-graph Translation方法提高目标结构的溶解度

文献:Bilodeau, C., et al., React. Chem. Eng., 2022, 7, 297-309

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

8.对于分子图生成,通过使用带有基序的编码器-解码器来避免逐个原子生成的限制

文献:Wengong, J., Barzilay, R., Jaakkola, T., Int. Conf on Machine Learning. PMLR, 2020

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

9. 基于基序的层次图完成模型可以在不需要逐个原子构建分子的情况下完成包含分子的环

文献:Wengong, J., Barzilay, R., Jaakkola, T., Int. Conf on Machine Learning. PMLR, 2020

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

10. 生成模型是生成大量待考虑候选分子的通用工具

Graph-to-Graph translation model

文献:Jin, W., et al., arXiv preprint arXiv:1812.01070(2018)

代码:https://github.com/wengong-jin/iclr19-graph2graph

Graph completion model

文献:Wengong, J., Barzilay, R., Jaakkola, T., Int. Conf on Machine Learning. PMLR, 2020

文献:Bilodeau, C., et al., React. Chem. Eng., 2022, 7, 297-309

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

03 分子属性预测器

11. MIT使用基于消息传递神经网络的Chemprop来设计一般化学性质的空间并建立筛选模型

文献:J.Chem. Inf. Model. 2019, 59,3370-3388

代码:http://chemprop.csail.mit.edu/

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

12. 可以从集成的Chemprop训练模型中获得明显预测确定性的估计

文献:J.Chem.Inf.Model. 2020,60, 2697-2717

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

13. 对于MIT的测试设计空间,使用了一组Chemprop模型,这些模型是从测量属性的实验数据集训练而来

文献:UV/Vis:Greenman, K.P.,Green, W.H, Gomez-Bombarelli, R., Chem. Sci., 2022,13, 1152-1162

文献:Chung, Y., Vermeire, F.H., Green, W.H., et al., J. Chem. Inf. Model, 2022, 62, 433-446

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

14. graph-completion生成可合成的分子,可以覆盖目标属性空间的广泛区域

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

03 反应路径

一旦选择了分子,需要确定在自动化管道中合成分子的路径

15. The Jensen lab and others at MIT已经为有机合成预测开发了ASCKOS工具

文献:https://mlpds.mit.edu/papers/

Coley, C.W., et al., ACS Cent. Sci. 2017

askcos.mit.edu

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

16. 使用ASKCOS,借助计算机辅助合成规划软件可以自动生成反应路径

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

ASKCOS开发团队已经包括了许多软件包,可以对反应和过程化学进行深入分析/预测

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

05 分子选择

通过有策略地选择产物,可以找到具有共同节点和多样化功能路径的反应树

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

06 机器人执行

构建了基于well-plates的批量合成平台

(1)得到了吞吐量和灵活性的良好平衡

(2)非常支持基于属性的化学发现

(3)允许我们同时进行化学反应

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

平台中间纯化和高效液相色谱分离的组合用于研究在平台上执行化学反应

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

基础光谱测量在平台上完成自动化,可以用于表征其他与染料相关的特性

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

07 实验数据

利用基本光谱测量,导出了其他相关性质,如分配系数和光稳定性

直接光解活化能的测量可以作为用chemprop选择耐光染料的指导分子特性

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

08 Data from Experiments-->Property Predictors

通过实验实现选定的分子,可以将表征数据反馈到模型中,用于指导额外的迭代

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

有多种工具正在积极构建和改进,可用于驱动自主化学发现平台

MIT: AI自动化学发现平台,超过20人博士团队,数10篇文章落地分享

7f
发表评论
留言与评论(共有 0 条评论) “”
昵称:
匿名发表 登录账号
         
   
验证码:

相关文章

推荐文章

a
3F