日期:
来源:RSC英国皇家化学会收集编辑:
Chemistry World 是由英国皇家化学会出版的化学杂志,主要发布化学相关最新的新闻、观点、评论和科研进展。
为助您快速了解该杂志的最新讯息,我们特别开通了『今日 Chemistry World』栏目,欢迎扫描文末二维码访问 Chemistry World 官方网站。
科研进展
从计算的角度来看,人们必须知道构象能量和哈密顿矩阵参数等细节,才能在实验室合成之前对潜在药物的生物活性进行预测。密度泛函理论 (DFT) 可用于预测此类参数,但量子化学计算往往耗时且计算量大。然而,机器学习可被用于降低 DFT 计算的复杂度。
该团队发现目前还缺乏用于训练机器学习模型的这类数据集,因此开始着手填补这一空白以最终降低药物化学相关的计算成本。他们从具有 436,581 种构象的 100,000 个分子的训练集开始,并使用 DFT 计算了它们的构象能量和哈密顿系数。该训练集明显大于公开可用的深度神经网络模型中使用的数据集。
然后,研究人员们将基于 DFT 的原始模型的性能与包含不同分子的测试集进行了比较。该团队指出,这些模型在使用更大的数据集进行训练后表现得更好。
该团队公开了代码,以鼓励其他研究人员使用和开发数据集。他们希望这将有助于未来的量子化学研究。
References
K Khrabrov et al, Phys. Chem. Chem. Phys., 2022, 24, 25853 (DOI: 10.1039/d2cp03966d)
Additional information
代码和数据库已开源:https://github.com/AIRI-Institute/nablaDFT
扫描二维码
阅读相关原文