服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

【已开源】百万条数据帮助AI寻找新药 | 今日 Chemistry World

日期: 来源:RSC英国皇家化学会收集编辑:

Chemistry World 是由英国皇家化学会出版的化学杂志,主要发布化学相关最新的新闻、观点、评论和科研进展。

为助您快速了解该杂志的最新讯息,我们特别开通了『今日 Chemistry World』栏目,欢迎扫描文末二维码访问 Chemistry World 官方网站。

  


科研进展

来自俄罗斯的研究人员们汇集了迄今为止世界上最大的数据集,用于训练深度神经网络模型。该数据集包含大约一百万种药物样分子的大约六百万种构象。

从计算的角度来看,人们必须知道构象能量和哈密顿矩阵参数等细节,才能在实验室合成之前对潜在药物的生物活性进行预测。密度泛函理论 (DFT) 可用于预测此类参数,但量子化学计算往往耗时且计算量大。然而,机器学习可被用于降低 DFT 计算的复杂度。

该团队发现目前还缺乏用于训练机器学习模型的这类数据集,因此开始着手填补这一空白以最终降低药物化学相关的计算成本。他们从具有 436,581 种构象的 100,000 个分子的训练集开始,并使用 DFT 计算了它们的构象能量和哈密顿系数。该训练集明显大于公开可用的深度神经网络模型中使用的数据集。

然后,研究人员们将基于 DFT 的原始模型的性能与包含不同分子的测试集进行了比较。该团队指出,这些模型在使用更大的数据集进行训练后表现得更好。

该团队公开了代码,以鼓励其他研究人员使用和开发数据集。他们希望这将有助于未来的量子化学研究。

References

K Khrabrov et alPhys. Chem. Chem. Phys., 2022, 24, 25853 (DOI: 10.1039/d2cp03966d)

Additional information

代码和数据库已开源:https://github.com/AIRI-Institute/nablaDFT

     

扫描二维码

阅读相关原文







 


欢迎联系我们发布论文报道

相关阅读

  • Science:AI竞赛,学界正在输给业界

  • 新智元报道 来源:学术头条编辑:好困【新智元导读】人工智能(AI)正在向业界倾斜。相比于学界的前沿性研究,风靡当下的 AI 聊天机器人 ChatGPT、AI 艺术生成器 Midjourney,以及微
  • 国家数据局即将诞生,将解决哪些问题?

  • 3月7日,在第十四届全国人民代表大会第一次会议上,国务委员兼国务院秘书长肖捷受国务院委托向大会作了国务院机构改革方案的说明。“组建国家数据局”是13项国务院机构改革方案
  • She Says | 对话ACS女性主编(上)

  • Hear from our Editors长期以来,美国化学会出版社与众多女性编辑、作者、审稿人和读者一道,共同致力于推动妇女和女童充分且公平地接触科学、参与科学。在此,我们要向化学研

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 白宫宣布韩总统下月访美,有“惊喜”

  • 据美联社报道,白宫7日宣布了本届政府接待的第二次国事访问,即韩国总统尹锡悦及夫人金建希4月26日的到访。据称,拜登将为韩国总统举行盛大仪式。报道称,白宫将为尹锡悦举行一场盛
  • 她们,是中国培训圈的主力

  • 在培训行业中,女性占比应该超过60%。在培训经理指南20万的读者中,其中的女性占比高达55.9%,比男性高出11%。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍从年龄分布来