服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

预测更准确,使用机器学习改进化学品的毒性评估

日期: 来源:数据派THU收集编辑:数据派THU


来源:ScienceAI

本文约1500字,建议阅读5分钟
本文为你介绍一个基于随机森林的直接分类模型,该模型将分子描述符与毒性联系起来。

从命运和毒性的角度来看,人类暴露的化学空间随着化学物质的多样性而不断扩大。欧洲和美国的化学品机构列出了大约 80 万种化学品。对于这些化学品中的大多数,人们对其环境归宿或毒性知之甚少。


通过实验填补这些数据空白是不可能的,因此计算机方法和预测至关重要。然而,许多现有模型受到假设和小训练集的限制。


近日,来自阿姆斯特丹大学、昆士兰大学和挪威水研究所的研究团队,开发了一个基于随机森林的直接分类模型,该模型将分子描述符与毒性联系起来。


该模型是通过实验定义的 907 种有机化学品的急性鱼类毒性 96 小时 LC50 值数据集开发、验证和测试的。该分类模型解释了数据中约 90% 的训练集方差和约 80% 的测试集方差。与基于定量构效关系 (QSAR) 建模的传统「计算机模拟」评估相比,该策略使错误分类的频率降低了 5 倍。与 QSAR 方法相比,提出的直接分类模型具有更好的性能,使该方法成为评估化学品危害和风险的可行工具。


该研究以「From Molecular Descriptors to Intrinsic Fish Toxicity of Chemicals: An Alternative Approach to Chemical Prioritization」为题,于 12 月 8 日发布在《Environmental Science & Technology》上。


论文链接:
https://doi.org/10.1021/acs.est.2c07353


据研究人员称,无论是在新化学品的安全设计开发中,还是在现有化学品的评估中,机器学习的使用都可以极大地改善分子的危险评估。后者的重要性体现在以下事实:欧洲和美国的化学机构列出了多年来开发的大约 800,000 种化学品,但对这些化学品的环境归宿或毒性知之甚少。


由于化学归宿和毒性的实验评估需要大量时间、精力和资源,因此建模方法已被用于预测危险指标。特别是经常应用 QSAR 建模,将分子特征(原子排列和 3D 结构)与物理化学性质和生物活性联系起来。


根据建模结果(或可用的测量数据),专家将分子分类为全球化学品统一分类和标签系统 (GHS) 中定义的类别。对于特定类别的分子,将进行更多的研究,更积极的监测,最终立法。


然而,这个过程有固有的缺点,其中大部分可以追溯到 QSAR 模型的局限性。它们通常基于非常同质的训练集,并假设线性构效关系以进行外推。因此,现有的 QSAR 模型无法很好地代表许多化学品,使用这些模型可能会导致大量的预测误差和化学品的错误分类。


跳过 QSAR 预测


在这里,Saer Samanipour 博士及其合著者提出了一种完全跳过 QSAR 预测步骤的替代评估策略。


图 1:从原始数据到最终生成模型的研究总体工作流程。(来源:论文)


研究人员合作开发了一种基于机器学习的策略,用于根据分子描述符对化学品的急性水生毒性进行直接分类。


该模型是通过 907 项实验获得的鱼类急性毒性数据(96h LC50 值)开发和测试的。新模型跳过了对每种化学品的毒性值 (96h LC50) 的明确预测,而是直接将每种化学品分类为多个预定义的毒性类别。


例如,这些类别可以由特定法规或标准化系统定义,如急性水生危害的 GHS 类别一文中所示。该模型解释了训练集中使用的数据中大约 90% 的方差,以及测试集数据中大约 80% 的方差。


更准确的预测


与基于 QSAR 回归模型的策略相比,这种直接分类策略导致错误分类减少了五倍。随后,研究人员扩展了他们的策略以预测大量 32,000 种化学品(NORMAN 数据集)的毒性类别。


图 2:NORMAN 数据集的适用性域 (AD) 评估,基于 (a) 训练集(即完整的分子描述符空间),(b) QSAR 回归模型,和 (c ) 直接分类模型。蓝色圆圈代表 AD 之外的化学物质,橙色圆圈代表模型适用范围内的化学物质,绿色圆圈代表训练集适用范围内的化学物质。(来源:论文)


他们证明,他们的直接分类方法可以产生更高准确度的预测,因为来自不同来源和不同化学家族的实验数据集可以分组以生成更大的训练集。它可以适应各种国际法规和分类或标签系统规定的不同预定义类别。


将来,直接分类方法还可以扩展到其他危害类别(例如慢性毒性)以及环境归宿(例如流动性或持久性),并显示出改进化学危害和风险评估的硅内工具的巨大潜力。


参考内容:
https://phys.org/news/2022-12-machine-toxicity-chemicals.html


编辑:于腾凯
校对:林亦霖

相关阅读

  • 首届全国矿山AI大模型大赛举办

  • 日前,由中国煤炭学会、中国矿业大学(北京)、华为技术有限公司联合举办的第一届全国煤炭行业矿山AI大模型大赛决赛暨颁奖典礼在京举行。首届矿山AI大模型大赛关注矿山一线生产的
  • 人工智能语言模型 在智商测试中胜过人类

  • 自回归语言模型“生成型已训练变换模型3”(GPT-3)的成绩明显优于普通大学生……来源|科技日报编辑|安青
    据《参考消息》报道,美国加利福尼亚大学洛杉矶分校的研究人员发现,在衡
  • 生成式人工智能如何改变创意工作

  • 来源:Science AI本文约4400字,建议阅读10+分钟生成式AI模型有可能颠覆内容创作的世界。企业的生成式 AI 模型有可能颠覆内容创作的世界,对营销、软件、设计、娱乐和人际交流产
  • 人工智能:即将到来的海啸

  • 虽然目前市面上的设计软件,其功能逐年在改善,但在改进的速度和规模上却越来越不稳定。关于BIM工作流程与工程建设行业在实际运作方式上的对应程度,人们提
  • 高纯化学品产业创新有了新平台

  •   12月28日,中国化工学会高纯化学品工艺与装备专业委员会成立大会暨第一届一次委员代表大会在北京举行。该专委会旨在团结和组织高纯化学品工艺与装备
  • ChatGPT:一周爆红,两周过气

  • 两周前疯狂刷屏的爆款AI应用ChatGPT,也难逃互联网过气定理。“人类离强大到危险的AI不远了。”这个让马斯克强烈安利的聊天机器人,在短短十余天的时间里,

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 浓情暖冬,热血大爱

  • 作者| 何昆、何国裕、黄健康近期,武警贵州总队六盘水支队积极主动倡导官兵参与“我为群众办实事、无偿献血我先行”活动,官兵们纷纷以实际行动支持社会公益事业,践行无私奉献的
  • 杭州市与阿里巴巴签订全面深化战略合作协议

  • 浙江新闻客户端记者 唐骏垚1月10日,杭州市人民政府和阿里巴巴集团全面深化战略合作协议签约活动举行。阿里巴巴是在杭州成长起来的世界500强企业。2013年,杭州市与阿里巴巴集
  • 我们的村落|钟门村:山海藏人家 渔舟唱晚霞

  • 在平潭岛的西北角有个名叫钟门的村庄村前有座名叫钟屿的小岛屿当海浪冲击时会发出如洪钟般的声响这便是钟门村名字的由来沿着钟门村道往前一望无际的渔排跃然眼前与湛蓝的海