服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

90 后学霸博士 8 年进击战:用机器学习为化学研究叠 BUFF

日期: 来源:数据派THU收集编辑:数据派THU
本文约2400,建议阅读5分钟

本文将围绕 ScienceAdvances 的一篇论文,介绍如何利用机器学习,对燃煤电厂的胺排放量进行预测。


关键词:AI for Science   化学工程   胺排放


ScienceAI 作为近两年的技术热点,引起了业界广泛关注和讨论。国际能源署公布的报告显示,2021 年全球能源相关的CO2 排放量较 2020 年增长 6%,达到 363 亿吨,创历史新高。


其中 CO2 排放量增幅最大的是发电和供热行业,增幅超过 9 亿吨,占全球 CO2 排放量增幅的 46%。控制并减少发电及供热行业 CO2 排放量刻不容缓。


2021 年各行业 CO2 排放量的年度变化


查看 2021 全球 CO2 排放完整报告:

https://www.iea.org/reports/global-energy-review-co2-emissions-in-2021-2


 碳捕捉:减少温室气体排放、实现变废为宝


在《中国电力行业碳达峰、碳中和的发展路径研究》中,行业专家给出了降低电力行业 CO2 排放量的三种改变措施:


 1、大力发展风电、水电、核电等低碳电源,抛弃煤电、油电等高碳电源;

 2、对于燃煤电厂,用天然气、秸秆、生物质等低碳燃料,代替煤炭进行发电;

 3、利用碳捕捉技术,对燃煤电厂排放的 CO2 进行捕捉利用。


其中,碳捕捉因为改造幅度小、想象空间大、具备变废为宝的能力,备受商业公司、能源公司以及电力行业科研院所的关注。


电厂中的碳捕捉设备


碳捕捉是指利用 CO2 和胺类物质发生反应,捕捉电厂释放到大气中的 CO2 并进行压缩,封存至枯竭的油田、天然气领域,或其他安全的地下场所,供后续石油开采、冶炼、汽车等产业利用。


然而,CO2 在与胺类物质发生反应的过程中,也会产生危害公共健康和生态系统的胺排放,有效监控并预测不同电厂的胺排放,成为碳捕捉的一大难点。


近日,由洛桑联邦理工学院和赫瑞瓦特大学组成的研究小组,开发出了一种机器学习方法,可依据电厂过往数据,更准确地预测碳捕捉过程中胺类有害气体的排放量。目前该论文已发表在 ScienceAdvances 上。 



完整论文请访问:
https://www.science.org/doi/10.1126/sciadv.adc9576#sec-2


 论文详解:用机器学习技术解决化学问题


 1、先导工场试验 


碳捕捉工场非常复杂,因为过程模型 (process model) 通常侧重于捕捉 steady-state 运行。然而,当前和未来发电厂的设计和运行,需要考虑到可再生能源发电份额的增加,这种增加是间歇性的、不规律的,因此还需要考虑到 steady-state 之外运行的动态和多变量行为。


为了模拟未来电厂运行的间歇性,科研人员对德国 Niederaußem 发电厂先导工场 (pilot plant) 的捕获装置,进行了一系列压力测试,试图发现电厂间歇性运行与胺排放量的关系。


Niederaußem 燃烧后碳捕捉先导工场的简化流程示意图


实验虽然积累了大量捕捉工场行为的数据,但无法利用这些数据定性预测未来的胺排放,因为除压力测试外,实验过程中还存在另一变量--电厂专业人员的干预,以确保实验期间工场的安全运行。


 2、获取数据集 


先导工场实验中,科研人员每 5 分钟进行一次数据采集,积累了庞大的数据量,如何把这些数据转化成可供机器学习模型使用的数据集,成为研究重点。


科研人员的方法是把 time-dependent 过程及排放数据,表示成图像(数据矩阵),基于此创建预测模型,然后借助机器学习技术进行模式识别,预测胺排放。


在这种表示法中,工场在给定时间 t 定义了一个 state 特征向量 x(t),其中 p 元素表示过程变量(如烟气温度和水洗温度)。


取 t 个时间戳的工场 state 向量,得到一个 t × p 的矩阵。这个矩阵可以被看作是一个「图像」,与未来的排放曲线 y(t) 相连。


数据表示示意图


本实验中用到的数据可以看作一张「图像」,其中:


  • 宽度=输入序列 (T) 的长度;

  • 高度=参数数量 p;

  • 颜色=参数 xj 在某个时间 ti 的值。


接下来,将工场历史图像中的 pattern,与特定的未来排放进行联系。为此,科研人员采用了梯度增强的决策树模型,将描述不同参数和排放量的行 (row) 合并为一个长向量。用分位数损失 (quantile loss) 训练模型,以获得不确定性评估 (uncertainty estimate)。


评估不确定性时,科研人员采用了支持蒙特卡洛 dropout 的时间卷积神经网络 (temporal convolutional neural network) ,并在 note S8 中展示用这个模型获得的结果。


有了这个数据集,就可以借助数据科学方法,开发一个机器学习模型进行数据分析。


 3、从机器学习中洞悉胺排放 


接下来,就可以用机器学习模型进行以下预测:


1、未来排放量(实时):基于历史 & 当前的运行和排放,预测未来 x 小时的排放量是多少;

2、数据的 Causal impact 分析:测量特定压力测试对胺排放的影响,需要一个 baseline,提供在没有压力测试情况下的胺排放;

3、减少胺排放:用模型预测「假设」情况下的排放量,如降低水洗温度是否会对排放量产生影响。


利用机器学习模型预测

未来 2 分钟、1 小时、2 小时的胺排放量


 90 后学霸博士,深耕化学 8 年


本篇论文由洛桑联邦理工学院基础科学学院的 Berend Smit 教授和苏格兰赫瑞瓦特大学碳解决方案研究中心教授 Susana Garcia 共同领导的科研小组发布。


其中,开发机器学习方法,将胺排放问题转化为模式识别问题的学生,正是 Smit 教授小组的 90 后博士生 Kevin Maik Jablonka。


该论文的一作 Kevin Maik Jablonka


Kevin 本科就读于德国慕尼黑工业大学化学专业,2017 年本科毕业后,Kevin 进入瑞士洛桑联邦理工学院继续硕士和博士学习,在化学领域继续深造。


从 2014 年至 2022 年,Kevin 用了 8 年时间建立了对化学及化学工程的深刻理解,期间还通过对应用数据科学、机器学习的学习,将化学研究与人工智能进行融合,提升了化学工程领域研究的效率和准确度,是一位妥妥的 90 后学霸。


诚如多位化学领域的资深人士所说,机器学习在化学及过程工程 (process engineering) 领域,可能产生比计算机视觉领域更大的影响。


在 CV 应用场景中,模型学习的图像基本特征,往往与人类大脑感知图像的方式密切相关,如目标检测、人脸识别。


然而在工业场景中,人类往往缺乏对基本机制的了解,但通过机器学习,科研人员发现了从参数到目标观察物映射的基本规则,并对迄今无法预测的现象进行了预测。


在预测电厂胺排放这一案例中,机器学习超越传统方法,被认为是提供了一种观察复杂化学过程的全新视角,极有可能彻底改变未来燃煤电厂的运行方式。


人工智能将更多地应用于基础科学研究,为其提供动力、提升效率、加速科研成果落地。


编辑:王菁

校对:王欣


相关阅读

  • 全球首只仿生大熊猫机器人“小川”在成都亮相

  • 来源:中国新闻网 仿生大熊猫机器人“小川”。 成都大熊猫繁育研究基地供图中新网成都1月20日电 (记者 安源)记者20日从成都大熊猫繁育研究基地(以下简称:熊猫基地)获悉,熊猫基
  • 全球首只仿生大熊猫机器人“小川”正式亮相

  • 1月19日,位于成都大熊猫繁育研究基地内(以下简称“熊猫基地”)的大熊猫博物馆迎来了一位“新朋友”——仿生大熊猫机器人“小川”。“小川”在大熊猫博物馆“竹林隐士”展区正
  • 全球首只仿生大熊猫机器人“小川”正式发布

  • 1月19日,记者获悉,为提升大熊猫博物馆的服务质量,增强游客体验感,传播大熊猫文化,熊猫基地委托中国科学技术大学机器人实验室(以下简称“中国科大机器人实验室”)研发制作了一只仿

热门文章

  • 建议中国私营经济退出的吴小平是什么人?

  • 今天,网上一篇题为《吴小平:私营经济已完成协助公有经济发展应逐渐离场》的文章引发热议。 吴小平其文 这篇文章挺短的,被大家广为引用的是开头一段—— “在中国伟大的改革开

最新文章

  • 今晚见!

  • 卯兔纳福喜兔贺岁 玉兔送福今晚8点2023云南省春节联欢晚会云南卫视 七彩云端APP精彩呈现最浓烈的色彩最饱满的激情最纯粹的快乐送上彩云之南最深情的祝福 真情实感 温暖
  • 春节,这座宝藏城市火出圈了!

  • 大众网·海报新闻记者 高杨 济宁报道  最近,这座宝藏城市火出圈了!很多人对它的印象都来自于一句“孔孟之乡、运河之都。  但兔年伊始,“刘德华学济宁话拜年”“流浪地球济
  • 【文明罗定】@罗定人,春节这么过,文明又健康

  • 文明过春节倡议书广大市民朋友:玉兔迎新春,佳节话文明。在2023年春节即将来临之际,为进一步弘扬中华传统美德,树立向上向善文明新风,引导全市人民过一个文明健康、喜庆祥和的春节