服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

高学金,程琨,韩华云,高慧慧,齐咏生:基于中心损失的条件生成式对抗网络的冷水机组故障诊断

日期: 来源:化工学报收集编辑:高学金等

基于中心损失的条件生成式对抗网络的冷水机组故障诊断

高学金 1,2,3,4 程琨 1,2,3,4韩华云 1,2,3,4高慧慧 1,2,3,4齐咏生 5

(1. 北京工业大学信息学部,北京100124;2. 数字社区教育部工程研究中心,北京100124;3. 城市轨道交通北京实验室, 北京100124;4. 计算智能与智能系统北京市重点实验室,北京100124;5. 内蒙古工业大学电力学院, 内蒙古 呼和浩特010051 )

DOI:10.11949/0438-1157.20220568

摘 要 针对冷水机组产生的故障数据不足,数据集中正常数据和故障数据数量不平衡,进而导致故障诊断精度下降的问题,提出一种基于中心损失的条件生成式对抗网络(central loss conditional generative adversarial network,CLCGAN)和支持向量机(support vector machine,SVM)的故障诊断方法。首先,CLCGAN利用少量真实故障数据生成新的故障数据;然后,将生成的故障数据与初始数据集混合,使正常数据与故障数据的数量达到平衡;最后,利用平衡数据集构建SVM模型进行故障诊断。在GAN生成冷水机组故障数据时,构建动态中心损失项并加入到目标函数中,利用动态的中心损失减少冷水机组生成的各种故障数据的类内距离,从而降低各个故障生成数据之间的重叠程度,增加生成数据的可靠性。在生成故障数据之前配置相应的故障标签,并输入到CLCGAN中指导数据生成过程,使生成的故障数据可以均衡地分布于各个故障类别。在ASHRAE 1043-RP数据集上对所提方法进行了验证,结果表明,相较于其他解决数据不平衡问题的故障诊断方法,所提方法具有更高的故障诊断准确率。
关键词 冷水机组;故障诊断;生成式对抗网络;神经网络;算法;中心损失;集成

引 言

冷水机组是供暖、通风和空调系统中的关键设备,运行时间过久、使用操作不当和维护不善等都会引发故障。冷水机组的耗电量通常占建筑总耗电量的40%[1],当冷水机组发生故障并带故障运行时,会额外造成15%~30%的能源消耗[2],造成大量的能源浪费。从安全方面考虑,冷水机组在发生故障后,发现故障不及时或维修人员对发生的故障类型做出错误的诊断结果,都可能引发设备停机、设备损坏等更加严重的安全性问题。因此,针对冷水机组进行故障诊断的研究具有重要意义。
在冷水机组故障诊断领域中,相较于传统的基于模型的方法,基于数据驱动的方法不需要复杂的物理模型及相关的物理学知识。同时随着计算机技术的不断发展,在冷水机组系统中可以采集到越来越多的运行参数,并且对这些运行参数可以进行灵活的存储和读取。由于上述原因,基于数据驱动的冷水机组故障诊断受到越来越多研究者的关注,方法主要包含多元统计分析[3-4]、支持向量机[5-7]、贝叶斯网络[8-10]、深度神经网络[11-12]、集成学习[13-14]等。多元统计分析方法是冷水机组故障诊断领域中研究和应用较多的一种方法,多元统计分析是从经典统计学中发展出来的一种方法,它通过对各种数据进行分析,从相互关联的多个对象和多个指标中分析出所存在的规律。在冷水机组的运行参数中,大部分参数之间相互关联,关系复杂,多元统计分析方法可以从冷水机组相互关联的多个运行参数中找到表征运行状态的主要特征,从而进行精确的故障诊断。例如,齐咏生等[15]提出一种基于多尺度主元分析-核熵成分分析(MSPCA-KECA)的故障诊断策略,该方法通过MSPCA提取参数中的故障特征,MSPCA的输出作为KECA分类器的输入,并采用新的监测统计量使降维后不同特征信息之间呈现显著的角度差异,减少了故障诊断的误诊率。在冷水机组的故障诊断领域,除了多元统计分析方法,支持向量机也是一种被深度研究与应用的典型方法。Han等[16]提出一种基于交叉验证的最小二乘支持向量机(least squares support vector machine,LSSVM)冷水机组自动故障诊断方法,LSSVM利用冷水机组的8个故障指示特征对7种典型故障进行诊断,取得了较高的诊断准确率和较快的诊断时间。实际上,冷水机组各种故障与各特征之间的关系有着很大的不确定性,相同故障发生时可能会使不同特征变量发生改变,而多元统计分析方法和支持向量机不容易解决冷水机组故障诊断中的不确定性。而贝叶斯网络是由代表变量的节点及连接节点的有向边构成的有向无环图,贝叶斯网络各节点间的有向边代表了节点间的相互关系,并用条件概率表示各节点之间的关系强度,使得不确定性推理变得更为清晰、可理解性更强。贝叶斯网络可以融合冷水机组的各种现场信息进行推理,适用于存在诸多不确定性的冷水机组故障诊断中。Zhao等[17]设计了一个三层贝叶斯网络来诊断冷水机组的典型故障,在冷凝器结垢、制冷剂泄漏和冷凝器水流量减少这三种故障上均获得了较高的诊断准确率。随着神经网络技术的发展,逐渐有人将深度神经网络引入到冷水机组的故障诊断研究中。深度神经网络可以根据历史数据建立端到端的故障诊断模型,不需要额外的信息和专家知识,并且诊断的速度和精度都得到了很大的提升。例如,Li[18]等提出了一种用于冷水机组故障诊断的特征增强时域卷积网络的方法,与其他方法相比,需要更少的样本和更短的时间就可以完成模型的训练,并且可以获得满意的故障诊断结果。除了上述方法外,许多研究还提出在诊断分类之前对冷水机组的特征进行提取,消除冗余特征,从而提高故障诊断的精度。例如,Gao等[19]提出了一种带有级联特征清洗和补充混合特征筛选的故障诊断策略,通过基于随机森林(random forest,RF)元模型的全局灵敏度分析方法分析了冷水机组典型故障的敏感参数,并用于故障诊断,证明了润滑油参数对系统状态有直接而显著的指示作用。Lu等[20]提出了一种基于RF的特征重要性排序方法,仅选用重要性高的特征进行故障诊断,在使用较少传感器的情况下提高了冷水机组故障诊断的性能。
基于数据驱动的故障诊断方法可以获得较高的故障诊断精度,一个重要原因是依赖于数据量充足且类别平衡的理想数据集,但是,理想的数据集在实际应用中是很难获得的。在实际的数据集中故障数据通常很少,从而使故障诊断的准确性急剧下降[21]。在冷水机组的整个生命周期中,其运行在故障状态的次数少且时间短,从成本和安全方面考虑,人为制造故障来产生故障数据也不合理,所以现有的大部分冷水机组故障诊断方法在实际应用中,会面临故障样本数量不足使得故障诊断精度下降的问题。为解决这一问题,范雨强等[22]将合成少数类过采样技术与SVM算法相结合用于冷水机组的故障诊断中,仅采用少量螺杆式冷水机组的故障数据,就可以将离心式冷水机组故障诊断模型改变成螺杆式冷水机组故障诊断模型,解决了螺杆式冷水机组故障数据不足导致无法进行故障诊断的问题。Gao等[23]提出了一种基于数据自产生和卷积神经网络(convolutional neural network,CNN)的故障诊断方法,该方法利用滑动窗口将有限的故障数据扩展成更多的故障数据,并利用CNN良好的特征提取和模式识别能力来诊断冷水机组的典型故障。在解决冷水机组故障样本数量不足的问题上,传统的解决方法容易产生大量的相似数据,会加大模型过拟合的可能性,提高故障诊断的误诊率。
近几年的研究表明,在解决故障诊断过程中的数据不平衡问题上,利用生成式对抗网络(generative adversarial network,GAN)生成所需的故障数据是解决该问题的一个有效途径。GAN由Goodfellow [24]首先提出,因为简单有效的训练方式使得GAN在图像生成领域应用广泛。近几年,GAN逐步被应用在故障诊断领域,例如,Yan等[25]将GAN引入到冷水机组的故障诊断中,并利用成本敏感的顺序特征选择算法[26],从冷水机组的特征集中选出特征子集并进行故障诊断,结果表明所提出的方法可以在故障数据不足的情况下获得较高的故障诊断准确率。之后,Yan等[27]又通过引入变分自编码器,提出GAN和变分自编码器结合的复合模型来生成冷水机组的故障数据,诊断准确率得到进一步的提升。
GAN虽然可以解决冷水机组故障诊断中的数据不平衡问题,但是利用GAN在生成多个故障类别的数据时,容易使单个故障类别的生成数据分布范围过大,造成不同类别的生成数据之间产生大量重叠,从而影响最终故障诊断的精度。
本文提出一种基于CLCGAN-SVM的冷水机组故障诊断方法。该方法首先构造符合GAN模型训练的动态中心损失项,再将动态中心损失引入到GAN的目标函数中,从而减少各个类别生成样本之间的重叠程度,提高生成样本的质量。同时在GAN的判别器目标函数中对生成数据的“真假”和“类别”两个条件进行约束,一方面保证生成数据不断向真实数据靠近,另一方面使生成数据均衡地遍布各个类别,避免生成数据的单一性。最后,利用真实数据与生成数据形成的平衡数据集构造SVM模型,进一步实现冷水机组的故障诊断。

1 基于中心损失的条件生成式对抗网络

1.1 生成式对抗网络

GAN是近几年来较为流行的一种生成模型,可以产生与输入样本的特征相一致的生成样本。GAN基于博弈论场景,由生成器G和判别器D两个独立的网络组成,两者为相互对抗的目标,生成器G接受随机噪声,这个噪声可以取样自任意分布,通过生成器复杂的网络可以将输入的分布变成所需的更加复杂的分布,此分布可记作G(z)。判别器D是一个判别输入样本真假的网络,用来判别一个输入样本是否是“真实的”。其输入样本x由两部分组成,一部分是服从真实数据分布的随机采样样本,另一部分是服从生成数据分布的随机采样样本。输入样本x经过判别器网络后得到输出结果D(x),D(x)是一个介于0到1之间的小数,其代表输入样本x为真实数据的概率,D(x)越高代表输入数据越接近于真实数据。GAN的基本结构如图1所示。

图1   生成式对抗网络基本结构Fig.1   Basic structure of generative adversarial network
在GAN的训练过程中,生成器G的目标就是尽量生成真实的样本去“欺骗”判别器D。而判别器D的目标就是尽量把生成器G生成的样本和真实的样本区分开。这样,生成器G和判别器D就构成了一个动态的“博弈过程”。在理想状态下,生成器G可以生成“以假乱真”的样本G(z),而对于判别器D来说,难以判断生成器G生成的样本G(z)的真实性,也就是判别器的输出取中间值0.5,最终生成器G和判别器D达到纳什均衡,GAN的目标函数可表示为

(1)
式中,[·] 表示输出结果的期望;(·) 和 (·) 分别表示生成器和判别器的输出;x为真实数据;为随机噪声;下角标,表示从真实数据分布中随机采样;表示从随机分布中进行随机采样。将上述整体的目标函数分为判别器和生成器两部分可表示为

(2)

(3)
由于判别器的目标是区分真假样本,所以判别器期望目标函数中的D(x)最大化,期望D(G(z))最小化。生成器的目标则是生成尽可能真实的样本,所以生成器期望目标函数中的D(G(z))最大化,当判别器和生成器达到纳什均衡时,目标函数收敛。

1.2 基于中心损失的条件生成式对抗网络

传统GAN的判别器只能判断其输入是真实数据还是生成数据,不能判断输入的具体类别,即判断不出输入数据所属的故障类型。本文所需的冷水机组数据的故障类型较多,为了使每一类故障都有足够多的生成样本,受到条件生成式对抗网络[28]的启发,在训练GAN模型之前,先构造所需生成样本的故障标签,用提前构造好的故障标签与真假标签作为GAN模型输入的一部分,实现指导模型训练的作用。
从真假和类别两个角度设计判别器,将判别器网络的输出设置为两个通道,并添加一个通道权重系数。其中一个输出的结果代表输入数据属于真实数据的概率,传统的GAN利用交叉熵的形式计算此概率,但是利用交叉熵的形式判断数据真假会导致一些远离决策边界且被判别器分类为真的生成样本不会继续向真实数据靠近,这会大大降低生成样本的质量。本文采用最小二乘的形式构造目标函数,可以使GAN的判别器判别为真实样本且远离决策边界的生成样本继续优化,从而进一步拉近生成样本与真实样本之间的距离,提高生成样本的质量。
判别器的另一个输出是判断样本的故障类型,在交叉熵的形式下利用提前构造的故障标签对生成数据进行约束,使生成数据可以向预先设定的各类别靠近,而不只是生成“真”和“假”两类数据。本文CLCGAN中判别器的目标函数可表示为

(4)

(5)

(6)
式中,α是权重系数(常数),它的引入是为了平衡样本生成过程中真假与类别之间的生成权重;D1(·)和 D2(·)是判别器的两个输出,D1(·)为输入样本属于真实样本的概率,D2(·)为输入样本的故障类别;N为样本总数;c为整体的故障标签;ci 为第 i 个生成样本G(zi)所属的故障标签,训练开始之前可根据实验需求设定对应的标签集,在本文的实验中对 7 个故障类别分别生成 1500 个样本,所以ci所在的标签集分为7组,每组1500个相同标签,故障标签依次为1、2、3、4、5、6、7。
GAN在生成多种类别的数据时,由于生成器目标函数没有对生成范围进行约束,容易使生成的各个类别的数据分布范围过大,该问题会使生成数据中不同类别数据之间存在大范围的重叠,不利于之后生成数据的应用。本文引入中心损失[29]的思想,在GAN中利用各个类别的特征中心点对生成数据进行约束,可以最大限度地减少类内距离,同时保持不同类别样本之间的差异性不变。具体改进方法是:计算出每一类故障的真实数据的中心点,将生成的故障数据与真实数据的中心点之间的欧氏距离作为生成器目标函数的一部分,在生成器与判别器的迭代过程中,拉近各类别生成故障样本内部的距离,通过减少类内距离来减少各类样本之间的重叠程度,从而提高生成样本的质量。中心损失可表示为

(7)
式中,N为样本总数;xi为第i个样本;为第i个样本的故障标签;表示标签为的所有数据的特征中心,计算公式为

(8)
式中,ck为样本第k个特征的特征中心;N表示标签为的样本的总数量;为第i个样本的第k个特征。
传统的中心损失项中每一类的特征中心是固定的常数,这是不合理的,使用非动态的特征中心会导致生成的各类别数据范围太固定,不符合数据产生的实际情况。因此对中心损失项进行修改,将中心损失修改成随GAN的迭代而不断变化的动态中心损失。首先,设定一个移动步长,在生成式对抗网络的训练过程中,使每一类的特征中心通过设定的步长向每一次生成数据的特征中心移动。其次,需要注意的是,为了防止特征中心向错误的方向移动过多,移动步长取较小的数值。新的中心损失项与第i类的特征中心计算公式为

(9)

(10)
式中,ckt表示GAN在第t次迭代后第k个特征的特征中心;G(ck)t-1表示GAN在第t-1次迭代后生成数据第k个特征的特征中心;移动步长为常数,通过网格搜索和价交叉验证的方法进行选取,本文取值为0.1。
综上所述,本文CLCGAN模型中生成器和判别器的目标函数可分别表示为

(11)

(12)
本文算法的训练过程可分为以下步骤:
① 设置算法训练的迭代次数t
②从随机分布中随机采样,生成具有n个噪声样本的数据集{z(1) , … , z(n)},并设定样本标签集 {c(1) , … , c(n)};
③从真实样本的数据集 中随机选取,生成具有n个真实样本的数据集{(x(1)c(1)), … , (x(n)c(n))};
④从生成分布中随机采样,生成具有n个生成样本的数据集{G(z)(1) , … , G(z)(n)},并设定样本标签集{c(1) , … , c(n)};
⑤使用RMSprop算法更新判别器D的参数,并循环m次(m大于生成器更新的次数);
⑥从随机分布中随机采样,生成具有n个噪声样本的数据集{z(1) , … , z(n)},并设定样本标签集 {c(1) , … , c(n)};
⑦使用RMSprop算法更新判别器G的参数;
⑧达到迭代次数t,训练结束。

2 基于CLCGAN-SVM的故障诊断

2.1 基于CLCGAN的样本生成

本文的CLCGAN模型内部包含 1 个生成器模型和 1 个判别器模型,两者交替训练实现样本的生成。生成器模型采用包含 1 个输入层、1 个输出层和 2 个隐藏层的 4 层全连接结构,判别器模型采用包含 1 个输入层、2 个输出层和 3 个隐藏层的 6 层全连接结构。受文献[30]的启发,网络各层的节点数采取先增大后减小的方式比逐渐减小的方式分类效果更好,所以本文中的生成器模型和判别器模型各层节点数遵循先增大后减少的原则。
本文使用的冷水机组数据集含有64个特征,生成的随机噪声的维度为128,所以生成器的输入层节点数为128,根据节点数先增大后减小的原则,隐藏层1的节点数设置为输入层的两倍,即256个节点,隐藏层2的节点数减少为隐藏层1的一半,即128个节点,生成器产生的故障数据含有64个特征,所以输出层的节点数设置为64。综上所述,生成器各层的初始节点数设置为128、256、128、64,借鉴条件生成式对抗网络的思想,在生成器的每层都有一个额外的标签节点,通过样本标签指导生成模型的训练,所以生成器模型各层的节点数设置为129、257、129、64,激活函数统一使用ReLU函数。
判别器的输入层节点数与冷水机组数据集的特征数保持一致,同时加入标签节点,设置为65个节点。根据节点数先增大后减小的原则,隐藏层 1、隐藏层 2 和隐藏层 3 的节点数分别设置为256、64、32,本文判别器的输出层1是为了判断样本的故障类型,冷水机组故障样本共7种故障类型,所以节点数设置为7,而输出层2是为了判断样本的真假,表示样本属于真实数据的概率,所以节点数设置为1。综上所述,判别器各层的节点数设置为65、256、64、32、7/1,输出层2的激活函数使用Sigmoid函数,其余各层的激活函数均使用ReLU函数。生成器模型和判别器模型的具体结构如表1所示。

表1   CLCGAN模型结构Table 1   Structure of CLCGAN model


2.2 基于SVM的故障诊断

SVM是一类按监督学习方式对数据进行分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。因为其在解决小样本问题方面的优越性,所以本文选取SVM作为验证生成模型方法有效性的故障诊断分类器,并作为最终对比实验中的一部分。
初始的SVM是用来求解二分类问题,但是在实际问题中,SVM面临的任务基本都是多分类任务。使用SVM进行多分类的方法主要有两种:第一种,修改SVM的目标函数可以达到多分类的目标,但是会使目标函数变复杂,计算复杂度高且不易实现;第二种,构建多个二分类的SVM,最后通过特定的规则进行组合实现多分类的SVM。多分类SVM方法的介绍如图2所示,对于每一个类型,将其作为正类,其余类型作为负类。如图2所示,类型1作为正类,类型2和类型3作为负类,构造一个SVM模型,其中d1是该SVM模型的决策边界,类似地得到其余的SVM模型。

图2   多分类SVMFig.2   Multi classification SVM
本实验因为涉及到正常状态和7种故障类型,总共8种不同的类别,所以需要多分类的SVM进行故障诊断。本文针对每一个类别分别构造SVM,共构造8个SVM,每个SVM负责区分本类别数据和非本类别数据,即第i个SVM在第i类和其余类之间构造一个超平面,最后结果由输出离超平面距离最大的SVM决定。

2.3 方法流程

本文所提的故障诊断方法包含信号采集、数据预处理、生成样本数据和故障诊断,总共4个阶段,故障诊断的具体步骤如下。
(1)收集冷水机组运行数据,包含正常状态数据和故障状态数据,对所有数据进行稳态过滤,去除非稳态数据。
(2)将原始数据集进行数据归一化处理,减少不同变量的量纲对实验的影响,将原始数据集分为训练数据集和测试数据集。
(3)构造并初始化CLCGAN模型,从训练数据集中选取指定数量的故障样本,并作为CLCGAN模型的训练数据,当CLCGAN模型在训练过程中达到停止条件或达到指定的迭代次数后,训练结束并由CLCGAN的生成器输出生成的故障数据。
(4)将CLCGAN生成的故障数据与初始选定的真实故障数据合并作为最终的故障数据,故障数据与正常状态数据组成平衡数据集。
(5)构造并初始化多分类的SVM模型,将平衡数据集作为多分类SVM模型的训练数据,SVM模型训练完成后,用测试数据集验证最终故障诊断的准确性。

图3   实验流程图Fig.3   Flow diagram of experiment

3 实验结果及讨论

3.1 实验数据集

实验数据来自ASHRAE 1043-RP[31]项目,实验涉及一台90 t离心式水冷冷水机组,该冷水机组配备了二回程壳管式蒸发器和冷凝器,并由恒温膨胀阀控制,制冷剂采用R134a制冷剂。项目利用实验平台对冷水机组的正常运行状态和7种典型故障状态进行了模拟,7种典型故障在实验中分别具有4种故障严重程度,即Level 1、Level 2、Level 3和Level 4。其中冷凝器水流量下降、蒸发器水流量下降、冷凝器结垢和冷凝剂中有非冷凝物4种故障发生后会引起局部范围内运行参数的变化,因此属于部件级故障,而冷凝剂泄漏、冷凝剂填充过量和润滑油过量3种故障发生后会引发全局参数的变化,因此属于系统级故障。表2所示为7种故障的生成方式和设置不同严重程度时的参数。

表2   不同故障等级下的7种典型故障的生成方法Table 2   Generation methods of 7 typical faults under different fault levels


根据设定的冷冻水温度、蒸发器的进水温度、冷凝器的进水温度等的不同,项目共有 27 种工况,可以从实验中获得冷凝器进出水温度、蒸发器水流量、冷凝器水流量等64个参数的数据,其中包含48个传感器数据和16个间接计算数据。此外,实验中每个样本数据采集间隔为10 s。

3.2 实验评价指标

本实验主要采用分类准确率作为评估指标,用于实验结果的比较。假设有N个数据样本进行测试,将N分为NTPNFNNFPNTN,其中NTPNFNNFPNTN分别为真阳性样本、假阴性样本、假阳性样本和真阴性样本的数量。真阳性样本代表样本实际标签为正,预测标签为正;假阴性样本代表样本实际标签为正,而预测标签为负;假阳性样本代表样本实际标签为负,而预测标签为正;真阴性样本代表样本实际标签为负,预测标签为负。真阳性样本和真阴性样本的实际标签和预测标签一致,代表正确分类的样本,而假阳性和假阴性的实际标签和预测标签相反,代表错误分类的样本。所以,本文采用的分类准确率AC用式(13)计算。

(13)
只采用准确率对于方法的性能分析来说,不是很全面,因为如果数据集不平衡,即每一类的数据样本数量相差太大,分类器可能会偏向于将所有样本都预测为数量较多的类别,这样可以保证很高的准确率,但是容易发生误分类的问题,所以同时采用准确率和召回率来评估实验结果,召回率Recall可通过式(14)计算。

(14)
为了确保实验结果评估的全面性,进行实验结果评估时,本文还用到混淆矩阵,混淆矩阵的格式如表3所示。在机器学习领域,混淆矩阵又称可能性表格或错误矩阵,它是一种用来呈现方法性能的可视化效果的特定矩阵,通常应用在监督学习中。混淆矩阵可以容易地表明多个类别是否有混淆,即一个类别被预测成另一个类别,所有正确的预测结果都在对角线上,对角线之外的样本都是预测错误的样本,所以从混淆矩阵中可以很方便直观地看出方法的性能。在本实验中,混淆矩阵的每一行代表预测值,每一列代表实际的类别,预测类别和实际类别的顺序依次是冷凝器水流量下降、蒸发器水流量下降、制冷剂泄漏、制冷剂过量、润滑油过多、冷凝器结垢、冷凝剂中有非冷凝物和正常状态。

表3   混淆矩阵的描述Table 3   Description of confusion matrix


3.3 实验结果分析

在实验设置方面,为了验证本文所提方法在故障样本不足时的有效性,从每一种表征冷水机组故障类型的样本中随机选取50个作为生成模型CLCGAN的训练样本,模型训练完成后每一种故障类型都生成1500个样本。SVM的训练样本包含:生成模型CLCGAN的训练样本、CLCGAN的生成样本、1550个表征冷水机组正常状态的样本。从每个故障类型和正常状态的数据集中都随机选取500个作为最终的测试数据。为了增加实验结果的可信度,取五次实验结果的平均值作为最终的实验结果,SVM的参数使用网格搜索和交叉验证进行了调整。
上述实验设置下故障诊断结果的混淆矩阵如图4所示,混淆矩阵的列代表真实的标签,行代表预测的标签。可以看出,随着故障严重程度的提升,故障诊断的精度也有明显地提升。在四种故障严重程度下的故障和正常状态的平均故障诊断准确率和召回率如图5所示。

图4   故障诊断结果的混淆矩阵Fig.4   Confusion matrix of fault diagnosis results

图5   平均故障诊断准确率和召回率(训练阶段取50个故障样本)Fig.5   Average fault diagnosis accuracy and recall (take 50 fault samples in the training stage)
图4(a)为冷水机组故障严重程度为Level 1时故障诊断结果的混淆矩阵,在八种类别上取得了92.46%的平均准确率和92.48%的平均召回率,可以明显看出在制冷剂泄漏、制冷剂过量、润滑油过量三种系统级故障之间发生的错误诊断较多。测试数据集包括每类故障500个样本和正常状态500个样本,共有4000个样本。制冷剂泄漏故障的500个测试样本,其中有41个样本被错误诊断为制冷剂过量,62个样本被错误诊断为润滑油过多,5个样本被错误诊断为冷凝器结垢,9个样本被错误诊断为无故障。制冷剂过量故障的500个测试样本,其中有37个样本被错误诊断为制冷剂泄漏,16个样本被错误诊断为润滑油过多,1个样本被错误诊断为冷凝器结垢,4个样本被错误诊断为无故障。润滑油过多故障的500个测试样本,其中有85个样本被错误诊断为制冷剂泄漏,15个样本被错误诊断为制冷剂过量,1个样本被错误诊断为冷凝器结垢,2个样本被错误诊断为无故障。通过对冷水机组相应运行数据的分析,发生上述现象的原因是冷水机组在发生制冷剂泄漏、制冷剂过量和润滑油过多三种系统性故障,且故障严重程度为Level 1时,冷水机组运行数据的变化极为相似,差异性不明显。变化相似的训练数据使得生成模型生成的故障样本也具有相似的特征,最终平衡数据集中只包含每种故障的50个真实样本和大量相似的生成样本,这使得故障诊断时三种故障之间产生较多的错误诊断。
图4(b)、(c)、(d)分别是冷水机组故障严重程度为Level 2、Level 3、Level 4时故障诊断结果的混淆矩阵,相较于图4(a),可以明显看出故障诊断的精度获得了很大的提高,平均准确率分别是96.45%、98.91%和98.47%,平均召回率分别是96.40%、98.90%和98.38%,这是因为随着故障严重程度的增加,在冷水机组的运行变量之间,表征故障发生特征的变化明显且易于区分。并且随着故障严重程度的增加,在图4(b)中制冷剂泄漏、制冷剂过量和润滑油过多三种系统性故障都可以取得比故障严重程度为Level 1时更高的故障诊断精度,这是因为在故障严重程度为Level 2时,三种故障发生时冷水机组的运行变量的相似度下降,变量之间存在的差异性增大。从图4(c)和图4(d)可以看出,当故障严重程度为Level 3和Level 4 时,制冷剂泄漏、制冷剂过量和润滑油过多三种系统性故障之间已经不存在明显的错误诊断现象,且7种故障和正常状态的诊断精度都已经都取得了较为理想的结果。
为了验证在生成模型CLCGAN训练阶段故障样本的数量对最终故障诊断精度的影响,再次设置实验,在CLCGAN模型训练阶段,将每一类故障样本的数量都设置为100个,其他设置均保持不变。该设置下故障诊断结果的混淆矩阵如图6所示。可以看出,相较于每一类故障样本的数量都设置为50个时,模型训练阶段,故障样本数量的增加有利于冷水机组故障诊断精度的提高。在此实验设置下,四种故障严重程度的故障和正常状态的平均故障诊断准确率和召回率如图7所示。

图6   故障诊断结果的混淆矩阵Fig.6   Confusion matrix of fault diagnosis results

图7   平均故障诊断准确率和召回率(训练阶段取100个故障样本)Fig.7   Average fault diagnosis accuracy and recall (take 100 fault samples in the training stage)
图6(a)为冷水机组故障严重程度为Level 1时故障诊断结果的混淆矩阵,在八种类别上已经达到94.02%的平均准确率和94.03%的平均召回率。可以看出在制冷剂泄漏、制冷剂填充过量、润滑油过量三种系统性故障之间发生的错误诊断现象依旧存在,但是相较于图4(a)有明显改善。与实验一相同,测试数据集包括每类故障500个样本和正常状态500个样本,共有4000个样本。制冷剂泄漏故障的500个测试样本,其中有25个样本被错误诊断为制冷剂过量,65个样本被错误诊断为润滑油过多,4个样本被错误诊断为冷凝剂中存在非冷凝物,3个样本被错误诊断为无故障。制冷剂过量故障的500个测试样本,其中有23个样本被错误诊断为制冷剂泄漏,16个样本被错误诊断为润滑油过多,1个样本被错误诊断为冷凝剂中存在非冷凝物,3个样本被错误诊断为无故障。润滑油过多故障的500个测试样本,其中有58个样本被错误诊断为制冷剂泄漏,16个样本被错误诊断为制冷剂过量,1个样本被错误诊断为冷凝剂中存在非冷凝物,1个样本被错误诊断为无故障。
图6(b)、(c)、(d)分别是冷水机组故障严重程度为Level 2、Level 3、Level 4时故障诊断结果的混淆矩阵,故障诊断平均准确率分别是97.37%、98.70%和99.14%,平均召回率分别是97.30%、98.68%和99.13%,均已达到较高的诊断精度。通过对图5与图7的结果进行对比,表明故障诊断精度和训练阶段故障样本的数目正相关。
综上所述,模型训练阶段故障样本数目的增加和故障严重等级的增加对最终的故障诊断精度都有提高作用。

3.4 对比实验

首先为了验证本文方法中判别器的权重系数α的取值对结果的影响,选取不同的α值进行数据生成并利用生成数据进行故障诊断,通过对不同α值的诊断结果进行对比。在故障严重程度为Level 1时,不同取值下的对比结果如图8所示。可以看出在α<0.30的范围内故障诊断的准确率是一个递增的过程,随着α取值的不断增大,在α=0.30时,准确率达到最大值,因此在本文方法中的判别器的权重系数取值为0.30。

图8   不同权重系数下的准确率(故障严重程度:Level 1)Fig.8   Accuracy under different values of weight coefficient (fault severity: Level 1)
为了验证所提方法的有效性,在对比实验部分选取多个对比方法,每个方法的实验设置相同,在模型的训练阶段每个故障类型选取50个样本。具体的对比方法有:SVM、GAN-SVM、CWGAN-SVM[17]、CWGAN-VAE-RF[18]和CWGAN-VAE-SVM[18]
表4为各故障严重程度下用各方法进行冷水机组故障诊断的总体准确率。从表4可以看出,所提方法CLCGAN-SVM在冷水机组的故障严重程度为Level 1、Level 2、Level 3和Level 4时的总体故障诊断准确率都是最高的,分别是92.48%、96.65%、99.03%和98.70%。诊断准确率在故障严重程度为Level 3时达到最高值99.03%,比没有生成模型的SVM诊断方法的准确率高10.32%,比有经典GAN模型的GAN-SVM诊断方法的准确率高1.38%,在故障严重程度为Level 1时取得最低值92.48%,比没有生成模型的SVM诊断方法的准确率高42.77%,比有经典GAN模型的GAN-SVM诊断方法的准确率高3.13%。在故障的诊断时间上,GAN-SVM方法比仅采用SVM方法多709.97 ms,但是在各故障严重程度下的总体故障诊断准确率获得了较大的提高,分别提高了39.64%、19.55%、8.94%和0.58%,而本文所提的方法仅比GAN-SVM方法的时间多了117.68 ms,比固定中心损失的CLCGAN-SVM方法多了61.68 ms,却在故障诊断准确率上又获得了进一步的提高,因此本文所提方法在故障诊断上更有优势。

表4   对比实验Table 4   Contrast experiment


对比实验结果表明,在故障样本不足情况下,本文所提方法可以有效提升故障诊断的精度,并且相较于其他方法,本文所提方法具有更高的故障诊断准确率。本文的故障诊断方法与传统的故障诊断方法不同之处在于进行故障诊断之前有数据生成的步骤,数据生成模型CLCGAN根据少量的故障数据生成充足的模拟故障数据,并用生成的故障数据训练故障诊断的分类器,可以解决实际应用中冷水机组历史故障数据不足导致的诊断精度下降的问题。

4 结论

(1)实验结果表明,在冷水机组历史故障数据不足的前提下,CLCGAN可以利用冷水机组少量的历史故障数据生成相同运行环境下的模拟故障数据,通过生成的故障数据训练分类器,从而达到提高故障诊断准确率的作用。
(2)随着生成模型CLCGAN在训练阶段使用的故障数据的增加,最终故障诊断的准确率也会增加。
(3)在ASHRAE 1043-RP项目的数据集上,通过与其他的先进研究相比较,CLCGAN-SVM故障诊断方法在4个故障严重程度下均可以取得较高的故障诊断准确率。
本工作虽然可以在历史故障数据不足的情况下取得不错的故障诊断准确率,但是故障严重程度较低时,系统性故障之间容易发生错误的诊断。之后的工作重点在于,解决冷水机组在历史故障数据不足的前提下,故障严重程度较低(微小故障)时各系统性故障之间的错误诊断的问题。

Fault diagnosis of chillers using central loss conditional generative adversarial network

GAO Xuejin 1,2,3,4 CHENG Kun 1,2,3,4HAN Huayun 1,2,3,4Gao Huihui 1,2,3,4QI Yongsheng 5

(1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China;2. Engineering Research Center of Digital Community, Ministry of Education, Beijing 100124, China;3. Beijing Laboratory for Urban Mass Transit, Beijing 100124, China;4. Beijing Key Laboratory of Computational Intelligence and Intelligent System, Beijing 100124, China;5. School of Electric Power, Inner Mongolia University of Technology, Hohhot 010051, Inner Mongolia, China )

Abstract: Aiming at the problem that the fault data generated by the chiller is insufficient and the quantity of normal data and fault data in the historical data set is unbalanced, which leads to the decline of the fault diagnosis accuracy. In this paper, a fault diagnosis method based on central loss conditional generative adversarial network (CLCGAN) and support vector machine (SVM) were proposed. Firstly, CLCGAN generates new fault data from a small amount of real fault data. Then, the generated fault data was mixed with the initial data set to balance the amount of normal data and fault data. Finally, the SVM model was constructed by using the balanced data set for fault diagnosis. When GAN generates chiller fault data, the dynamic center loss term was constructed and added into the objective function. Through the dynamic center loss term, the intra-class distance of various fault data generated by the chiller was reduced, so that the overlapping degree of each fault generated data was reduced and the reliability of generated data was increased. Before generating fault data, configure fault labels and input them into CLCGAN to guide the data generation process. In this way, the generated fault data can be evenly distributed among different fault types. The proposed method was validated on ASHRAE 1043-RP project data set , and the results show that the proposed method has higher fault diagnosis accuracy than other fault diagnosis methods that solve the problem of data imbalance.
Keywords: chiller;fault diagnosis;generative adversarial networks;neural networks;algorithm;center loss;integrate

引用本文: 高学金, 程琨, 韩华云, 高慧慧, 齐咏生. 基于中心损失的条件生成式对抗网络的冷水机组故障诊断[J]. 化工学报, 2022, 73(9): 3950-3962 (GAO Xuejin, CHENG Kun, HAN Huayun, Gao Huihui, QI Yongsheng. Fault diagnosis of chillers using central loss conditional generative adversarial network[J]. CIESC Journal, 2022, 73(9): 3950-3962)

通信作者:高学金(1973—),男,博士,教授,gaoxuejin@bjut.edu.cn

第一作者:高学金(1973—),男,博士,教授,gaoxuejin@bjut.edu.cn




相关阅读

  • 开源 IoT 物联网分布式实时数据分析服务

  • Apache Pinot 分布式数据服务随着物联网设备增长,也产生了大量的数据,这些数据具有高速、多样和实时的特点。如果你的物联网数据不及时、不准确、不具有可操作性,那么你在收集
  • 公共数据运营各地现乱象,藏风险。

  • 2025年,数字中国各地政府党政KPI的鞭子已经挥起来了,数字中国总体规划新重点要求的就是 “数据资源体系”基础设施建设。2025年,数字中国的数字资源体系考核,还能沿用往多年的各
  • 大型SaaS系统的数据范围权限设计与实现

  • 权限的概述功能权限为何要基于RBAC功能粒度用户的优先级数据权限数据权限和什么有关系数据权限的操作步骤思想用到数据权限的地方部门管理中部门列表的数据权限用户新增弹框
  • Spring Boot + MybatisX = 王炸!!

  • 来源:blog.csdn.net/weixin_47025166/article/details/1253623231.什么是MybatisX?2.使用MybatisX的好处3.如何使用MybatisX?1.什么是MybatisX?MybatisX 是一款基于 IDEA 的快
  • 深度 | 数据的特征、价值、风险与监管

  • “ 作为一种新型生产要素,数据将对传统生产方式产生重大影响。根据近期公布的国务院机构改革方案,我国将组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和
  • 9只行业指数编制规则重大变化

  • 有知有行今天的一篇内容,提到几只全指类行业指数悄悄咪咪的发生了变化,刷中证官网的频率算是频繁的,这条信息完全没引起注意。https://www.csindex.com.cn/#/about/newsDetail?

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 退休2年半,王桂芝被查

  • 据中央纪委国家监委驻中国人寿纪检监察组、辽宁省纪委监委23日消息:广发银行原党委委员、监事长王桂芝涉嫌严重违纪违法,目前正接受中央纪委国家监委驻中国人寿纪检监察组纪律
  • 新书推介 |《稀土铈基环境催化材料》

  • 关键词 | 稀土催化 稀土新材料共 1275 字 | 预计阅读时间 5 分钟稀土是我国的重要战略资源,素有“工业维生素”之称,广泛应用于冶金、石化等传统行业以及永磁、储氢等新兴尖端
  • ​国家电投原副总经理夏忠被查

  • 据中央纪委国家监委网站23日消息,国家电投原党组成员、副总经理,中国电力企业联合会党委副书记、副理事长夏忠涉嫌严重违纪违法,目前正接受中央纪委国家监委驻国务院国资委纪检
  • 好评率超高的7个公众号,值得关注

  • 工作后,持续的自我学习变得愈发重要,那些下班后比你多学2小时的人,几年后的差距远远不止升职加薪。那么,如何利用下班后有限的时间,开拓视野、增长知识,就尤为重要。今天给大家推
  • 飞入高空火场?消防员的这些装备好“酷炫”!

  • 城市向天空“生长”的现实动态画面,莫过于一栋栋摩天大楼拔地而起。高楼实现了超级城市向空中要地的理想,也带来了城市消防隐患和高层消防救援的全球性难题。到今年6月,为期一