Sample Imbalanced Fault Diagnosis Method Based on Multi-channel Data Double Augmentation

GUOYiming, TONGYifei, HEFei, XIEZhongqu, SONGShida, HUANGJing

PDF(12376 KB)
PDF(12376 KB)
Acta Armamentarii ›› 2025, Vol. 46 ›› Issue (2) : 240012. DOI: 10.12382/bgxb.2024.0012

Sample Imbalanced Fault Diagnosis Method Based on Multi-channel Data Double Augmentation

Author information +
History +

Abstract

In complex manufacturing processes,it is crucial to collect and analyze the multi-channel data for condition monitoring and fault diagnosis.The existing methods are used to difficultly handle the problems of complex spatial-temporal correlation and sample imbalance of the multi-channel data.To solve these problems,a sample imbalance fault diagnosis method based on multi-channel data double augmentation is developed.The proposed method has the advantages of two-stage data augmentation and global optimization.It first learns the fault features,and then converts them into the multi-channel data for the data augmentation.The distribution difference evaluation mechanism is introduced to effectively describe the correlation between different channels,and a multi-objective global optimization strategy is designed to improve the quality of generated data.The effectiveness of the proposed method is verified by studying a real-world case.The experimental results show that the data double augmentation method can effectively expand the multi-channel data with small samples,and the global optimization strategy can improve the performance of generated data in the fault diagnosis.Compared with existing methods,the proposed method has higher fault diagnosis accuracy in various sample imbalance scenarios.

Key words

multi-channel data / sample imbalance fault diagnosis / data augmentation / global optimization

QR code of this article

Cite this article

Download Citations
GUO Yiming , TONG Yifei , HE Fei , XIE Zhongqu , SONG Shida , HUANG Jing. Sample Imbalanced Fault Diagnosis Method Based on Multi-channel Data Double Augmentation. Acta Armamentarii. 2025, 46(2): 240012 https://doi.org/10.12382/bgxb.2024.0012

0 引言

机械系统的故障会导致严重的经济损失,甚至危及员工的安全,而武器装备、航空航天等领域对机械系统可靠性要求较高,准确有效的故障诊断是降低成本、提高效率和保障系统正常运行的重要途径[1-2]。随着计算机、物联网等技术的快速发展,制造过程中各类传感数据被广泛采集,为故障诊断提供了充实的数据基础。数据驱动的机械系统故障诊断方法得到了较多的研究和应用[3-4]。然而,实际的制造过程复杂且环境恶劣,采集到的多通道数据具有结构复杂和故障样本量少的特点,给故障诊断带来了困难与挑战。因此,实现复杂情况下的有效故障诊断具有重要的理论研究价值和实践意义。
近年来,深度学习技术被广泛应用于机械系统的故障诊断任务中。相比于其他的深度学习模型,卷积神经网络(Convolutional neural network,CNN)能有效地从高阶数据中提取并融合特征,适用于多通道数据的分析。文献[5]提出了一种基于CNN的多传感数据融合模型,该方法能有效挖掘齿轮箱中多个电流信号中的故障特征以实现故障诊断。文献[6]采用CNN网络将行星齿轮箱中水平和垂直两个方向的振动信号进行融合与特征提取,实现了高精度的故障诊断。文献[7]构建了基于过采样算法的CNN网络以实现变速箱多种故障模式的有效识别,相比于多线性子空间学习等多通道数据处理方法,CNN模型可以在没有先验知识的情况下,通过卷积运算以有效地从原始多通道数据中挖掘故障特征[8]。为了进一步提升CNN模型的故障诊断性能,一些研究将CNN与其他深度学习框架相结合,以提取更加全面有效的故障特征。文献[9]将CNN模型与长短时记忆网络相结合以充分提取振动和转速信号中的时域与频域特征。文献[10]提出一种新的选择性卷积网络,通过通道空间注意力机制提高特征增强和故障诊断性能。文献[11]在CNN网络中引入双向门控循环单元,对特征进行加权融合以实现端到端的故障诊断。尽管CNN等深度学习模型具有较强的特征提取和故障诊断能力,但其诊断性能对训练数据质量和数量的依赖性较强。而实际制造过程中机械系统大多数时候处于正常工作状态,导致故障样本的稀缺。在面对样本不平衡的情形时,深度学习模型难以有效挖掘少数样本的故障特征,从而造成诊断精度下降[12-13]
机械系统在实际中不会经常发生故障,使得故障样本数量远小于正常工况下的样本量,使用不平衡的训练样本会导致诊断模型过于关注数据量大的样本,而难以有效提取出少数样本数据中的特征[14]。为了解决样本不平衡问题,研究人员从算法和数据两种角度提出了多种方法[15]。集成学习、提升算法和代价敏感学习是解决这一问题的常用算法,但这类方法存在成本难确定、计算过程复杂等困难,在实际使用中面临着诸多挑战[16-17]。在数据层面常用的方法包括欠采样和过采样。欠采样方法通过丢弃部分数据以达到样本平衡的目的,但这不可避免地会造成信息流失。传统的过采样算法采用简单复制或其他方式扩充少数样本,由于没有引入新知识,因此很容易导致过拟合[18-19]
生成对抗网络(Generative Adversarial Network,GAN)于2014年由Goodfellow等提出,目前已成为数据生成的重要方法之一,在图像处理等领域得到了广泛研究与应用[20-21]。不同于其他的过采样算法,GAN采用对抗学习策略来优化生成模型,可以自动生成数据以解决样本不平衡问题,已有部分学者将GAN引入故障诊断任务中。文献[22]采用小波包变换从原始数据中提取特征,并将特征作为GAN的输入以生成故障特征,该方法成功应用于齿轮箱小样本故障诊断任务中。文献[23]构建了一种新的条件生成对抗网络以实现滚动轴承故障诊断中的数据增强。文献[24]等通过将卷积网络融入GAN中,以提升模型对于少数样本故障特征的学习能力。文献[25]等提出了一种基于条件变分自编码器的GAN模型,该方法可以在多种工况下生成故障样本,显著提升了样本不平衡情形下的故障诊断性能。上述研究表明GAN通过提升生成数据与真实数据间相似程度,能有效解决样本不平衡问题,并在诊断任务中具有良好的性能。但是,多通道数据具有高维度、信息冗余和复杂时空相关性等特点[26-27],现有的数据增强方法多关注于单个传感信号的描述,对于多通道数据结构的分析较少。如何生成具有丰富故障特征的多通道数据,以提升样本不平衡条件下的故障诊断性能,成为一个迫切需要解决且具有挑战性的难题。
综上,本文提出一种两层级的多通道数据增强和样本不平衡故障诊断方法。相比于传统的过采样方法,所提模型能有效学习多通道数据内部故障特征,通过两层级数据增强实现样本扩充,引入分布差异评估机制分析多通道数据间相关性,采用全局优化策略来训练模型参数。本文通过实际案例对比不同方法在样本不平衡故障诊断中的性能,验证了所提方法的有效性。

1 基于深度学习的多通道数据故障诊断

1.1 卷积神经网络

多通道数据中蕴含丰富的信息,能为机械系统的状态监测和质量评估提供依据。与单个传感数据相比,多通道数据具有更复杂的时空相关性,包括单个通道内的时间相关性和不同通道间的空间相关性。CNN具有优越的二维数据处理和局部关联信息表征能力,能有效适用于多通道数据这类张量结构数据[28]。卷积运算是CNN中的核心步骤,通过局部连接的权值对输入进行局部特征提取与融合,第p个特征图中的第k个卷积层Xp,k可以被表示为
Xp,k=q=1Q Xq,k1Wp,q,k+Bp,k
(1)
式中:Wp,q,kBp,k分别表示第k个卷积层的权重与偏置;Q是特征图数量;q为某个特征图的编号。卷积核的尺寸对模型性能有着较大影响,多通道数据在时间上的维度一般远大于空间上的维度,因此本文采用的卷积核尺寸与通道数相等。对于N通道的输入数据,卷积核尺寸设定为N×M,M的值则根据时间维度尺寸来合理设定。为了进一步融合特征,池化层通常被放置在卷积层之后,计算过程如下
Xp,km=fp(Xp,k-1h×(m-1)+s)
(2)
式中:fp表示池化操作,常用的池化操作包括均值和极大值,本文采用均值池化;hs分别表示池化区的移动步长和尺寸;m表示池化区域。在CNN模型中批量正则化层也常被应用以加速训练过程并提高鲁棒性,批量正则化层的输入记为 Xp,t-1m,其输出的计算过程如下
Yp,tm=γp,t·Xp,t-1m-μδσδ2+ε+δp,t
(3)
式中:μδδp,t分别为 Xp,t-1m的均值与方差;γp,t σδ2是待学习的参数;ε是一个常数。CNN模型可以将特征提取和故障诊断建模整合在一起,通过诊断误差优化模型参数,在故障诊断任务中具有良好的性能。

1.2 对抗生成网络

GAN是由一个判别器(Discriminator)和一个生成器(Generator)组成的深度学习模型[29]。生成器以服从高斯分布的随机噪声V为输入,通过多次上采样以生成与原始数据相似的样本,传递过程如下
X1=f(W1·V+B1)
(4)
Xk=f(Wk·Xk-1+Bk)
(5)
式中:WkBk分别代表第k层的权重与偏置;f(·)是非线性激活函数。判别器以生成数据和真实数据为输入,通过多次特征提取以获得输入样本为真的概率。在模型训练过程中,生成器以学习真实数据特征分布为目的,而判别器不断提升真实样本和生成样本的识别能力,通过这种对抗训练来获得接近真实数据的生成数据。生成器和判别器的损失函数可以被定义为
LG=-1Jj=1JlogOG
(6)
LD=-1Ii=1IlogOR- 1Jj=1Jlog(1-OG)
(7)
式中:OGOR分别是生成数据和真实数据输入判别器后得到的输出值。传统的GAN通过对抗训练能有效扩充少数样本,但对于多通道数据复杂的时空相关性和张量结构,传统GAN难以有效描述数据特征,需构造适用于多通道数据的少数样本增强与故障诊断模型。

2 基于多通道数据双层增强的故障诊断方法

2.1 模型整体结构

为了解决多通道数据结构复杂和少数样本故障难诊断的问题,本文提出了一种新的多通道数据增强和样本不平衡故障诊断模型。所提出模型具有两层次增强和全局优化的特点,共包括两个生成器(G1G2)、两个判别器(D1D2)和一个诊断器D3,整体结构如图1所示,图中实线为正向传播,虚线表示反向传递。对于获取到的多通道数据,首先采用经典CNN模型提取真实故障特征。生成器G1以随机噪声为输入,通过多层神经网络得到生成的故障特征,判别器D1用来评估真实特征和生成特征间差异。生成器G1和判别器D1共同实现特征层级的学习与生成。接着,生成器G2以生成的故障特征为输入,通过多层神经网络将其还原为单个通道数据,实现数据层级的增强。判别器D2用来评估生成数据与原始数据间差异,诊断器D3作为生成数据的故障诊断性能评估依据。整个模型通过合理设计的损失函数进行全局优化,在多个生成器和判别器的对抗训练中达到纳什平衡。
Fig.1 The overall structure of the proposed model

图1 所提模型整体结构

Full size|PPT slide

2.2 多通道数据增强

多通道数据具有复杂的时空相关结构,包括单个通道内的时序相关性和不同通道间的空间相关性,传统GAN难以有效描述多通道数据的复杂结构。基于此,本文提出两层级的多通道数据增强方法。第一层级是故障特征学习层,网络结构如图2所示。多通道数据首先被整合为张量结构,通过两个CNN模块进行特征提取,每个模块中包含卷积、批量正则化和池化操作,并采用线性整流函数(Rectified Linear Unit,ReLU)引入非线性条件。接着通过两层全连接神经网络进行特征融合与降维,采用Softmax函数获取不同故障的条件概率
P(ClX,θ)=P(X,θ/Cl)·P(Cl)k=1KP(X,θ/Ck)·P(Ck)
(8)
式中:θ表示模型参数;ClCk均为故障类型。通过交叉熵损失函数计算目标类别概率分布TX和实际类别概率分布OX间的差异,以优化模型参数
L(TX,OX)=-∑XTXlogOX
(9)
Fig.2 Fault feature learning network structure

图2 故障特征学习网络结构

Full size|PPT slide

在获得真实故障特征后,本文设计的生成器G1以随机噪声为输入,通过5层全连接神经网络进行升维。而判别器D1用来判断生成故障特征和真实情况间差异性。完成第一层级的故障特征学习后,本文构建了包含生成器、判别器和诊断器的多通道数据生成网络,结构如图3所示。生成器G2包含4层全连接神经网络,可以将生成的故障特征还原为单通道数据,并采用移动平均算法来平滑数据
xp'=1Hh=p-H-12p+H-12 xh
(10)
式中:x'p是平滑后的数据;H表示移动窗的尺寸;p是移动窗的中间位置点;xh是待平滑的数据。传统GAN中的生成器以单个通道数据相似性为目标,而忽视了多通道数据间的相关性。基于此,本文设计的判别器D2以还原后数据和真实数据为输入,采用最大均值差异(Maximum Mean Discrepancy,MMD)判据来评估不同通道间的数据分布差异
LD2(XS,XT)=1NSi=1NSϕ(xis)1NTj=1NTϕ(xjT)H2
(11)
式中:XS= {xsi}i=1,2,,nXT= {xTj}j=1,2,,n表示S通道和T通道的数据;φ(·)为映射函数。MMD判据可以度量数据在再生核希尔伯特空间H中的均值差异,对于模型的训练目标是使得生成数据与该通道真实数据间MMD值尽可能小,而与其他通道的真实数据间MMD值尽可能大,以实现对原始数据的有效还原。在扩充少数样本时,确保引入的样本能有效应用于故障诊断任务是十分重要的。因此本文构建基于故障诊断误差的诊断器D3,通过一维卷积操作从生成的数据中提取故障特征,并采用Softmax和交叉熵函数进行故障状态的识别。判别器D2和诊断器D3的引入确保还原后的数据不仅与目标样本接近,也具有良好的故障诊断性能。
Fig.3 Multi-channel data generation network structure

图3 多通道数据生成网络结构

Full size|PPT slide

2.3 全局优化策略

在所提出的深度学习模型中,共有两个生成器、两个判别器和一个诊断器需要被优化,优化目标包括:1)生成故障特征与真实特征间的差异最小化;2)生成数据与同通道真实数据间分布差异最小化;3)生成数据与不同通道真实数据间分布差异最大化;4)生成数据的故障诊断误差最小化。优化目标1-4的损失函数分别记为L1L2L3L4。其中,L1可通过式(6)计算得到,L2L3的值通过式(11)计算MMD判据得到,利用式(9)获取交叉熵值可得到L4。针对上述4个目标,本文提出了一种全局优化策略,具体流程如图4所示。首先,构建经典CNN模型,通过多层的卷积和池化操作提取原始多传感数据中的深层故障特征,采用基于交叉熵的故障诊断误差更新网络参数。接着,建立生成器G1,通过多层全连接网络将输入的随机噪声转化为故障特征,并构建判别器D1,以生成特征与真实特征为输入,以评估生成特征的真实性。然后,建立生成器G2,将生成的故障特征转化为单通道数据,构建判别器D2和诊断器D3分别用来评估生成数据与真实数据间差异以及在故障诊断中的性能。最后,在反向传播过程中,生成器G2同时受到数据间分布差异和故障诊断误差的影响,而生成器G1还会受到生成故障特征真实性的影响。因此,生成器G1G2的损失函数可以被表示为
L(G1)=λ1·L1+λ2·L2-λ3·L3+λ4·L4
(12)
L(G2)=λ5·L2-λ6·L3+λ7·L4
(13)
式中:λi(i=1,2,…,7)为权重系数。判别器D1D2采用真实性误差来更新,而诊断器D3与前面所述的经典CNN共享模型结构与参数。网络中的参数通过误差反向传播进行更新,而权重系数则是通过枚举法进行确定。当判别器和生成器在对抗竞争达到纳什平衡时,整个全局优化就完成了。所提出的全局优化方案可以使生成的少数样本数据不仅包含有效的故障特征,而且与原始数据的差异较小。与传统GAN相比,所提的两层级全局优化模型可以提高生成数据的质量,有效解决样本不平衡多通道数据的时空相关结构复杂和故障诊断性能差的问题。
Fig.4 Global optimization strategy

图4 全局优化策略流程

Full size|PPT slide

3 实验与结果分析

3.1 实验数据描述

为了验证所提出方法的有效性,本文以一个多工步锻压成形过程为例,分析对比不同方法在多通道数据增强和样本不平衡故障诊断任务中的性能。锻压工艺是利用模具施加压力使坯料发生形变的过程,在兵器制造、航空航天、冶金等领域有着广泛的应用。本文所采用的多工步锻压设备结构如图5所示,①②③④为安装在锻压机床的4个压力传感器,图5中共包含5个加工步骤:1)预成型;2)粗锻;3)终锻;4)冲孔;5)切边[30]。送料设备将工件依次送入每个工位进行加工,最终得到合格的成型产品。但是,若工件未能及时到达指定工位,就会发生缺件故障,造成缺少被加工件的工位上形成空冲,导致大量废品和经济损失,准确有效的故障诊断是解决这一问题的关键途径。本文将5个工位的缺件异常记为5种故障情况(即故障1-5)。
Fig.5 Multi-step forging machine and technological process

图5 多工步锻压设备结构与工艺流程

Full size|PPT slide

为了监测锻压过程,锻压设备的4个立柱上各安装了一个压力应变传感器。在每次锻压过程中,4个传感器同步采集压力数据,构成一组4通道数据。由于不同位置的缺件故障导致的空冲,在4通道压力数据上也显示出不同的趋势,5种故障和正常情况下的4通道压力数据如图6所示。本文共收集了653个样本,其中正常状态的样本308个,在每个故障情况各下采集了69个样本,本文选择部分数据作为训练集,剩余的数据用于测试。
Fig.6 Four-channel pressure data

图6 4通道压力数据

Full size|PPT slide

3.2 样本不平衡故障诊断结果分析

本章首先研究不同训练样本量对故障诊断性能的影响,针对5种故障类型均设置一个测试场景。在每种场景中,随机选取该类故障数据集10%、0%、240%、60%和80%的样本用作训练,其他故障和正常状态下均随机选择80%的样本作为训练集,剩余所有数据用于训练。训练模型选用经典CNN,将4通道压力数据整合为张量结构作为输入,采用多层卷积和池化运算提取故障特征,通过全连通层进行特征集成和降维,构建基于Softmax和交叉熵的损失函数实现多种故障模式的诊断。采用的经典CNN超参数与所提出模型中CNN部分相同,学习率设置为0.01,并随着迭代次数的增加而减小。
实验结果如图7所示,柱状图表示单个情况的诊断准确率,折线图表示整体准确率。由于正常工作状态下的样本量较大,因此在每个场景中,正常状态的诊断准确率为100%。随着训练样本量的减少,整体故障诊断的准确性不断降低。相比于其他故障模式,故障4-5的诊断性能对样本量更加敏感。其他故障的训练样本量也会影响故障4和5的诊断准确性。当故障1-3的训练样本比例从80%下降到10%时,故障1-3的诊断性能没有显著变化,但故障4-5的诊断准确率却发生了明显的下降。当故障4-5的训练集比例降为10%时,诊断准确率分别降至24.59%和45.16%。锻压机床通过5个工位的流水作业将工件成形,采用送料设备将工件输送至指定位置,一次锻压完成多道工序。当送料设备未将工件送入制定工位时,会导致锻压机床的缺件故障,缺少被加工件的工位上形成空冲,而其他工位上也会出现锻压力异常。当不同工位上发生缺件异常时,4个压力传感器会检测到不同的数据。预成型、粗锻和终锻过程会使得被加工件的形状产生非常显著的变化,由此造成压力数据变化也较强烈。因此,故障1-3与正常工况下的多通道数据差异较明显,故障1-3更容易被检测出来,即使训练样本量较少也能取得较高的诊断准确率。而冲孔和切边过程造成的工件形变并不显著,发生缺件异常时所产生的压力数据变化较为微弱,故障4-5与正常工况下的多通道数据差异不明显,导致这两类故障的诊断难度较高。
Fig.7 Fault diagnosis results of imbalanced sample

图7 样本不平衡故障诊断结果

Full size|PPT slide

3.3 所提方法性能分析

为了解决故障诊断任务中的样本不平衡问题,现有研究大多使用过采样或欠采样方法。但这两种传统方法均难以适合于多通道数据的处理。过采样方法难以描述多通道数据自身的复杂时空结构,而欠采样方法减少了正常状态的样本量,导致一类错误的增加。为了验证所提方法的有效性,本节分析多通道数据生成和故障诊断的性能。由于样本不平衡故障诊断场景中故障4的诊断精度最低,本节以故障4为例进行分析说明。
GAN作为新兴的数据生成方法,适用于单个传感数据的生成。但多通道数据的复杂时空结构,使得GAN难以有效地描述数据特征。图8展示了传统GAN和所提方法生成的多通道数据对比,展示数据是经过标准化处理的。为保证生成器和判别器间的有效竞争,真实标签的翻转概率设置为25%。从图中可以看出,传统GAN生成数据与真实数据的总体趋势相似,但很难准确描述生成数据的局部细节和故障特征,并且不同故障情况下的数据差异不明显。所提方法生成的多通道数据,无论是整体趋势还是局部细节都与真实情况更加接近。特别是在故障特征方面,生成的数据与真实情况也更加一致。为了量化生成数据和真实数据间的相似性,本文采用均方误差(Mean Square Error,MSE)进行定量评估:
MSE(XG,XR)=1Nn=1N(xGn-xRn)2
(14)
式中:XGXR分别表示生成数据和真实数据。传统GAN和所提模型得到的生成数据与真实数据间的MSE值如表1所示,与传统GAN相比,所提方法生成的数据在每个通道中MSE值均较小。为了说明数据分布差异评估机制的作用,本文进一步比较了生成的单通道数据与其他通道的原始数据间相似性,分析结果如表2所示。相比于其他通道,生成数据与本通道的原始数据间均方误差最小,数据的相似程度最高,所采用的分布差异评估机制能减小多通道数据相关性对数据生成过程的影响,有效保证生成数据的质量。
Fig.8 Multi-channel data generated by two methods

图8 两种方法生成的多通道数据

Full size|PPT slide

Table 1 MSE value between generated and real data

表1 生成数据和真实数据间MSE值

数据通道 传统GAN 所提方法
1 0.0331 0.0039
2 0.0361 0.0065
3 0.0531 0.0048
4 0.0540 0.0054
Table 2 MSE value between different channels

表2 不同通道数据间MSE值

生成数据 真实数据
通道1 通道2 通道3 通道4
通道1 0.0039 0.0167 0.0177 0.0109
通道2 0.0193 0.0065 0.0182 0.0159
通道3 0.0237 0.0185 0.0048 0.0103
通道4 0.0133 0.0178 0.0115 0.0054
在获取到多通道压力数据后,本文进一步分析所提方法在故障特征描述上的性能。通过生成器G1得到的故障特征如图9,可以看出生成的故障特征能准确有效地反映真实情况。将故障4情况下生成的多通道压力数据混合到原始数据集中,采用基于CNN的故障诊断模型提取故障特征,并通过t分布随机近邻嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)[31]算法对特征进行非线性降维。故障特征可视化结果如图10所示,生成的多通道数据中包含有效的故障特征,能有效区分故障4与其他情况,为高精度故障诊断提供了基础。
Fig.9 Generated fault feature

图9 生成的故障特征

Full size|PPT slide

Fig.10 Visualization of fault features based on the t-SNE

图10 基于t-SNE的故障特征可视化

Full size|PPT slide

3.4 不同方法性能对比

为了证明所提方法的有效性,本文对比经典的过采样方法和所提出方法在少数样本扩充和故障诊断中的性能。选用的对比方法包括随机过采样、合成少数类过采样(Synthetic Minority Over-sampling Technique,SMOTE)、自适应综合过采样(Adaptive Synthetic Sampling,ADASYN)和传统GAN[32-34]。SMOTE和ADASYN算法作为经典的过采样方法,能有效处理样本不平衡问题,近年来得到了较多的研究与应用。SMOTE算法通过在相临的两个少数样本间按照一定的规则插入新样本,以达到扩充样本的目的。ADASYN算法根据样本分布来确定少数样本用作新样本生成的频率,以减少样本分布不平衡的影响。GAN是近年来新兴的数据生成方法,通过生成器和判别器的对抗学习来生成接近原始少数样本的数据。本文首先采用上述方法将单个少数样本故障进行扩充,并通过经典CNN模型来实现故障诊断。表3展示了当故障1-5分别为少数样本时,采用不同方法进行样本扩充和故障诊断的结果,总体来说,所提方法在每种情况下均具有较高的诊断准确率。如上节所述,样本不平衡对故障1-3的诊断准确性影响较小。因此,当故障1-3为少数样本时,每种方法均能有效诊断。而故障4-5的诊断性能对样本量较敏感,当样本量下降时,其他方法的诊断性能均出现不同程度地下降,但所提方法仍能保持较高的诊断准确率。
Table 3 Diagnosis accuracy when Faults 1-5 are minority samples

表3 故障1-5分别为少数样本时的诊断准确率 %

对比方法 诊断准确率
故障1 故障2 故障3 故障4 故障5
随机过采样 99.25 98.88 100 89.14 98.88
SMOTE 99.63 99.63 100 89.89 93.26
ADASYN 99.63 99.63 100 90.26 91.76
传统GAN 99.63 99.63 100 97.75 99.25
所提方法 99.63 99.63 100 99.25 100
当故障4-5的样本量较小时,具体诊断结果的混淆矩阵分别如图11-图12所示,图中数字的单位是百分比。当故障4样本量较小时,通过传统过采样方法生成的故障数据均与正常样本发生了混淆。对于样本量小且难识别的故障类型,传统过采样方法难以要生成有效的数据。传统GAN具有较强的数据描述和生成能力,但在面对复杂多通道数据时,其诊断性能也会出现下滑,将20.69%的故障4样本误分为正常情况。相比于其他方法,所提方法的诊断性能更优,对故障4的诊断准确率达到93.1%。当故障5样本量减少时,所提方法仍然具有100%的诊断准确率。因此,对于难以识别的少数样本故障,所提方法具有较好的特征学习和数据生成能力,故障诊断准确率也显著高于其他方法。
Fig.11 Fault diagnosis result when Fault 4 samples are minority

图11 故障4为少数样本时的诊断结果

Full size|PPT slide

Fig.12 Fault diagnosis result when Fault 5 samples are minority

图12 故障5为少数样本时的诊断结果

Full size|PPT slide

在实际生产中常出现多种故障均为少数样本的情况,因此本文进一步分析故障4-5样本量均较少时的故障诊断性能。实验结果如表4所示,所提方法能有效扩充故障4-5的样本,二者的诊断准确率达到了93.10%和100%,整体诊断准确率为99.25%,均优于其他方法。随机过采样通过复制样本达到样本平衡,存在大量重复信息从而导致过拟合,难以有效地处理复杂多通道数据。SMOTE和ADASYN方法的性能略好于随机过采样。SMOTE通过k近邻插值生成新数据,但存在近邻居数量难确定和可能存在分布边缘化等问题。ADASYN根据密度分布调整样本大小,但在高维数据上性能较差。传统GAN的诊断准确率达到92.88%,但缺乏对多通道数据故障特征的学习,性能仍弱于所提方法。通过对上述实验结果的分析可知,无论单个还是多个故障为少数样本时,所提方法都能生成高质量的故障数据,在故障诊断任务中具有良好的性能。
Table 4 Diagnosis accuracy when Faults 4-5 are minority samples %

表4 故障4-5均为少数样本时的诊断准确率

状态 对比方法
随机过采样 SMOTE ADASYN 传统GAN 所提方法
故障1 100 100 100 100 100
故障2 100 100 100 100 100
故障3 100 100 100 100 100
故障4 10.34 10.34 17.24 79.31 93.10
故障5 13.79 48.28 41.38 93.10 100
正常 100 100 100 90.98 100
整体 80.90 84.64 84.64 92.88 99.25

4 结论

针对多通道数据复杂时空相关结构和故障样本量小的问题,本文提出了一种基于多通道数据双层增强的样本不平衡故障诊断新方法,通过实际案例验证了所提方法的有效性,得出以下主要结论:
1) 所提模型采用故障特征学习层级和多通道数据还原层级的双层增强策略,引入分布差异评估机制以准确描述不同通道间的数据相关性,有效生成与原始数据相似度高且包含丰富故障信息的多通道数据。
2) 本文设计的全局优化策略能有效对模型中多个生成器和判别器进行同步更新,通过多种优化目标的合理组合,能有效提高生成数据的质量与故障诊断性能。
3) 本文采用多工步锻压机床案例进行不同方法对比,实验结果表明在单个或多种故障样本量较小时,所提方法都具有最优的故障诊断性能,诊断准确率均能保持在99%以上。

References

[1]
ZHAO B, ZHANG X M, WU Q Q, et al. A novel unsupervised directed hierarchical graph network with clustering representation for intelligent fault diagnosis of machines[J]. Mechanical Systems and Signal Processing, 2023, 183:109615.
[2]
雷亚国, 贾峰, 孔德同, 等. 大数据下机械智能故障诊断的机遇与挑战[J]. 机械工程学报, 2018, 54(5):94-104.
Abstract
机械故障是风力发电设备、航空发动机、高档数控机床等大型机械装备安全可靠运行的“潜在杀手”。故障诊断是保障机械装备安全运行的“杀手锏”。由于诊断的装备量大面广、每台装备测点多、数据采样频率高、装备服役历时长,所以获取了海量的诊断数据,推动故障诊断领域进入了“大数据”时代。而机械智能故障诊断有望成为大数据下诊断机械装备故障的“一把利器”。与此同时,大数据给机械智能故障诊断的深入研究和应用提供了新的机遇:“数据为王”的学术思想有望成为主流、诊断整机或系统级对象成为可能、全面解析故障演化过程成为趋势等;但也遇到了新的挑战:数据大而不全呈“碎片化”、故障特征提取受制于人为经验、浅层诊断模型诊断精度低等。阐述了机械智能故障诊断大数据的特点;从信号获取、特征提取、故障识别与预测三个环节,综述了机械智能故障诊断的国内外研究进展和发展动态;指出了机械智能故障诊断理论与方法在大数据背景下的挑战;最后讨论了应对这些挑战的解决途径与发展趋势。
LEI Y G, JIA F, KONG D T, et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data era[J]. Journal of Mechanical Engineering, 2018, 54(5):94-104. (in Chinese)
Faults are a potential killer of large-scale mechanical equipment, such as wind power equipment, aircraft engines and high-end CNC machine. And fault diagnosis plays an irreplaceable role in ensuring the health operation of such equipment. Since the amount of the equipment diagnosed is great and the number of the sensors for the equipment is large, massive data are acquired by the high sampling frequency after the long-time operation of equipment. Such massive data promote fault diagnosis to enter the era of big data. And machinery intelligent fault diagnosis is a promising tool to deal with mechanical big data. In the big data era, new opportunities have been brought to intelligent fault diagnosis. For instance, data-centric academic thinking will become mainstream, it makes fault diagnosis in the system level possible, and a comprehensive analysis of faults becomes a trend. Meanwhile, new challenges have also been brought:the data are big but fragmentary, the fault feature extraction relies on much prior knowledge and diagnostics expertise, and the generalization ability of the shallow diagnosis model is weak. The characteristics of big data in intelligent fault diagnosis are discussed, and the inland and overseas research advances are reviewed from the three steps of intelligent fault diagnosis. The existing key problems of the current research in the era of big data are pointed out, and the approaches and research directions to these problems are discussed in the end.
[3]
ZHANG Z W, JIAO Z H, LI Y, et al. Intel ligent fa ult diag nosis of bearings driven by doub le-level data fusio n based on multic hannel sample fusion and f eature fusion un der time -varying speed conditions[J]. Reliability Engineering & System Safety, 2024, 251:11036.
[4]
邵海东, 李伟, 刘翊, 等. 时变转速下基于双阈值注意力生成对抗网络和小样本的转子-轴承系统故障诊断[J]. 机械工程学报, 2023, 59(12):215-224.
Abstract
可用故障数据的匮乏给时变转速下转子-轴承系统的端到端故障诊断带来严重挑战,生成对抗网络为解决小样本故障诊断问题提供新思路,但其仍存在梯度消失、全局关联特征学习能力较弱和训练效率较低等缺点。因此,提出一种双阈值注意力生成对抗网络,用于生成高质量的红外热成像图片,以解决时变转速下转子-轴承系统的小样本故障诊断难题。首先,结合Wasserstein距离和梯度惩罚设计新型对抗损失函数,避免训练过程中的梯度消失。其次,构建注意力嵌入的生成对抗网络以指导学习红外热成像图片的全局热力关联特征。最后,开发双阈值训练机制进一步提高生成样本质量和训练效率。将所提方法用于分析转子-轴承系统的实测红外热成像图片,结果表明,所提方法能辅助准确诊断时变转速及小样本下的不同故障模式,性能优于目前常用的生成对抗网络方法。
SHAO H D, LI W, LIU Y, et al. Fault diagnosis of rotor-bearing system under time-varying speeds by using dual-threshold attention-embedded GAN and small samples[J]. Journal of Mechanical Engineering, 2023, 59(12):215-224. (in Chinese)
End-to-end fault diagnosis of rotor-bearing system under time-varying speeds using a few samples is challenging. Despite generative adversarial network (GAN) provides a way to solve the problem of small-sample fault diagnosis, it still has some limitations, such as gradient vanishing, weak extraction of global correlation features, and low training efficiency. Therefore, a dual-threshold attention-embedded GAN is proposed for generating high-quality infrared thermal (IRT) images to solve small-sample fault diagnosis of rotor-bearing system under time-varying speeds. First, Wasserstein distance and gradient penalty are combined to design the new adversarial loss function to avoid gradient vanishing. Second, attention-embedded GAN is constructed to guide learn global thermal-correlation features of the IRT images. Finally, dual-threshold training mechanism is developed to further improve the generation quality and training efficiency. The proposed method is used to analyze the collected small IRT images of a rotor-bearing system, and the results show that the proposed method can accurately diagnosis different fault modes using small samples under time-varying speeds, which is superior to other popular GANs.
[5]
AZAMFAR M, SINGH J, INAKI B I, et al. Multisensor data fusion for gearbox fault diagnosis using 2-D convolutional neural network and motor current signature analysis[J]. Mechanical Systems and Signal Processing, 2020, 144:106861.
[6]
CHEN H P, HU N Q, CHENG Z, et al. A deep convolutional neural network based fusion method of two-direction vibration signal data for health state identification of planetary gearboxes[J]. Measurement, 2019, 146:268-278.
[7]
吴春志, 冯辅周, 吴守军, 等. 一种有效的不均衡样本生成方法及其在行星变速箱故障诊断中的应用[J]. 兵工学报, 2019, 40(7):1349-1357.
Abstract
针对实际运行中行星变速箱故障数据较少、各个状态样本不均衡的问题,提出了由Wasserstein生成式对抗网络(WGAN)样本生成模型和卷积神经网络(CNN)分类模型组合的WGAN-CNN故障诊断分类模型。该模型对故障数据的频谱信号进行过采样,以扩展故障样本数量,从而更好地对故障状态进行分类。采用加州大学欧文分校人工数据集对WGAN生成模型以及经典过采样方法进行对比,并在行星变速箱故障试验台上进行验证。结果表明,样本不均衡会严重影响分类结果,而WGAN-CNN模型可以很好地扩充故障样本集,提高在故障样本稀少情况下的诊断准确率。
WU C Z, FENG F Z, WU S J, et al. An effective method for imbalanced sample generation and its application in fault diagnosis of planetary gearbox[J]. Acta Armamentarii, 2019, 40(7):1349-1357. (in Chinese)
A fault diagnosis classification model based on WGAN-CNN is proposed for few fault data of planetary gearbox and the imbalanced samples of each state in actual operation. The proposed model is a combination of Wasserstein generative adversarial network (WGAN), a sample generation model, a convolutional neural network (CNN), and a sample classification model. The model is used to oversample the spectral signals of fault data and expand the number of fault samples, thus classifying the fault states better. UCI artificial datasets were used to compare WGAN generation model and classical oversampling methods, and verified on a planetary gearbox fault test rig. The results show that the imbalanced samples seriously affect the classification results, and the WGAN-CNN model can well expand the fault sample datasets and improve the diagnostic accuracy in the case of rare fault samples. Key
[8]
GUO Y M, ZHOU Y F, ZHANG Z S. Fault diagnosis of multi-channel data by the CNN with the multilinear principal component analysis[J]. Measurement, 2021, 171:108513.
[9]
SHI J C, PENG D K, PENG Z X, et al. Planetary gearbox fault diagnosis using bidirectional-convolutional LSTM networks[J]. Mechanical Systems and Signal Processing, 2022, 162:107996.
[10]
ZHANG S, LIU Z W, CHEN Y P, et al. Selective kernel convolution deep residual network based on channel-spatial attention mechanism and feature fusion for mechanical fault diagnosis[J]. ISA Transactions, 2023, 133:369-383.
[11]
徐鹏, 皋军, 邵星. 基于AMCNN-BiGRU的滚动轴承故障诊断方法研究[J]. 振动与冲击, 2023, 42(18):71-80.
XU P, GAO J, SHAO X. Fault diagnosis method for rolling bearings based on AMCNN-BiGRU[J]. Journal of Vibration and Shock, 2023, 42(18):71-80. (in Chinese)
[12]
何强, 唐向红, 李传江, 等. 负载不平衡下小样本数据的轴承故障诊断[J]. 中国机械工程, 2021, 32(10):1164-1171.
HE Q, TANG X H, LI C J, et al. Bearing fault diagnosis method based on small sample data under unbalanced loads[J]. China Mechanical Engineering, 2021, 32(10):1164-1171. (in Chinese)
[13]
QIN Y, LIU H Y, WANG Y, et al. Inverse physics-informed neural networks for digital twin-based bearing fault diagnosis under imbalanced samples[J]. Knowledge-Based Systems, 2024, 292:111641.
[14]
PENG P, ZHANG W J, ZHANG Y, et al. Cost sensitive active learning using bidirectional gated recurrent neural networks for imbalanced fault diagnosis[J]. Neurocomputing, 2020, 407:232-245.
[15]
HE H, Garcia A. Learning from imbalanced data[J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(9):1263-1284.
[16]
WU Z Y, ZHANG H K, GUO J C, et al. Imbalanced bearing fault diagnosis under variant working conditions using cost-sensitive deep domain adaptation network[J]. Expert Systems with Applications, 2022, 193:116459.
[17]
张玉彦, 张永奇, 孙春亚, 等. 不平衡样本下基于生成式对抗网络的风机叶片开裂状态识别[J]. 计算机集成制造系统, 2023, 29(2):532-543.
ZHANG Y Y, ZHANG Y Q, SUN C Y, et al. Identification method of cracking state of wind turbine blade based on GAN under imbalanced samples[J]. Computer Integrated Manufacturing Systems, 2023, 29(2):532-543. (in Chinese)
[18]
REN Z J, ZHU Y S, KANG W, et al. Adaptive cost-sensitive learning:improving the convergence of intelligent diagnosis models under imbalanced data[J]. Knowledge-Based Systems, 2022, 241:108296.
[19]
REN J J, WANG Y P, CHEUNG Y M, et al. Grouping-based oversampling in kernel space for imbalanced data classification[J]. Pattern Recognition, 2023, 133:108992.
[20]
GOODFELLOW I, POUGET-ABADIE J, MIRZA M, et al. Gener-ative adversarial nets[J]. Advances in Neural Information Processing Systems, 2014, 27:2672-2680.
[21]
PAN T Y, CHEN J L, ZHANG T C, et al. Generative adversarial network in mechanical fault diagnosis under small sample:a systematic review on applications and future perspectives[J]. ISA Transactions, 2022, 128 Part B:1-10.
[22]
GUO Z Q, PU Z Q, DU W L, et al. Improved adversarial learning for fault feature generation of wind turbine gearbox[J]. Renewable Energy, 2022, 185:256-266.
[23]
LIU Y P, JIANG H K, WANG Y F, et al. A conditional variational autoencoding generative adversarial networks with self-modulation for rolling bearing fault diagnosis[J]. Measurement, 2022, 192:110888.
[24]
郭伟, 邢晓松. 基于改进卷积生成对抗网络的少样本轴承智能诊断方法[J]. 中国机械工程, 2022, 33(19):2347-2355.
GUO W, XING X S. Intelligent fault diagnosis of bearings with few samples based on an improved convolutional generative adversarial network[J]. China Mechanical Engineering, 2022, 33(19):2347-2355. (in Chinese)
 Few bearing samples usually led to inadequate learning and low diagnosis accuracy. To solve this problem, an improved convolutional generative adversarial network was constructed. It made full use of data generation ability of the GAN and learning ability of deep CNN, so that the intelligent fault diagnosis might be conducted for the bearings with few samples under varying working conditions. First, a deep convolutional GAN was constructed. The deep features in few real data were mined through adversarial learning between the generator and discriminator of GAN, and then the generator might generate simulated data exactly like real one to make up for the lack of very few samples. Then, the dense block and dilated convolutions were combined with the CNN, named as DDCNN, to improve the learning ability by extending the network depth and perception range. As a result, the DDCNN may identify tiny differences in multi-class datasets and enhance feature extraction. Finally, the proposed method was verified by using bearing datasets with few samples under fixed conditions and varying rotating speeds, and was compared with other frameworks. The experimental results indicate that DDCNN has higher diagnosis accuracy for bearings with few samples and noisy conditions. 
[25]
WANG Y R, SUN G D, JIN Q, et al. Imbalanced sample fault diagnosis of rotating machinery using conditional variational auto-encoder generative adversarial network[J]. Applied Soft Computing, 2020, 92:106333.
[26]
YAN H, PAYNABAR K, SHI J J. Real-time monitoring of high-dimensional functional data streams via spatio-temporal smooth sparse decomposition[J]. Technometrics, 2018, 60(2):181-197.
[27]
SHI J J. In-process quality improvement:Concepts,methodologies,and applications[J]. IISE Transactions, 2022, 55(1):2-21.
[28]
LECUN Y, BOSER B E, DENKER J, et al. Handwritten digit recognition with a back-propagation network[J]. Advances in Neural Information Processing Systems, 1989, 2:396-404.
[29]
李晓雄, 张淑宁, 赵惠昌, 等. 基于1DC-CGAN和小波能量特征的引信小样本地形目标识别[J]. 兵工学报, 2022, 43(10):2545-2553.
LI X X, ZHANG S N, ZHAO H C, et al. Identification of fuzzy small-sample terrain targets based on 1 DC-CGAN and wavelet energy features[J]. Acta Armamentarii, 2022, 43(10):2545-2553. (in Chinese)
[30]
LEI Y, ZHANG Z S, JIN J H. Automatic tonnage monitoring for missing part detection in multi-operation forging processes[J]. Journal of Manufacturing Science and Engineering, 2010, 132(5):051010.
[31]
VAN DER MAATEN L, HINTON G. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9:2579-2605.
[32]
REZVANI012-11 S, WANG X Z. A broad review on class imbalance learning techniques[J]. Applied Soft Computing, 2023, 143:110415.
[33]
CHAWLA N V, BOWYER K W, HALL L O, et al. SMOTE:Synthetic minority over-sampling technique[J]. Journal Artificial Intelligence Research, 2002, 16:321-357.
[34]
HE H B, BAI Y, GARCIA E A, et al. ADASYN:Adaptive synthetic sampling approach for imbalanced learning[C] // Proceedings of the IEEE International Joint Conference on Neural Networks.Hong Kong, China:IEEE, 2008:1322-1328.
PDF(12376 KB)

20

Accesses

0

Citation

Detail

Sections
Recommended

/