摘要
机械设备实际运行中的工况具有时变性,这加剧了源域(训练集)和目标域(测试集)数据之间的分布差异,因而导致智能故障诊断模型的性能下降。提出了一种基于深度对比迁移学习的方法,可用于机械设备变工况下的故障智能诊断。利用多层卷积块作为模型前置特征提取器,能够有效提取原始振动数据的代表性特征,提升故障分类器和域判别器的诊断性能。将前置特征提取器提取的特征传递给特征融合器,特征融合器提炼并联接局部感受野和全局感受野卷积特征,增强模型特征表达能力。将特征融合器提炼的特征用于故障分类器和域判别器诊断不同工况下的机械故障,并在故障分类器中使用Wasserstein 距离度量源域和目标域数据的差异,基于互信息噪声对比估计提出用于工况区分的互信息对比域判别器,提高模型的迁移诊断性能。将所提方法用于诊断变工况下不同类别的轴承、齿轮故障。结果表明,所提方法能够有效实现变工况下轴承、齿轮故障的迁移诊断。
关键词
随着现代社会的不断发展,机械设备广泛应用于各行各业,轴承、齿轮是机械设备中不可或缺的组件。由于机械设备多运行在复杂恶劣的环境中,轴承、齿轮极易受损,导致机械设备发生故障,甚至造成重大安全事
智能故障诊断技术推动了机械设备健康监测领域的发展,尤其是深度学习和大数据时代的到来,将智能故障诊断推向了更加快速的发展轨
尽管深度学习在机械故障诊断领域已经取得了显著的成就,但是其应用需要满足一个假设:源域和目标域的数据符合近似的分布关系。然而,在实际工程中,机械设备的工作状况是实时变化的,导致采集到的振动数据随时间而变化,而复杂恶劣的工作环境使测得的振动数据更加具有随机性,致使源域和目标域的数据存在着严重的数据分布差异,深度学习模型无法发挥性
LI
综上所述,针对轴承、齿轮振动信号多工况时变的迁移诊断任务,提出了一种基于深度对比迁移学习的智能机械故障诊断模型,充分利用此模型提取的特征信息,用于变工况下不同类型故障的识别。使用多层卷积块提取原始振动信号特征并构建局部感受野和全局感受野特征集,增强模型的特征表达能力,采用Wasserstein距离度量源域和目标域数据的分布差异用于提高模型的迁移能力,利用互信息噪声对比估计区分源域和目标域工况。所提方法的有效性在变工况的轴承、齿轮实验数据中得到验证。
迁移学习问题有两个基本概念:领域和任
机械故障迁移学习任务:所提方法针对轴承、齿轮运行工况变化的问题,以一种工况下采集的数据为源域,其他工况下采集的数据为目标域。利用神经网络学习源域数据和标签之间的函数映射关系,并将这一关系迁移到目标域数据,完成目标域数据的识别。
卷积神经网络在机械故障诊断领域应用广泛,通常由卷积层、池化层、全连接层组成,能够完成分类、预测等任
(1) |
式中 X为输入样本;为偏差;为卷积核权重;表示激活函数;表示卷积运算。
池化层的作用是对卷积层提取出来的特征进行信息过滤和缩放,能够减少模型的参数数量,保留有效特征,加速模型收敛速度并防止过拟合现象的发生。池化运算将特征映射到互不相干的区域,由此保留输入样本有用的信息。最大池化被采用,得到池化特征图:
(2) |
上式满足,和表示池化操作沿水平和垂直方向的步长,和表示池化窗的长度和宽度。
最大均值差异(Maximum Mean Discrepancy, MMD)是迁移学习中最常使用的度量方式,用于衡量源域和目标域数据的距离,构建约束使得不同领域数据分布更加近似。但是由于其利用核函数的方法进行计算,在网络更新参数过程中梯度计算复
(3) |
式中 为变量的联合分布;为变量的边缘分布;为变量的边缘分布。
模型由特征提取器、特征融合器、域判别器和故障分类器组成,为了更加直观地展现模型结构以及内部信息的传输方式,设计的智能故障诊断模型如
(5) |
式中 表示由特征融合层得到的全局特征的表征函数;表示由特征融合层得到的局部特征表征函数;两者求点积是对

图1 模型结构
Fig. 1 The structure of model
故障分类器由两层卷积层、两层池化层和三层全连接层组成,每层卷积层和全连接层使用ReLU作为激活函数,卷积层用以充分提取可分辨的不同类健康状况信息。故障分类器使用Softmax函数对最后一层网络的输出做处理,完成故障分类,因此使用交叉熵作为分类损失函数。交叉熵损失定义为:
(6) |
式中 表示符号函数,如果样本的真实标签等于,则,否则;表示样本经由Softmax后输出的概率值;表示样本数量;表示类别的数量。
故障分类器利用Wasserstein距离度量源域数据和目标域数据的距离,约束数据分布,实现知识迁移。因此,模型的损失函数共由三部分组成:互信息噪声对比估计、交叉熵损失和Wasserstein距离。模型整体损失定义为:
(7) |
式中 。
模型各个单元的参数如
模型 单元 | 单元结构 | 参数 | 参数 数量 |
---|---|---|---|
特征 提取器 | 输入样本大小 | 32×32 | - |
第一卷积层输入输出通道数/卷积核大小 | (1,16)/3×3 | 160 | |
第一池化层池化窗大小/步长 | 2×2/2 | - | |
第二卷积层输入输出通道数/卷积核大小 | (16,32)/3×3 | 4640 | |
第二池化层池化窗大小/步长 | 2×2/2 | - | |
特征 融合器 | 局部信息提取卷积通道数/卷积核大小 | (32,32)/1×1 | 1056 |
全局信息提取卷积通道数/卷积核大小 | (32,32)/8×8 | 65568 | |
故障 分类器 | 第一卷积层输入输出通道数/卷积核大小 | (64,32)/3×3 | 18464 |
第一池化层池化窗大小/步长 | 2×2/2 | - | |
第二卷积层输入输出通道数/卷积核大小 | (32,16)/3×3 | 4624 | |
第二池化层池化窗大小/步长 | 2×2/2 | - | |
第一全连接层输入输出单元数 | (64,32) | 2048 | |
第二全连接层输入输出单元数 | (32,16) | 512 | |
第三全连接层输入输出单元数 | (16,4) | 64 |
将融合特征输入到全连接网络的参数数量(数值为262144)与
深度对比迁移学习方法充分利用有标签的训练集和无标签的测试集数据完成故障诊断任务,具体故障诊断流程如

图2 故障识别流程图
Fig. 2 The flow chart of fault identification
表述如下:
1)采集轴承、齿轮的振动数据,将原始振动数据划分为训练集和测试集。
2)构建模型结构,将有标签的训练集和无标签的测试集同时输入网络,由特征提取器提取特征,使用特征融合层将局部全局特征进行融合。
3)融合后的特征输入域判别器和故障分类器,分别进行工况区分和故障识别,利用模型输出计算损失,并反向传播更新模型参数。
4)模型训练完毕后,将无标签测试集输入训练好的模型进行故障分类,获得最终的诊断结果。
建立了如

图3 轴承故障模拟实验台
Fig. 3 The fault test bench of bearing
迁移任务 | 源域 | 目标域 | 标签 |
---|---|---|---|
T0 |
A-N A-IF A-OF A-BF |
B-N C-IF B-OF C-BF |
1 2 3 4 |
T1 |
A-N A-IF A-OF A-BF |
C-N B-IF C-OF B-BF |
1 2 3 4 |


图4 不同转速下部分轴承样本波形图
Fig. 4 The waveform of some bearing samples under different rotating speeds
为了对比互信息噪声对比和Wasserstein距离对深度对比迁移学习模型性能的影响,使用无互信息噪声对比估计方法(记作方法1,去除互信息噪声对比估计)、MMD方法(记作方法2,使用MMD代替Wasserstein距离)和所提方法(记作方法3)设计了消融实验。其中,两种方法均使用与所提方法相同的模型结构和训练流程,不同的是:无互信息噪声(特征融合器仅用作互信息噪声对比估计的使用)直接将特征提取器提取的特征用于域判别器和故障分类器,且域判别器使用交叉熵损失。
目前,在机器学习领域,超参数的确定没有一个系统的参照方法,且其并不是重点讨论对象。因此针对三种方法比较重要的超参数、学习率和批量处理大小,使用网格搜索和以往设计经验进行确定,即学习率的搜索范围为[1.0,0.1,0.01,0.001,0.0001],批量处理大小的搜索范围为[5,10,20]。最终确定的模型参数如
方法 | 学习率 | 批量处理大小 |
---|---|---|
1 | 0.0001 | 20 |
2 | 0.0001 | 20 |
3 | 0.0001 | 20 |
三种方法的迁移诊断结果如
迁移任务 | 三种方法迁移准确率/% | ||
---|---|---|---|
1 | 2 | 3 | |
T0 | 85.75 | 94.75 | 100.00 |
T1 | 87.25 | 92.25 | 100.00 |

图5 轴承实验迁移诊断结果
Fig. 5 The transfer diagnosis result of bearing experiment
由迁移诊断结果分析,Wasserstein距离和互信息噪声对比估计的使用均提高了模型的迁移故障诊断能力。其中所提方法与无互信息噪声对比估计的方法对比,表明互信息噪声对比估计能够充分反映数据之间的信息交互情况,将源域和目标域样本信息区分开来,提高了模型的迁移故障诊断能力;所提方法与MMD方法对比结果表明Wasserstein距离的表现优于MMD距离,证明了其在迁移学习方面的有效性;而方法2的准确率在两个迁移任务中的表现均优于方法1,证明了互信息噪声对比估计对模型性能的影响大于Wasserstein距离。
为了能够直观地观察深度对比迁移学习模型的迁移效果,将模型输出层的特征使用等距特征映射(Isometric Feature Mapping,Isomap)方法进行可视化。三种方法的可视化效果对比如

图6 迁移诊断结果可视化
Fig. 6 Visualizations of the transfer results
为了进一步验证所提方法的有效性,使用行星传动系统故障模拟实验台获取行星轮故障数据集,实验台如

图7 行星传动系统故障模拟实验台图
Fig. 7 The fault test bench of planetary gear transmission system
迁移任务 | 源域 | 目标域 | 标签 |
---|---|---|---|
T2 |
D-正常 D-剥落 D-裂纹 D-磨损 |
E-正常 F-剥落 E-裂纹 F-磨损 |
1 2 3 4 |
T3 |
D-正常 D-剥落 D-裂纹 D-磨损 |
F-正常 E-剥落 F-裂纹 E-磨损 |
1 2 3 4 |
为了验证深度对比迁移学习模型的有效性,使用流行的迁移成分分
三种方法的迁移诊断平均准确率如
迁移任务 | 三种方法迁移平均准确率/% | ||
---|---|---|---|
TCA | DANs | 所提方法 | |
T2 | 46.75 | 91.93 | 99.95 |
T3 | 48.00 | 91.88 | 100.00 |
从

图8 不同方法训练迭代过程图
Fig. 8 The iteration process of different methods
为了证明所提方法的稳定性,分别计算了三种方法测试结果的标准差,如
迁移任务 | 三种方法迁移诊断标准差 | ||
---|---|---|---|
TCA | DANs | 所提方法 | |
T2 | 0 | 4.6794 | 0.1054 |
T3 | 0 | 2.0556 | 0 |
提出一种基于深度对比迁移学习的机械设备故障诊断方法,旨在完成机械设备在变工况下的迁移诊断任务,主要得到以下结论:
(1) 模型使用特征融合器,充分利用了特征提取器提取特征的局部信息和全局信息,增强了模型的特征表达能力,提高了模型故障诊断的准确度。
(2) Wasserstein距离的采用提高了模型的迁移能力,使得模型将在源域学习到的知识迁移到目标域,有效完成了目标域无标签样本的故障诊断。
(3) 互信息噪声对比估计能够将源域和目标域样本之间信息的差异准确地区分,从而将源域和目标域数据集对应的不同工况分离开,提高了模型的迁移诊断能力。
(4) 模型在轴承和齿轮实验案例上均表现出了良好的迁移诊断性能,具备较好的泛化能力。
参考文献
李巍华, 单外平, 曾雪琼. 基于深度信念网络的轴承故障分类识别[J]. 振动工程学报, 2016, 29(2): 340-347. [百度学术]
Li W H, Shan W P, Zeng X Q. Bearing fault identification based on deep belief network[J]. Journal of Vibration Engineering, 2016, 29(2): 340-347. [百度学术]
张坤, 胥永刚, 马朝永, 等. 经验快速谱峭度及其在滚动轴承故障诊断中的应用[J]. 振动工程学报, 2020, 33(3): 636-642. [百度学术]
Zhang Kun, Xu Yonggang, Ma Chaoyong, et al. Empirical fast kurtogram and its application in rolling bearing fault diagnosis[J]. Journal of Vibration Engineering, 2020, 33(3): 636-642. [百度学术]
雷亚国, 贾峰, 周昕, 等. 基于深度学习理论的机械装备大数据健康监测方法[J]. 机械工程学报, 2015, 51(21): 49-56. [百度学术]
LEI Yaguo, JIA Feng, ZHOU Xin, et al. A deep learning-based method for machinery health monitoring with big data[J]. Journal of Mechanical Engineering, 2015, 51(21):49-56. [百度学术]
DIBAJ A, ETTEFAGH M M, HASSANNEJAD R, et al. A hybrid fine-tuned VMD and CNN scheme for untrained compound fault diagnosis of rotating machinery with unequal-severity faults[J]. Expert Systems with Applications, 2021, 167: 114094. [百度学术]
YAN X A, LIU Y, JIA M P. Multiscale cascading deep belief network for fault identification of rotating machinery under various working conditions[J]. Knowledge-Based Systems, 2020, 193: 105484. [百度学术]
CHENG Y W, LIN M X, WU J, et al. Intelligent fault diagnosis of rotating machinery based on continuous wavelet transform-local binary convolutional neural network[J]. Knowledge-Based Systems, 2021, 216: 106796. [百度学术]
LI C, ZHANG S, QIN Y, et al. A systematic review of deep transfer learning for machinery fault diagnosis[J]. Neurocomputing, 2020, 407: 121-135. [百度学术]
ZHAO K, JIANG H K, WANG K, et al. Joint distribution adaption network with adversarial learning for rolling bearing fault diagnosis[J]. Knowledge-Based Systems, 2021, 222: 106974. [百度学术]
王肖雨, 童靳于, 郑近德, 等. 基于流形嵌入分布对齐的滚动轴承迁移故障诊断方法[J]. 振动与冲击, 2021, 40(8): 110-116. [百度学术]
WANG Xiaoyu, TONG Jinyu, ZHENG Jinde, et al. Transfer fault diagnosis for rolling bearings based on manifold embedded distribution alignment[J]. Journal of Vibration and Shock, 2021, 40(8): 110-116. [百度学术]
陈仁祥, 吴昊年, 张霞, 等. 子空间嵌入特征分布对齐的不同工况下旋转机械复合故障诊断[J]. 机械工程学报, 2021, 57(2): 21-29. [百度学术]
CHEN Renxiang, WU Haonian, ZHANG Xia, et al. Compound fault diagnosis of rotating machinery under different conditions based on subspace embedded feature distribution alignment[J]. Journal of Mechanical Engineering, 2021, 57(2): 21-29. [百度学术]
ZOU Y S, LIU Y Z, DENG J L, et al. A novel transfer learning method for bearing fault diagnosis under different working conditions[J]. Measurement, 2021, 171: 108767. [百度学术]
LI X, ZHANG W, MA H, et al. Domain generalization in rotating machinery fault diagnostics using deep neural networks[J]. Neurocomputing, 2020, 403: 409-420. [百度学术]
DING Y F, ZHUANG J C, DING P, et al. Self-supervised pretraining via contrast learning for intelligent incipient fault detection of bearings[J]. Reliability Engineering and System Safety, 2022, 218: 108126. [百度学术]
LI X D, HU Y, LI M T, et al. Fault diagnostics between different type of components: a transfer learning approach[J]. Applied Soft Computing, 2019, 86: 105950. [百度学术]
YANG B, LEI Y G, JIA F, et al. An intelligent fault diagnosis approach based on transfer learning from laboratory bearings to locomotive bearings[J]. Mechanical Systems and Signal Processing, 2019, 122: 692-706. [百度学术]
LONG Y Y, ZHOU W N, LUO Y. A fault diagnosis method based on one-dimensional data enhancement and convolutional neural network[J]. Measurement, 2021, 180: 109532. [百度学术]
CHENG C, ZHOU B T, MA G J, et al. Wasserstein distance based deep adversarial transfer learning for intelligent fault diagnosis with unlabeled or insufficient labeled data[J]. Neurocomputing, 2020, 409: 35-45. [百度学术]
CHEN X C, YAO L N, ZHOU T, et al. Momentum contrastive learning for few-shot COVID-19 diagnosis from chest CT images[J]. Pattern Recognition, 2021, 113: 107826. [百度学术]