摘要:自动特征提取在机械系统智能状态监测中起着至关重要的作用,可以自适应地从原始数据中学习特征并发现新的状态敏感特征。本文重点研究了不同深度的卷积神经网络(CNN)模型在没有先验知识的情况下从激励响应信号中挖掘代表信息和敏感特征的能力,并将螺栓连接结构的特征提取和装
自动特征提取在机械系统智能状态监测中起着至关重要的作用,可以自适应地从原始数据中学习特征并发现新的状态敏感特征。本文重点研究了不同深度的卷积神经网络(CNN)模型在没有先验知识的情况下从激励响应信号中挖掘代表信息和敏感特征的能力,并将螺栓连接结构的特征提取和装配紧度分类过程融合在一起。
通过车架试验台螺栓连接转子激振实验数据验证该方法的有效性。结果表明,CNN方法自适应学习的特征可以表示信号与装配状态之间的复杂映射关系,并且比其他方法具有更高的准确率。
螺栓连接具有可靠性高、承载能力强、使用维护简便等优点,被广泛应用于航空航天、核能、土木等工程领域中。由于受到振动、冲击和高温蠕变等影响,机械螺栓连接结构可能出现滑动、分离甚至脱落,从而影响结构的安全性能和使用性能;甚至导致结构出现失效引起灾难性的后果。
尤其是对于那些工作在恶劣环境下的螺栓,其松紧程度和疲劳损伤往往难以直接判断,或者其松紧情况经常被忽视。为了避免灾难性后果,对螺栓装配紧度进行在线监测及评估显得尤为重要。
智能监测评估方法由于其自适应学习机制、强大的容错能力和非线性回归能力而被广泛用于复杂问题,包括状态监测和故障诊断。一般情况下,智能监测评估方法包括3个主要步骤:1)信号采集;2) 特征提取;3) 状态分类。在信号采集步骤中,包括振动、声学、电流、速度和温度等。
在第二步中,通过信号处理技术和降维技术(如傅里叶频谱分析,小波变换)从原始信号中提取和选择状态敏感特征。在状态分类步骤中,通过智能分类技术(如反向传播神经网络(BPNN),支持向量机(SVM) ) ,基于提取的特征对健康状况进行诊断。
余坚等通过拉杆转子装配振动检测试验获取振动响应信号,运用分形理论分析试验结果,分别计算三种螺栓预紧状态下矩形盒维数及多重分形谱参数,利用重分形谱参数为SVM特征向量对拉杆转子装配状态进行模式识别。 叶亮等研究了锆钛酸铅PZT)压电陶瓷对于螺栓松动的监测能力,探讨了合适的螺栓松动系数,并利用分布式 PZT进行机械螺栓组的松动监测,在此基础上引入了BPNN方法实现对螺栓组单个或两个螺栓松动的精确定位。
传统的智能方法诸如(BPNN、SVM)已经被应用于螺栓装配紧度评估问题上,但依旧存在不足:传统方法的辨识性能很大程度上依赖于所选择的特征,而不同属性的故障差异性特征难以数字化精准表征且过于依赖专家经验,而且BPNN和SVM属于浅层网络,难以有效学习复杂非线性关系。因此,需要从原始信号中自主学习数据特征并训练深层结构,深度学习作为一种自主学习数据特征的新颖机器学习方法,摆脱了对特征工程的依赖,具有克服传统人工智能方法缺点的潜在能力。
卷积神经网络是深度学习方法的一种,应用于图像视频、时间序列信号等。Ince等提出了用于电机故障检测的一维CNN它将特征提取和分类任务结合到一个网络中。Guo等提出了一种用于轴承故障诊断的分层自适应深度卷积神经网络,实现了故障模式识别和故障尺寸评估。Zhang等提出了一种带有训练干扰的CNN ,可以处理原始噪声数据和不同工作载荷下的轴承故障诊断。Pan等提出了一种新的深度学习网络LiftingNet可应用于不同转速下获取的机械数据的故障分类,扩大了应用范围,Chen等提出了一种基于CNN的振动测量深度学习技术来诊断齿轮箱的故障模式。
综上所述,卷积神经网络在轴承、齿轮等机械零件的智能诊断中取得了良好效果,其分类性能不依赖于问题领域的先验知识,不受专家定制选择特征的影响。然而,基于CNN的特征学习的智能诊断研究未充分关注不同深度的卷积神经网络模型的性能。
螺栓连接结构是结构完整性与安全性的最重要组成部分之一,将CNN应用于螺栓连接结构装配紧度的特征学习和智能监测具有重要意义。本文应用CNN来学习激励响应信号数据的特征,并诊断螺栓连接结构的松紧状况。将所提出的CNN方法与支持向量机方法及深层去噪自编码器方法 进行比较分析。此外,还讨论了CNN几个关键参数的选择对检测结果的影响。
一、理论分析
1.1 重叠采样
数据集增强技术即通过增加训练样本,以达到增强深度神经网络泛化性能的目的。本文提出的数据增强方式是重叠采样,即从原始信号中采集训练样本时,每一段信号与其后一段信号之间是有重叠的。而对于测试样本?采集时没有重叠。
1.2 卷积神经网络
卷积神经网络是一个多层的神经网络,由交替连接的卷积层和池化层、全连接层组成,CNN最大的特点在于卷积的权值共享结构,可以大幅减少神经网络的参数量,防止过拟合的同时又降低了神经网络的复杂度。
1.2.1 卷积操作
卷积层使用卷积核对输入信号的局部区域进行卷积,然后由激活单元随后生成输出特征。一个卷积核对应下一层中的一个特征图,特征图的数量称为该层的深度。使用Kil来表示第l层中第i个卷积核的权值,并用xl(rj)来表示第l层中的第j个局部区域,卷积过程可描述为
式中:符号*代表卷积核和局部区域的卷积操作;w是卷积核的宽度;KilK(j′)代表j′-th的权值。
1.2.2 整流线性激活函数
整流线性激活函数(ReLU) 是一个简单的非线性函数al(i,j)=max(0,zl(i,j)),它在坐标轴上是一条折线,当zl(i,j) ≤0时,al(i,j)=0;当zl(i,j) >0时,al(i,j)=zl(i,j),而zl(i,j)是批量归一化的输出。ReLU可以很好的传递梯度,经过多层的反向传播,梯度依旧不会大幅缩小,因此非常适合训练很深的神经网络。
1.2.3 全连接层
在卷积层和池化层几层交替之后,使用普通的全连接层来产生网络的输出。其计算过程为
式中:cl(i,j)为全连接层的输出;W;为全连接层的权值矩阵;pl(i,j)为池化层的输出;bl(i,j)为偏置。而非线性激活函数f通常是ReLU、Sigmoid等函数。
1.2.4 批量归一化加速网络收敛
批量归一化(Batch normalization,BN)是一个自适应的重参数化的方法,试图解决训练非常深的模型的困难。批量归一化会对卷积层或全连接层的结果减去均值,除以标准差,由βl(i)和γl(i)重新缩放,得到zl(i,j)。之后再应用激活函数得到第l层的输出。批量归一化可以应用于网络的任何输入层或隐藏层,其具体计算过程为
式中:m为一次训练中的样本数目;ε为一个很小的常数;加上它是为了数值稳定性;βl(i)和 γl(i)为控制数据的均值和方差。
二、卷积神经网络模型及螺栓装配紧度辨识过程
2.1 模型结构
本文提出的卷积神经网络模型如表1所示。
2.2 螺栓装配紧度辨识过程
螺栓装配紧度辨识过程分为以下 6 个步骤:
步骤1 采集代表螺栓不同装配紧度的激励响应信号;
步骤2 使用重叠采样技术从采集的信号中获取训练集,从而获得满足深度学习训练要求的数据量,而对于测试集,不使用重叠采样技术;
步骤3 不需要任何的数据预处理过程,直接把步骤二获得的训练集用作CNN的输入;
步骤4 本文提出的卷积神经网络用来从训练集中自动的提取重要特征,并在每一个卷积层和全连接层后使用批量归一化方法来加速网络的训练;
步骤5 网络自动学习到的特征被输入到Softmax分类器中进行螺栓装配紧度的智能评估;
步骤6 在测试集上验证训练好模型的性能。
三、实验验证
3.1 实验描述
螺栓连接转子结构由螺栓将各级盘及盘间间隔环紧固在一起,在轮缘或接近轮缘处是一转动的鼓筒,故该转子刚性较好;而离心力则靠轮盘来承受,故该转子强度高。
因此螺栓连接转子结构兼有鼓筒式转子抗弯、刚性好和盘式转子强度好、各轮盘材料选择灵活等优点,被广泛应用于燃气轮机与航空发动机等机械重大装备。
拉杆螺栓分布在轮盘的一圈压紧面处,靠压紧面的摩擦力传递扭矩外部激振力一定时,螺栓的松紧程度等盘的装配直接决定转子的振动模态及篦齿盘共振。近年来因共振导致螺栓连接转子篦齿盘爆裂故障时有发生。因此,分析螺栓连接转子装配质量可靠性,对减少篦齿盘爆裂故障、保障发动机安全具有重要意义。
为此,提出了一种基于卷积神经网络的螺栓装配紧度智能监测方法,用来分析螺栓连接结构转子装配的完好性。为了验证本文所提方法的有效性,进行了车架试验台螺栓连接转子激振实验。
如图1所示,1~9为第1~9级盘?10为封严篦齿盘,11为轴颈,12为高压轴, 利用DF 1631功率函数信号发生器产生的方波信号作为激振器的激励信号,工作频率选用1Hz,输出信号的幅值为满量程最大幅值。激振器安装于轴颈与高压轴连接的圆周上(在轴颈11处),激振角度如图1所示。加速度传感器安装在高压转子8~9级之间(I-I截面),使用传感器采集高压转子8~9之间得到的激励响应信号,采样频率为6.4kHz。
其中第7~9级盘和封严篦齿盘采用周向均匀分布的24个拉杆螺栓连接,实验设置了6种不同的螺栓装配状态(装配紧度由紧到松)。分别为正常装配(24个螺栓保持标准拧紧状态)、个别螺栓松动(3个螺栓松动)、局部螺栓松动(12个螺栓松动)、整体轻微松动、整体中度松动、整体严重松动。状态标签如表2所示,其中拧紧力矩的大小关系为M1> M2> M3> M4> M5> M6
3.2 数据重叠采样
在6种不同的螺栓连接转子拉杆螺栓装配紧度下采集I-I截面的激励响应信号,对原始数据进行采样处理。每一个状态有6635个样本,其中6600个是训练样本,通过重叠采样生成;而剩余的35个是测试样本,它们没有进行重叠采样,从而使得训练集和测试集满足独立同分布假设。而每一个样本包含4096个数据点。
图2是使用重叠采样技术对正常装配状态下采集信号的处理示意图。 其中i代表重叠采样处理获取的第i个训练样本,i+1获取的下一个样本,从示意图中可以看出,一个样本与它周围的样是本有一定的重叠量。
3.3 不同参数下卷积神经网络训练情况对比
实验设置了3个不同规模的卷积神经网络模型(如表3所示),用来对比验证不同规模CNN模型对螺栓装配紧度评估准确率的影响。
其中Model1有8层卷积和2层全连接层以及Softmax层;Model 2有5层卷积和1层全连接以及Softmax;Model 3有2层卷积和1层全连接以及Softmax。表中模型参数是“卷积核/全连接层神经元数目”。诸如“16,32-100”代表两个卷积层的卷积核数目分别是16 和32,全连接层神经元数目是100。
3.3.1 第一层大卷积核宽步长对CNN训练的影响
使用模型的结构特点是第一层为大卷积核宽步长,这样可以较快的减小输入数据的维度。 较大的卷积核需要更多的内存存储参数,并会增加运行时间,但快速减小的输出抵消了不利影响,降低了内存代价,最终在试验结果中减少模型的训练时间。
而第一层卷积之后的卷积层全部为3×1的小卷积核,通过反复堆叠小卷积核,这样有利于加深网络,从而可以抑制过拟合。本试验使用不同大小的第一层大卷积核宽步长。对CNN进行训练(其它参数相同),其结果如图3所示,其中横坐标为卷积核大小和步长,如“16-4”表示第一层卷积核大小为16×1,步长为4×1。
由图3可以看出,较大的第一层大卷积核宽步长使得模型训练时间变短,但测试集准确率变低。为了保证模型的训练精度同时又不让训练时间过长,本试验选择的第一层卷积核大小为64×1,卷积步长为16×1。
3.3.2 学习率对CNN训练的影响
为了提高网络训练的效率,选择一个合适的学习率十分重要。在本试验中,采用不同学习率训练卷积神经网络。如图4所示(其余参数相同)。
由图4可以看出,学习率太大或者太小,CNN的测试准确率会降低,较小规模CNN在学习率过大时,会陷入无法收敛的困境。而较大规模CNN方法可以在更大范围的学习率下取得较好的效果。选择合适的学习率,能够加快 CNN收敛的速度,提高网络的精度,本试验选择的学习率为0.001。
3.3.3 mini-batch大小对 CNN训练的影响
在训练 CNN 时,对整个训练集执行梯度下降就必须处理整个训练集,然后才能进行下一步梯度下降法,在训练集很大时,这种方法会使得网络训练很慢。可以把训练集分割为小一点的子训练集,这些子集被取名为mini-batch,这样每次同时处理的是单个mini-batch的样本。
本试验使用不同mini-batch size,对CNN进行训练(其它参数相同),其结果如图5a)所示。图5b)为不同mini-batch size条件下,CNN训练10000回合需要的时间。为了保证模型的训练精度同时又不让训练时间过长,本试验选择的mini-batch size为64。
观察图3~图5中3个卷积神经网络的测试准确率结果可以发现,Model 1(本文提出的方法)相比浅层CNN模型(Model 2、Model 3)能够更好的辨识螺栓连接结构装配紧度,测试准确率更高。这表明,使用深层模型表达出了对模型可以学习的函数空间的有用偏好。
3.4 批量归一化(BN)对CNN训练的影响
模型在训练过程中,准确率与训练回合的关系曲线如图6所示。
图6a)为没有BN 环节的训练结果,图6b)是在所有卷积层和全连接层后加了BN的训练结果。 训练时mini-batch大小是64,训练回合数为10000次,在TensorFlow 中训练。
从试验结果中可以看出:没有BN环节的模型准确率在94%左右收敛,识别率上升缓慢,且波动较大。而增加了BN环节的训练结果大约在3000次迭代后。可以达到100%准确率,而且波动很小。根据这样的结果,本文认为BN降低了模型的训练难度,提高了模型的识别率,加速了模型的收敛。
3.5 与其它方法的对比
使用传统人工智能方法SVM和深层去噪自编码器方法与本文所提方法进行对比,其中有3点需要注意:
1) 深层去噪自编码器是由自编码堆叠而成的无监督深层网络,可以通过有监督的全局微调实现状态监测。其与本文所提方法都是直接针对原始时域信号,本对比试验使用的深层去噪自编码器共有9层,每层神经元个数分别为4096--1024--512-256--128--64--32--16--62) 。
2)SVM方法有两种输入,第一种是随机选取的14组时域特征统计量,这14组特征统计量分别是均值、方差、标准差、最大值、最小值、极差、中位数、25%分位数、50%分位数、75%分位数、众数、k阶原点矩、均方值、偏度;第二种是经验丰富的专家选择的特征量:包括17个时域统计量分别是均值、均方根值、方根幅值、绝对平均值、偏斜度、峭度、方差、均方差、最大值、最小值、峰峰值、波形指标、峰值指标、裕度指标、偏斜度指标、峭度指标和13个频域统计量以及其它时频域特征。
3) SVM的对比试验是使用 libsvm方法,对归一化后的特征集首先进行PCA降维,然后使用交叉验证选择最佳参数c和g,核函数类型是RBF核函数。SVM方法的处理过程:对原始时域信号使用重叠采样技术获取训练集,每个状态有66个样本,测试集不使用重叠采样。每个状态有10个样本,且每个样本均有 4096个数据点。从样本集中提取信号的特征统计量作为SVM的输入,虽然诊断方法的输入值不一样,样本数也不一样,但是都取之于同一个数据集,因此具有一定的对比意义。几种方法的测试集准确率如表4所示。
从表4可以看出:SVM方法通过核函数实现从低维向高维的映射,然后在高维特征空间中使用支持向量机进行线性分类。 “SVM+随机特征量”、“SVM+精选特征量”分类准确率较低,分别为85%和90%。 目前标准的支持向量机算法通常对样本的分布假设过于理想,样本构造复杂,样本数据存在冗余、无法提取数据高维信息及预测速度慢、预测精度低的问题。而且SVM方法依赖于特征的选择,对专家知识要求很高,往往选择敏感的特征需要专家大量的时间与经验。
以时域信号为样本训练深层自编码器时,其分类精确度为94.2857%;相比传统SVM方法,使用深层自编码器可以较好地实现螺栓松紧程度辨识,但是其隐含层、隐含单元数目设计依旧需要在试验中进一步调整。而以时域信号为样本时,CNN能够以100%的精确度实现螺栓松紧程度辨识,这证明了该方法的优越性。
四、结 论
本文提出了一种CNN模型,用于直接从激励响应信号中学习特征,并监测螺栓连接结构的装配紧度。CNN具备特征提取、特征选择和分类的能力,形成端到端的智能监测系统,能够将原始数据作为输入,并提供诊断结果作为输出,这项工作的主要结论可归纳如下:
1) 使用车架试验台螺栓连接转子激振实验数据验证了所提方法的有效性。与支持向量机及深层去噪自编码器方法进行了比较,结果表明,该方法可以有效的区分6种螺栓松紧状态,并比其它方法具有更高的准确率。
2) 深层CNN模型相比浅层CNN模型能够更好的辨识螺栓连接结构装配紧度。这表明,深层CNN模型在没有先验知识的情况下从激励响应信号中挖掘代表信息和敏感特征的能力更强,从而可以更好的表示信号与装配状态之间的复杂映射关系。
3) 本文还研究了网络架构的不同参数和配置(包括第一层卷积核、学习率、mini-batch和批量归一化)对性能的影响。在网络的训练过程中确定了优化的参数和配置。
今天的话题,就分享到这里,不当之处,欢迎批评指正;若您有任何疑问或建议,或需要进群交流的小伙伴,(GAF-luosijun)
来源:GAF螺丝君