学生姓名:滕梓欣
班 级:交控2019-05班
指导教师:李奕璠
毕设题目:基于深度迁移学习的轴承故障诊断方法研究
一、概况
1.选题意义
随着“中国制造2025”与德国“工业4.0”的合作对接越发深入,我国制造业的三步走正朝着目标稳步迈进。目前,信息化与工业化深度融合使机电设备的在线监测得以实现,零件使用的相关数据得以采集,含有价值的信息得以提取,这些信息成为零件使用情况的参考标准,未能达到标准的零件应得到妥善处理。判断零件是否损伤以及判断零件的损伤类型便是这其中的重要一环。
轴承作为机械设备中的重要组成零件,广泛应用于齿轮箱、泵、涡轮机和发电机等工程系统中,在工业生产和运输中发挥重要作用。由于复杂的运行条件和持续的超负荷工作,轴承作为工程系统中最常见但又最脆弱的部分,容易发生故障而影响设备的性能,造成人力物力财力的不可逆损失,严重时甚至会危害操作人员的生命。
而近年来,机器学习领域高速发展,深度学习通过其强大的特征提取能力,在语音、图像识别中取得了诸多研究成果;迁移学习作为机器学习分支之一,优点在于能把一个任务上训练的模型重新运用于另一个相关的任务上。因此,以深度学习方法为媒介,搭建迁移学习模型,能很好地把凯斯西储振动数据集涵盖的相关知识应用于帕德博恩振动数据集,以实现有效的轴承故障诊断。搭建出结合CWRU振动数据集与PU振动数据集轴承损伤特征的完整模型,对判断轴承损伤类型的实际应用具有重要意义。
2.任务分解
毕业设计的总任务是采用迁移学习的方法,以深度学习方法为媒介,通过探寻凯斯西储振动数据集特征与帕德博恩振动数据集特征的强相似性,获得可以将凯斯西储振动数据集涵盖的相关知识应用于帕德博恩振动数据集的深度迁移学习模型,实现有效的故障诊断。
设计总共分为4步,分别为模型搭建准备、深度学习模型搭建、迁移学习模型搭建、迁移学习模型运用。
模型搭建准备主要是考虑到数据集具有少样本、长序列的特点,直接输入到深度学习模型中无法完整准确地提取特征,因此需要做数据增强。
而关于深度学习模型搭建,本设计以Alexnet网络为参考,搭建适合于CWRU振动数据集的网络结构,按照需求增减层、修改参数并选择合适的激活函数。
迁移学习模型搭建是用CWRU振动数据集的另一工况作为目标域,在保证数据集没有问题的前提下搭建并完善迁移学习模型。
最后一步迁移学习模型运行在第三步完成的基础上进行,将质量得到保证的模型在PU振动数据集上进行迁移,用PU振动数据集的优化来实现最终的精度提升。
二、已完成工作
针对于理论学习,为了寻求具体而可行的思路,开题之后我以综述性文献为辅、专业性研究为主阅读了部分参考文献,从中我主要学习到有关数据增强的方法、深度学习模型的搭建和优化方法、迁移学习模型的搭建和完善技巧,这些对我的设计起到了重要的引导作用。
针对于模型搭建准备部分,用matlab绘制出选定工况下轴承滚动体受损的振动加速度信号,能够看到有超过12万个数据点,将其作为一个样本的数据作为输入无法很好地运用深度学习强大的特征提取能力,因此需要做数据增强。经过计算,轴承每转一圈采样点有400个,而为了保证识别的有效性,每个样本使用大于两个周期的采样点数,同时考虑到后续数据需要放入模型中处理,因此每个样本使用1024个采样点。采样方式选择每隔一个周期的数据量进行一次滑移采样,最终获得14492*1024的样本。通过7:3同分布划分训练集与测试集,将得到的数据存入mat文件中以便于后续使用。
图 1选定工况下轴承滚动体受损的振动加速度信号
图 2数据集采样方式
针对于深度学习模型搭建部分,本网络模仿目前被广泛运用的Alexnet网络,进行了适应性修改,搭建了更能适应CWRU数据集特性的深度学习网络。其中含有三个一维卷积层、两个池化层与三个全连接层。一维卷积层用来对数据进行卷积操作,进而生成对应的特征映射;池化层的作用是做局部特征提取、降低特征维度,一般用于卷积层之后,用于保留卷积层提取的重要信息;全连接层在整个卷积神经网络中起到分类器的作用,它能将提取到的特征映射到样本标记空间,作为最后一层完成分类任务。本网络的最后一层全连接层输出为4,用于完成深度学习的四分类。除此之外,为了解决实际问题中的非线性情况,需要引入激活函数,本网络使用Tanh作为激活函数,是通过分析数据集数据特征与多次训练得到的最优结果。而为了提高模型的泛化能力,避免过拟合,需要引入Dropout方法,它能随机失活神经元并且不影响其他神经元的表达。以训练集为例,每一个批次进行训练时都要经过梯度归零、损失计算、反向传播求梯度值以及通过梯度下降执行参数更新四个步骤,目的是为了在反复的训练过程中求取整个网络的最优参数值。其中损失函数是模仿Alexnet网络使用交叉熵损失函数,它是分类问题中最常使用的函数。经过多次优化,最终得到的模型能在100个epoch后实现训练集和测试集精度下降至收敛,训练集和测试集精度逐渐上升且最后都能大于99%。
图 3深度学习网络搭建结构
图 4训练集误差(左)与测试集误差(右)
图 5训练集精度(左)与测试集精度(右)
通过以上两个步骤可以判断,所搭建的深度学习模型能作为高效可靠的预训练模型进行后续运用。
三、下一步工作计划
对于迁移学习模型搭建部分,计划采用半监督迁移学习基于模型的迁移学习方法,该方法的实施思路是引入最大均值差异来计算源域和目标域的距离,并将其加入到网络损失中进行训练,除此之外,尝试不同的激活位置和层宽度,用精度与最大均值差异进行判断来选择最优方案。使用CWRU异工况数据作为目标域来训练模型以验证模型可行性。
迁移学习模型运用部分需要在第三步完成的基础上实现,计划是在保证迁移学习模型准确性的基础上将帕德博恩振动数据集作为目标域进行迁移,旨在对其进行InnerRace损伤、OuterRace损伤与Normal的三分类,若精度不够,选择合适的数据增强方法来解决。
设计完成过后,学习毕业论文的写作结构与格式要求,进行论文的写作。
问题一:怎么理解题目中的深度迁移学习?
回答:深度迁移学习是迁移学习的一种方法。本设计中第二步搭建深度学习模型的目的是为后续迁移学习提供预训练模型,其将运用到迁移学习当中。
问题二:设计中缺少了自己的方法与其他方法的对比。
回答:我会查漏补缺,在设计中做出相关的工作并体现在论文中。
前段时间对我来说是一个不断打破认知的过程,每一个弄错的方法和跑偏的思路都是当前成果的铺垫。
理不清思绪、看不懂代码的状态是艰难的,但是将理论知识一点一点补充,将每部分代码一行一行理解,设计才能稳步迈进。革命尚未成功,希望我能记住每一步推进的踏实感,不惧艰难,做出一个好的毕业设计。
非常感谢李老师授我以渔,让我回归到论文,学会站在巨人的肩膀上看问题,这使我的学习思维有了新的提升。非常感谢博士生学长为我答疑解惑,让我逐步看清了方向。也非常感谢答辩组老师对我的认可以及提出的建议,我一定会认真改进。