基于融合神经网络的发动机排气温度裕度预测

李 杰,孟凡熙,张子辰,朱 玮

(长安大学电子与控制工程学院,陕西 西安 710064)

在飞机起动和起飞阶段, 其排气温度(exhaust gas temperature,EGT) 和排气温度裕度(exhaust gas temperature margin, EGTM) 是一种与发动机状态及性能强相关的气路参数, 是航空发动机健康管理监测的重要参数之一[1-2]。

航空公司在实际运营中,通过监测及预测飞机EGTM 的变化情况, 了解飞机发动机的健康状态, 对于发动机运行的安全性与经济性具有重要意义。

随着人工智能技术的发展,以大数据为基础的深度学习算法在寿命预测方向的成功应用为EGTM 的预测提供了新的思路。

例如,Ding 等[3]提出了一种基于卷积神经网络 (comvolutional nearal network,CNN)的锂电池剩余使用寿命预测和健康管理方法,使用CNN 捕获剩余信号中的预期成分,具有较好的预测稳定性。Miao 等[4]设计并建立了以长短期记忆网络(long-short term memery,LSTM)为基础的双任务深长短时记忆网络, 用于航空发动机退化评估和剩余使用寿命预测的联合学习。

Ren[5]提出了一种基于改进CNN 和LSTM 的锂电池寿命预测方法,来挖掘有限数据中的深层信息。

经验模态分解 (empirical mode decomposition,EMD)[6-7]和CNN-LSTM 相融合的EGTM 预测方法,采用EMD 将原始EGTM 序列分解为多个固有模态分量和残差分量, 从而从不同模态上, 进一步解释了EGTM 信号的物理含义,将所得分量作为卷积长短期记忆网络模型输入,加深了神经网络对EGTM 信号的理解。

为了验证该方法的有效性,设计了多层感知机(multi-layer perceptron,MLP)、CNN、 循环神经网络(recurrent neural network,RNN)、LSTM 和CNNLSTM作为竞争模型,对比验证了所提出模型的性能。

1.1 民航发动机的排气温度裕度定义

EGTM 定义为航空发动机在海平面压力以及拐点温度条件下,全功率起飞时发动机排气温度(EGT)与EGT 最大值之间的差值TEGM计算方法为

式中:TEmax为发动机最大排气温度,℃,即发动机工作过程中,所容许出现的排气温度最大值,是该型发动机设计厂商给定的重要设计参数;
TEa为发动机处于全功率状态时的排气温度值,℃,当发动机处于起飞状态时,应对其进行检测,为反映发动机健康状态的关键参数之一,即EGTM 包含了该型发动机在翼劣化程度的信息。

1.2 实验数据介绍与处理

本文采用某航空公司的某型30 台民航发动机在采样频率为200 个飞行循环(Cycle)下的EGTM历史测量数据(同一测量环境)作为数据集,以评价所提出模型的性能。

本文将随机选取的25 台民航发动机的EGTM 数据作为训练集(包含1 465 个工作点,飞行循环次数为1 465×200=293 000 次),剩余5 台民航发动机的EGTM 数据作为测试集(包含291 个工作点,飞行循环次数为291×200=58 200 次)。

图1 展示了该30 台民航发动机的EGTM 数值的正态分布情况,由图可知,数据整体符合以均值为70 ℃的正态分布(对称分布),这将有利于训练集和测试集的划分。

值得注意的是,当民航发动机在下发一段时间后, 排气温度裕度处在以均值70 ℃为中心的[60 ℃,80 ℃]范围内的点占比最高,可反映此时民航发动机处于稳定的工作状态。

若当EGTM 值下降到60 ℃附近时,可说明该型民航发动机将由稳定工作区过渡到[50 ℃,60 ℃]的敏感工作区,此时可将60 ℃作为敏感点。若当EGTM的值持续下降时,[40 ℃,50 ℃]的点的数量出现了骤降情况, 这意味着该型民航发动机开始出现了不同程度的性能衰退现象, 即由敏感区域过渡到衰退区。

图1 民航发动机EGTM 的数据分布Fig.1 Data distribution of EGTM of civil aviation engine

另外,处在[105 ℃,120 ℃]范围内的点可作为航空发动机的出厂数据, 其幅值较大且占比最小,不能准确反映实际的工作状态, 且处在30 ℃以下范围内的点接近于失效状态,即不在1%~99%范围内的数据点参与训练时,可能会导致预测模型在过拟合,对EGTM 预测的准确度产生较大影响,即考虑将其在后续模型的训练过程中予以剔除。

同时,为了提升模型的收敛速度和模型精度,本文采用线性函数归一化(max-min normalization)方法,将EGTM数值转换为区间(0,1)内的小数。

归一化方法如下

式中:X 为原始数据,x˜为归一化后的数据。

1.3 时间窗的选取

由于EGTM 数据和时间有着很高的依赖关系,这种依赖关系是处理时间序列的关键,所以需要选择合适的时间窗口捕获这些依赖关系。

在原始数据中通过滑动时间窗口来生成网络输入,从而生成大小为D@S 的样本序列进行模型训练,其中S 表示窗口宽度,D 表示数据特征维度(本文为1)。

假设第一个输入的样本序列可由S1=[x1,x2,…,xS]表示,当滑动时间窗口滑动L 步之后, 可得第2 个输入样本序列S2=[x1+L,x2+L,…,xS+L],其中xi∈R1×D。

若当训练数据共有φ 个采样点时,则可获得(φ-S×L+1)个样本序列。

在上述序列的构造基础上,对每个输入样本序列添加相应的标签。

设所需要预测的时间标签的个数为N(N≥1),则S1的标签可表示为y1=[xS+1,xS+2,…,xS+N],S2的标签可表示为y2=[xS+L+1,xS+L+2,…,xS+L+N],不失一般性地可以为所有的样本序列添加相应的标签。

同时若需要预测某个时间段内的EGTM 时,则仅需要一个宽度为S,高度为D 的时间窗口大小的数据即可。

在本文中,为了能够及时预测出EGTM 的变化趋势,取滑动步长L(N 与L 代表相同的含义,只是为了方便表示)的长度为1,即实时预测相邻时刻的EGTM 值,同时考虑到EGTM 的非线性,若S 取值较大时, 则样本序列之间的相关程度会变得稀疏,容易使得CNN 丢失有用的信息;

因此S 的取值不宜过大。

经过多次试验发现,当取S 取值为7 时,可满足相关的实验要求。

2.1 经验模态分解

民航发动机EGTM 受到多方面因素的影响,例如发动机气动核心部件的气动效率,外界大气温度的变化等,表现出了非线性、波动性的特点。

非线性和波动性会直接影响EGTM 预测的准确性,因此需要对排气温度裕度数据进行初步处理。EMD 可以将具有非线性和非平稳性特点的原始信号序列,如EGTM 序列, 通过经验识别分解为更为稳定的一系列内涵模态分量(intrinsic oscillatory mode,IMF)和一个残差项(residual model,Res),其中残差项可作为EGTM 变化的长期趋势模态,即[6]

式中:X(t)为EGTM 原始序列;
IMFi(t)为X(t)分解出来的第i 个IMF 分量;
m 为IMF 分量数目,r(t)为残差项;
t 为序列的时间尺度,本文中t=15 min。

由于IMF 分量必须满足两个约束条件[6]:

1) 在整个时间序列上,IMF 分量的极值点和过零点的个数必须相等或相差不超过一个;

2) 任意时刻,IMF 分量的局部上、 下包络线均值为0;
因此所分解出的IMF 分量较为平稳,弱化了原始信号中包含的非线性和波动性成分,通过预测每个IMF 分量,可缓解EGTM 数据的非线性和波动性对预测结果的影响。

2.2 融合模型原理

本文提出了一种基于CNN-LSTM 的深度融合模型用来建立EGTM 的IMF 分量预测模型,该网络包括两层卷积神经网络和两层长短期记忆网络,其中每层卷积神经网络均由卷积层和池化层组成,如图2 所示。

图2 CNN-LSTM 模型结构Fig.2 Structure of the CNN-LSTM model

图2 所示模型首先利用CNN 强大的空间提取能力从IMF 分量的时间窗信息数据中提取出隐藏特征,实现数据的降维,以捕获所提取特征中的重要信息,并且可有效抑制噪声信号;
其次,EGTM 的衰退过程是有关时间序列的, 所以将CNN 提取的重要特征通过全连接层拼接后作为LSTM 的输入;
随后充分利用LSTM 的顺序敏感性提取数据中的时间特征,即根据长短期记忆层中某一时刻的单元状态和网络输出值,进行EGTM 有关时间的衰退特征的提取,建立EGTM 预测模型;
最后将测试集放入模型中,实现对数据的拟合,输出预测的EGTM 值。

融合模型中的长短期记忆网络如图3 所示。

首先, 细胞状态中的信息通过遗忘门进行选择性遗忘,即进行选择性记忆;
其次,新的信息通过输入门选择性地记录到细胞状态中;
最后将前面的信息通过输出门保存到隐层中去。

图3 单个LSTM 单元的内部结构Fig.3 Internal structure of a single LSTM unit

在t 时刻,细胞状态的更新过程如下[8-9]

式中:it为输入门的计算结果;
ft为遗忘门的计算结果;
Ot为输出门的计算结果;
xt以及ht-1分别作为t时刻的输入以及上一时刻的LSTM 输出值, 且将两者进行拼接, 作为t 时刻的输入状态;
Wf、Wi、Wc和Wo分别对应遗忘门、 输入门和输出门的权值矩阵,bf、bi、bc和bc为相应的偏置矩阵;
Ct-1为旧的细胞状态,ft×Ct-1为遗忘门决定忘记的状态信息,为新的候选值向量,Ct为更新后的细胞状态(t 时刻细胞状态);
“×”表示两个向量按元素相乘,σ(*)为sigmoid激活函数,th(*)为tanh 激活函数。

2.3 融合模型参数设置

神经网络的层数和各层神经元数目对训练结果有重要影响,即训练时间和训练难度随着神经网络层数加深而增加,可能会出现过拟合问题,因此并不能依靠增加网络层数和神经元数目来提高训练结果。

经过多次实验发现,建立如表1 所示的神经网络时,可获得最优结果。

表1 模型参数设置Tab.1 Parameter settings of the model

本文所有算法是在Python3.7 和PyCharm 2019上运行的,计算设备是Intel Core i5-8250U CPU,8 GB RAM 计算机。

3.1 性能评价指标

选用平均绝对误差(mean absolute error,MAE),均方根误差(root mean square error,RMSE)以及拟合优度R2作为本文所提出算法的性能指标,对EGTM 的预测性能做评价。

其中MAE 和RMSE,R2分别衡量预测值与真实值之间的误差,以及评价预测值与真实值之间预测拟合度,且定义MAE 为损失函数(Loss)。

MAE,RMSE 以及R2的计算方法为[10]

从MAE、RMSE 以及R2的表达式可知,当预测值与真实值越接近时,MAE,RMSE 的值越小,R2值越大,即误差越小,拟合度越高,模型的准确度和精度越高。

3.2 经验模态分解分析

EGMT 序列经过EMD 进行经验模态分解后,得到8 个IMF 分量和1 个残差项(Residual),如图4 所示。

由图4 可知,单台发动机原始的EGTM 具有较为明显的下降趋势,但原始EGTM 数据仍然存在波动性和不稳定性。

经过EMD 分解后的残差分量的趋势与原始数据相符,且残差分量具有较大的幅值,但相较于原始数据而言更加平滑稳定。

相较而言,IMFS 分量存在不同程度的波动,包含短期波动,如IMF1~IMF4 分量;
中期波动,如IMF5~IMF6,短期波动,如IMF7~IMF8,且IMFS 分量具有较小的幅值, 这说明IMFS 分量代表了原始数据中的多种波动成分, 体现出原始数据的波动性。

由此可见,IMFS 分量决定了原始数据的波动性, 是原始数据不稳定的原因;
残差分量决定了原始数据的整体趋势,是原始数据的主要组成部分。对IMFS 的精准预测有利于提高预测精度,而对残差分量的精准预测是整体预测结果准确的关键。

图4 EMD 分解结果Fig.4 The result of EMD decomposition

3.3 模型验证与误差分析

本节设计了MLP,CNN,RNN 和LSTM 等深度神经网络模型作为竞争模型, 对比验证所提出的EMD-CNN-LSTM 组合预测模型的精度和可靠性,同时为了验证EMD 的贡献, 考虑竞争模型在EMD作用下的预测性能。

图5 展示了上述不同模型在训练过程中的损失函数变化情况,其中横坐标表示模型训练过程中的迭代次数。

图5 训练过程中的loss 值变化Fig.5 Iterative trend of loss value during training

由图5 可知,竞争模型的损失函数在迭代过程中存在不同程度的波动情况,这说明竞争模型在训练过程中陷入了局部最优点。

而EMD-CNN-LSTM的损失函数在迭代过程中不存在波动情况,且保持较低的稳定值。

在上述训练的基础上,为了全面展示所提模型的性能, 随机从测试集中选择一台发动机进行分析,结果如图6 所示。

图6 中展示了不同的深度神经网络模型预测的EGTM 变化趋势。

由图6 可知,在EGTM 的早期预测时,所有模型均存在不同程度的波动, 导致其无法准确捕捉到EGTM 的变化趋势,即敏感区域内EGTM 的准确预测的实际意义更大,这是因为敏感区域内的EGTM 较低,发动机会接近维修或者下发边界,若能提前准确获知随后飞行循环中EGTM 的变化情况, 可为发动机及时维修、维护、飞行计划制定提供技术依据。

在EGTM 处于敏感区域内时,竞争模型均不同程度地偏离真实值,CNN-LSTM 也出现了较为严重的超前预测或滞后预测情况,这说明原始数据的非线性和非平稳性对于EGTM 的准确预测具有严重的干扰作用。

在EMD的作用下,CNN-LSTM 的预测偏离有所改善,其在敏感区域内展示出了最好的精确度和稳定性。

测试集中的预测结果如表2 所示。

图6 单一民航发动机的EGTM 预测Fig.6 EGTM prediction results of a single civil aviation engine

表2 实验结果的比较Tab.2 Comparison of the experimental results

由表2 可知, 相较于MLP,CNN,RNN,LSTM,CNN-LSTM 等竞争模型,EMD-CNN-LSTM 的MAE分别下降了62.98%,48.40%,56.50%,47.28%,37.82% ;
RMSE 分 别 下 降 了62.06% ,48.53% ,53.49%,44.44%,33.01%;
R2分别上升了5.31%、2.59%,3.12%,1.95%,1.02%, 另外, 相较于EMDMLP,EMD-CNN,EMD-RNN,EMD-LSTM 等模型,EMD-CNN-LSTM 的MAE 分别下降了33.56%,37.01%,28.15%,20.49%;
RMSE 分别下降了38.05%,29.29%,25.53%,24.29%;
R2分别上升了1.22%,0.92%,0.71%,0.51%。

预测结果的误差范围在一定程度上可以反映预测结果的稳定性。

图7 展示了模型在测试集下的预测误差分布图。

图7 不同模型的预测误差范围比较Fig.7 Comparison of the prediction error ranges ofdifferent models

由图7 的箱线图可知,EMD-CNN-LSTM 的1%~99%的预测误差落在[-4,4]范围内,远小于其他模型的分布范围,且[-0.2,0.2]范围内的误差值占比最高,且更接近于0,同时并没有出现异常点,这表明所提出的模型具有最佳的预测稳定性。

3.4 拟合度分析

为了验证所提出模型的单点预测性能,本文对测试集的EGTM 预测值和EGTM 真实值通过回归函数进行线性回归分析, 回归函数可以表示由式(13)所示。

其中:Y 为预测值;
T 为真实值;
θ 和b 分别为最佳线性回归直线的截距和斜率。

由回归函数的定义式可知,在理想条件下,5 台发动机的所有预测值完全等于其真实值时,回归曲线是一条斜率为1,截距为0 的直线。同时为了进一步强化回归的可靠性,引入R(皮尔逊相关系数)表示所提模型的EGTM 预测趋势与实际的EGTM 变化趋势的相关性,R 值越大相关性越强。

由表3 统计的回归参数可知, 相较于竞争模型,所提模型的R 具有最大值,这说明,所提模型的EGTM 预测趋势与实际的EGTM 变化趋势具有较强的相关性,即融合模型对于EGTM 的变化趋势具有较好的跟随性。

同时结合斜率θ 和截距b 的指标进一步分析可知,所提出模型的回归直线最接近于理想状态,即拟合效果最优。

表3 拟合分析的参数比较Tab.3 Parameter comparison of fitting analysis

1) EMD 使得神经网络实现了对EGTM 时间序列在不同模态上的深入理解,全面提升了神经网络的预测效果。

CNN 和LSTM 两者融合可实现数据的深度挖掘,从而提升了EGTM 预测的准确度、稳定性。

2) 当EGTM 处于敏感区域时, 竞争模型的预测值与真实值出现了较大的偏差,即出现了较为严重的滞后或超前预测,而EMD-CNN-LSTM 仍能保持较好的预测精度及稳定性。

这表明了所提出的融合神经网络在EGTM 预测中具有较好的适用性。

猜你喜欢原始数据残差排气GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATIONChina Report Asean(2022年8期)2022-09-02基于双向GRU与残差拟合的车辆跟驰建模网络安全与数据管理(2022年3期)2022-05-23受特定变化趋势限制的传感器数据处理方法研究物联网技术(2020年12期)2021-01-27基于残差学习的自适应无人机目标跟踪算法北京航空航天大学学报(2020年10期)2020-11-14基于递归残差网络的图像超分辨率重建自动化学报(2019年6期)2019-07-23全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶汽车零部件(2017年4期)2017-07-12综合电离层残差和超宽巷探测和修复北斗周跳中国惯性技术学报(2015年1期)2015-12-19堀场制作所的新型排气流量计汽车与新动力(2014年4期)2014-02-27堀场制作所的新型排气流量计汽车与新动力(2014年3期)2014-02-27世界经济趋势中国石油石化(2013年5期)2013-05-03