您所在的位置:首页 - 科学研究 - 科研动态

科研动态

基于时间注意力网络与自适应阈值调整的潜油电泵异常检测

中文题目:基于时间注意力网络与自适应阈值调整的潜油电泵异常检测

论文题目:Anomaly Detection Based on Temporal Attention Network With Adaptive Threshold Adjustment for Electrical Submersible Pump

录用期刊/会议:IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT (中科院大类2区)

原文DOIhttps://doi.org/10.1109/TIM.2024.3436113

原文链接:https://ieeexplore.ieee.org/abstract/document/10616148

录用/见刊时间:20247月31

作者列表

1)李   强 中国石油大学(北京)人工智能学院 控制科学与工程专业 博22

2)李   康 中国石油大学(北京)人工智能学院 自动化系 教师

3)高小永 中国石油大学(北京)人工智能学院 自动化系 教师

4)付   军 中海油能源发展股份有限公司 天津

5)张来斌 中国石油大学(北京)安全与海洋工程学院 安全工程系教师

摘要:

本文提出了一种具有自适应阈值调整的时间注意网络(TAN-ATA)用于解决潜油电泵的异常检测问题。通过时间注意力模块(TAN)对多变量非线性动态过程进行建模,并利用自适应阈值调整模块(ATA)平衡因状态波动引起的频繁误报问题。实验结果表明,TAN-ATA异常检测模型在实际工业应用中展现出有效性和优越性。

背景与动机:

随着近年来易采油藏数量的减少和油井条件的恶化,人工举升逐渐成为采油的主要方式。潜油电泵ESP)作为利用人工举升原理采油的重要设备,实现其在线异常监测变得至关重要。目前,潜油电泵的异常检测方法主要有电流卡片分析与憋压检测为代表的单变量技术,以及各种多变量下的统计分析或机器学习。单变量分析简单但检测精度低,统计分析忽略了变量的时间特性,而现有的机器学习方法大都基于不切实际的前提假设,即能获得充足且准确的标签信息。此外,基于固定阈值的异常检测方法难以在检测及时性以及低误报间取得平衡,而现有的自适应阈值方法需要输出信号符合正太分布假设或需要考虑核函数选择或经验常数设计。鉴于现有方法的局限性,开发一种高效、经济且可靠的异常检测技术用于在线精准预测潜油电泵的健康状态具有重要的实际应用价值和理论研究意义。

设计与实现:

潜油电泵(ESP)作为人工举升的关键设备,包括电机、电机保护器、油气分离器、电缆及生产监测单元等设备,如图1所示。目前,井下生产监控系统可以实时获取过程数据,包括压力、温度、振动、泵进出口压差等,有利于监测ESP系统的运行状态。然而,流体粘度、密度和气液比的变化可能导致泵性能的非线性响应并且系统对操作环境、外部因素、储层压力、温度和流体成分变化的反应也会出现动态行为。这些复杂的特征自然会反映在多变量监测数据中,这给ESP异常检测带来了很大的挑战

1 潜油电泵系统原理图

TAN-ATA方法的总体框架如图2所示,该方法包括三个阶段:数据预处理,TAN-ATA学习,以及基于ATA的异常检测。特别的,TA机制集成到时序模型体系结构中以创建TAN。此外,提出了一种自适应阈值策略ATA,用于ESP异常检测。在线测量阶段,将新样本输入TAN-ATA,实时获取当前异常情况

2 TAN-ATA异常检测流程

具体来说,首先将片段输入LSTM单元,而后来自编码器层的隐藏状态将通过时间注意力层加强时间相关性建模,并生成权值系数,及生成最终的时间加权隐藏状态,与编码过程类似,以及作为解码器LSTM单元的输入以实现对隐藏状态的生成。紧接着,线性映射被用于生成重构信号。并且上述过程将在时间维度上重复展开,直至输出完整的重构信号。最后,利用原始信号与重构信号MSE损失更新时间注意力网络的模型参数。

虽然TAN模块可以用于复杂的潜油电泵过程建模,但在整个建模过程中不可避免地会受到噪声的影响。在这种情况下,采用固定阈值的报警方式来识别异常,则由于阈值无法调整,可能会出现大量误报。此外,如果阈值设置得太高,则很容易忽略异常,这可能非常危险。由于不确定的噪声会导致潜油电泵重构数据的残差分布发生偏斜,因此我们将重点放在基于树的回归方法上。因为当与采样技术配对时,它能表现出很强的抗偏性。进一步的由于XGBoost回归模型在计算复杂性和综合性能之间具有较好的平衡,我们最终选择其以生成自适应阈值。此外,为了减少有限采样导致的自适应动态阈值波动不均匀对异常检测性能的影响,我们进一步引入原理对自适应动态阈值进行微调。主要流程如下

计算所有时间切片样本的均值作为回归模型的输入:

  计算验证集样本的残差作为回归模型的输出:

  利用以及对XGBoost回归模型中的模型参数进行训练:

使用统计调整策略(3σ原理)对预测残差进行微调:

  在线异常检测时,对于新的时间序列片段,首先利用时间注意力网络生成残差。而后利用自适应阈值模块生成与之对应的自适应阈值

传统模型与本文方法的各项回归评价指标比较如表1所示,其中每个测量结果为10次重复的平均值。一般F(%)T(hours)A(%),说明预测越准确。很明显,所提出的TAN-ATAF(%)T(hours)A(%)于其他对比方法,证明了其优越性。

1 各类方法的性能比较

此外,TAN-ATA在不同测试数据集上的异常检测结果如图3所示。自适应动态阈值可以很好地处理ESP正常运行过程中噪声引起的误报且不会引起报警的滞后

3 TAN-ATA在不同测试样本的检测效果

结论:

本文提出了一种新的用于潜油电泵异常检测的时间注意力与自适应阈值方法。为了实现具有无标签、多变量、非线性和动态特性的潜油电泵数据的重构建模,提出的方法利用基于时序自编码的体系结构。在此基础上,引入时间注意机制来提高潜油电泵建模的性能,并提出了一种新的自适应阈值调整策略来降低噪声引起的状态波动引起的误报高的问题。实验结果证明了所提出的TAN-ATA的有效性和优越性。

通讯作者简介:

李康,师资博士后,博士,中国石油大学(北京)人工智能学院自动化系教师,主要研究方向为故障诊断与容错控制。