当前位置: 主页 > 学术动态 >

基于数字孪生和MTAD-GAN的油气站场多变量时间序列数据异常检测方法

点击数:   更新日期: 2023-03-22

中文题目:基于数字孪生和MTAD-GAN的油气站场多变量时间序列数据异常检测方法

论文题目Anomaly Detection Method for Multivariate Time Series Data of Oil and Gas Stations Based on Digital Twin and MTAD-GAN

录用期刊/会议:【Applied Sciences】 JCR Q2

原文DOI:【app13031891

原文链接:https://doi.org/10.3390/app13031891

录用/见刊时间:2023.1.31

作者列表

1) 连远锋 中国石油大学(北京)信息科学与工程学院 计算机系教师

2) 耿玥瑶 中国石油大学(北京)信息科学与工程学院 计算机技术专业 硕19

3 田天 中国石油大学(北京)信息科学与工程学院 计算机技术专业 硕 22

文章简介:油气站场多变量时间序列数据的异常检测任务中由于存在数据不平衡工况多变模式复杂问题现有的检测方法在增强模型鲁棒性的同时往往造成准确率明显下降为此我们提出了一种基于数字孪生和GAN网络多变量时序数据异常检测方法,机Petri网和知识图谱嵌入数字孪生虚实交互过程中,在LSTM引入知识图谱注意力和时间霍克斯注意力;通过知识感知将数字孪生空间生成异常模拟数据与物理空间数据进行迁移学习,实现孪生空间异常检测。实验证明了所提方法在油气站场多变量时间序列数据的异常检测的有效性。

摘要:油气站场机电设备是机械、电气、液压、控制等多形式系统的复杂耦合结构工作过程中环境和工况条件变化多样,数据具有多元时序动态行为特征,有效地对站场设备运行健康状态的实时感知具有重要的科学价值和实践意义为此,本文提出了一种数字孪生驱动的异常检测方法。首先,构建了由物理空间模型数字孪生模型、虚实同步映射机制和异常检测策略组成的运行框架,并通过嵌入随机Petri来描述油站的运行行为逻辑,实现了高效的虚实映射。其次,基于时间序列变量之间潜在的相关性和互补性提出了一种MTAD-GAN异常检测方法,通过结合知识图谱注意力和时间霍克斯注意力的机制来重构多变量时间序列的误差,通过给定的阈值判断异常样本。实验结果表明,数字孪生驱动的异常检测方法能够实现对具有复杂模式的异常数据的准确检测,证明了该方法的有效性。

主要内容:

数字孪生异常检测框架

油气站场数字孪生框架,如图1所示。这里构建了SSUPS框架对物理世界实体进行分解并通过知识图谱实现孪生空间虚实映射关系,并利用随机petri网来描述油气站场的运行行为逻辑。



图1 油气站场数字孪生框架

MTAD-GAN模型

为了实现多变量时间序列数据的异常检测,我们设计了一个多级交叉的GAN网络(MTAD-GAN),如图2所示。在MTAD-GAN 模型训练阶段,将与训练样本相同维度的随机噪声输入知识图谱注意力和霍克斯注意力长短时记忆网络生成信号样本。然后,将生成样本和真实样本同时传递给判别器进行迭代训练,直到网络达到纳什均衡状态。在异常检测阶段,孪生空间的测试样本被映射到随机潜在空间通过计算重建损失来生成重建样本。为了增强正常样本和异常样本之间的特征差异引入评分网络来计算重建样本的得分损失。结合高斯联合分布,构建分数损失、重建损失和鉴别损失成的自适应动态高斯评分(ADGS)函数判断数据的异常情况。



图2 MTAD-GAN异常检测框架

基于知识感知的迁移学习

如图3所示,迁移学习能够将知识从物理空间域映射到孪生空间域,进而对数字孪生空间模拟生成的样本数据过程进行约束为此,引入知识图谱和霍克斯过程来更好地实现两个领域之间的时序知识迁移学习



图3 知识感知的迁移学习框架

实验结果及分析:

表1 不同基线方法与 MTAD-GAN的性能比较



表2 不同数据集的准确性比较



1显示了在J10031数据集中基于ADGS评分函数的预测结果。可以看出,与TcnED算法相比,MTAD-GAN的准确率提高了2.6%,说明本文提出的模型具有良好的性能。为了比较和分析本文方法与TcnED的差异,表2显示了SMAP、SMD、DAMADICS、SKAB、MSL、SWAT和WADI数据集上的精度。可以看出,MTAD-GAN算法的精度TcnED算法相比提高了6.42%~15.42%



图4 每个模型方法的AUCROC比较。。

4给出本文方法与PCA、RawSignal, UAE、LSTM-ED、AE和TcnED在SMAP、SMD、DAMADICS、SKAB、MSL和J10031 基于不同评分函数的数据集的比较结果。结果表明检测模型和评分函数的选择对异常检测有不同程度影响与其他算法相比,MTAD-GAN的性能提高了0.010.4其他评分函数相比ADGS由于结合了多个损失项,能够更好地识别异常情况模型性能提高了0.160.4。

结论: 多变量时间序列的异常检测是油气站智能运行的一项重要任务。本文提出了一种基于数字孪生和MTAD-GAN的无监督多变量时间序列异常检测方法,构建了与油气站实际运行逻辑相匹配的数字孪生系统,通过随机Petri网实现了高效的虚实映射。基于数据样本之间的相关性,结合知识图谱注意力和时间霍克斯注意力机制,对多变量时间序列的数据进行同步建模,并通过知识感知的迁移学习机制学习样本的概率分将此方法应用于油气站场的异常检测证明了所提方法在异常检测中的有效性。

作者简介:

连远锋博士现任中国石油大学(北京)副教授、硕士生导师。科研工作涉及图像处理与虚拟现实、机器视觉与机器人、深度学习与数字几何。同时从事遥感影像处理、数字孪生与智能机器人巡检、基于粒子的泄漏模拟与可视化等技术开发与工程应用工作。