点击数: 更新日期: 2023-03-22
中文题目:基于数字孪生和MTAD-GAN的油气站场多变量时间序列数据异常检测方法
论文题目:Anomaly Detection Method for Multivariate Time Series Data of Oil and Gas Stations Based on Digital Twin and MTAD-GAN
录用期刊/会议:【Applied Sciences】 JCR Q2
原文DOI:【app13031891】
原文链接:https://doi.org/10.3390/app13031891
录用/见刊时间:2023.1.31
作者列表:
1) 连远锋 中国石油大学(北京)信息科学与工程学院 计算机系教师
2) 耿玥瑶 中国石油大学(北京)信息科学与工程学院 计算机技术专业 硕19
3) 田天 中国石油大学(北京)信息科学与工程学院 计算机技术专业 硕 22
文章简介:在油气站场多变量时间序列数据的异常检测任务中,由于存在数据集不平衡、工况多变和模式复杂等问题,现有的检测方法在增强模型鲁棒性的同时往往造成准确率明显下降。为此,我们提出了一种基于数字孪生和GAN网络的多变量时序数据异常检测方法,将随机Petri网和知识图谱嵌入数字孪生虚实交互过程中,在LSTM引入知识图谱注意力和时间霍克斯注意力;通过知识感知将数字孪生空间生成异常模拟数据与物理空间数据进行迁移学习,实现孪生空间异常检测。实验证明了所提方法在油气站场多变量时间序列数据的异常检测的有效性。
摘要:油气站场机电设备是机械、电气、液压、控制等多形式系统的复杂耦合结构,工作过程中环境和工况条件变化多样,数据具有多元时序动态行为特征,有效地对站场设备运行健康状态的实时感知具有重要的科学价值和实践意义。为此,本文提出了一种数字孪生驱动的异常检测方法。首先,构建了由物理空间模型、数字孪生模型、虚实同步映射机制和异常检测策略组成的运行框架,并通过嵌入随机Petri网来描述油站的运行行为逻辑,实现了高效的虚实映射。其次,基于时间序列变量之间潜在的相关性和互补性,提出了一种MTAD-GAN异常检测方法,通过结合知识图谱注意力和时间霍克斯注意力的机制来重构多变量时间序列的误差,通过给定的阈值判断异常样本。实验结果表明,数字孪生驱动的异常检测方法能够实现对具有复杂模式的异常数据的准确检测,证明了该方法的有效性。
主要内容:
数字孪生异常检测框架
油气站场数字孪生框架,如图1所示。这里构建了SSUPS框架对物理世界实体进行分解并通过知识图谱实现孪生空间虚实映射关系,并利用随机petri网来描述油气站场的运行行为逻辑。
图1 油气站场数字孪生框架
MTAD-GAN模型
为了实现多变量时间序列数据的异常检测,我们设计了一个多级交叉的GAN网络(MTAD-GAN),如图2所示。在MTAD-GAN 模型训练阶段,将与训练样本相同维度的随机噪声输入知识图谱注意力和霍克斯注意力长短时记忆网络中生成信号样本。然后,将生成样本和真实样本同时传递给判别器中进行迭代训练,直到网络达到纳什均衡状态。在异常检测阶段,孪生空间的测试样本被映射到随机潜在空间,通过计算重建损失来生成重建样本。为了增强正常样本和异常样本之间的特征差异,引入评分网络来计算重建样本的得分损失。结合高斯联合分布,构建由分数损失、重建损失和鉴别损失构成的自适应动态高斯评分(ADGS)函数来判断数据的异常情况。
图2 MTAD-GAN异常检测框架
基于知识感知的迁移学习
如图3所示,迁移学习能够将知识从物理空间域映射到孪生空间域,进而对数字孪生空间模拟生成的样本数据过程进行约束。为此,引入知识图谱和霍克斯过程,来更好地实现两个领域之间的时序知识迁移学习。
图3 知识感知的迁移学习框架
实验结果及分析:
表1 不同基线方法与 MTAD-GAN的性能比较
表2 不同数据集的准确性比较
表1显示了在J10031数据集中基于ADGS评分函数的预测结果。可以看出,与TcnED算法相比,MTAD-GAN的准确率提高了2.6%,说明本文提出的模型具有良好的性能。为了比较和分析本文方法与TcnED的差异,表2显示了SMAP、SMD、DAMADICS、SKAB、MSL、SWAT和WADI数据集上的精度。可以看出,MTAD-GAN算法的精度与TcnED算法相比提高了6.42%~15.42%。
图4 每个模型方法的AUCROC比较。。
图4给出了本文方法与PCA、RawSignal, UAE、LSTM-ED、AE和TcnED在SMAP、SMD、DAMADICS、SKAB、MSL和J10031 基于不同评分函数的数据集的比较结果。结果表明检测模型和评分函数的选择对异常检测有不同程度影响。与其他算法相比,MTAD-GAN的性能提高了0.01∼0.4;与其他评分函数相比,ADGS由于结合了多个损失项,能够更好地识别异常情况,模型性能提高了0.16∼0.4。
结论: 多变量时间序列的异常检测是油气站场智能运行的一项重要任务。本文提出了一种基于数字孪生和MTAD-GAN的无监督多变量时间序列异常检测方法,构建了与油气站实际运行逻辑相匹配的数字孪生系统,通过随机Petri网实现了高效的虚实映射。基于数据样本之间的相关性,结合知识图谱注意力和时间霍克斯注意力机制,对多变量时间序列的数据进行同步建模,并通过知识感知的迁移学习机制,学习样本的概率分。将此方法应用于油气站场的异常检测,证明了所提方法在异常检测中的有效性。
作者简介:
连远锋,博士,现任中国石油大学(北京)副教授、硕士生导师。科研工作涉及图像处理与虚拟现实、机器视觉与机器人、深度学习与数字几何。同时从事遥感影像处理、数字孪生与智能机器人巡检、基于粒子的泄漏模拟与可视化等技术开发与工程应用工作。