论文题目:成品油管道运行多参数时空模式提取与可视化
录用期刊/会议:计算机辅助设计与图形学学报 (CCF A)
作者列表:
1)纪连恩 中国石油大学(北京)信息科学与工程学院/人工智能学院 计算机系教师
2)邢智博 中国石油大学(北京)信息科学与工程学院/人工智能学院 计算机科学与技术 硕 20
3)吴 昆 中国石油大学(北京)信息科学与工程学院/人工智能学院 计算机技术 硕 21
4)赵 伟 中国石油大学(北京)机械与储运工程学院 油气储运工程系 博 19
摘要:
成品油管道系统不仅具有典型的时空特点,且其运行模式需要由多个监测参数综合表征,现有时空模式分析方法难以揭示多参数的综合时空特征,因此提出一种基于多参数融合的张量分解方法用于成品油管道运行多参数时空模式的提取。该方法通过对多维管道监测参数进行信息量及相关性分析实现分组融合,然后将融合后的时空数据建模为张量并使用张量分解及聚类方法获取多维时空模式,最后通过对不同模式下原始多参数变化趋势的对比分析,进一步发现和解释运行模式的时空规律。基于此方法设计了一套可视化系统,以支持用户从不同分析角度对多参数表征的综合时空模式进行提取及可视化,基于真实成品油管道数据的案例研究表明了该方法的有效性,为复杂成品油管道数据分析提供了一种新的手段和思路。
背景与动机:
成品油管道长时间运行产生的历史数据属于典型的大规模高维时空数据, 且具有长周期、大跨度等特点; 而对管道运行模式的分析则通常需要综合多个(类)监测参数, 对单个参数的分析结果往往不具有实际意义。为此, 有必要从多参数分析角度对管道历史数据中蕴含的时空模式进行探索, 以有效支持管道调度计划的合理安排及起泵方案等的优化。然而, 传统的时空模式分析方法以建模求解为主, 计算过程复杂耗时,分析过程也缺乏领域专家的有效介入, 难以实现长周期下多参数综合表征的复杂时空模式提取。近年来,交互式可视化与张量分解相结合的探索方法得到有效应用,但此类方法仅支持单参数时空模式的分析。因此,研究充分利用领域知识灵活、有效地融合多参数实现对多维综合时空模式提取与展示具有重要意义。
设计与实现:
针对管道运行多参数难以融合分析的问题,本文设计了基于因子分析法的多参数分组融合方法对多类参数根据分析目标进行分组融合。具体过程如下:
(1)通过计算参数信息熵辅助用户更准确的评价原始数据集中不同参数的复杂程度。对于参数的每个样本值,根据其在数据集中出现的频率来计算其信息熵值,如下所示:
信息熵的计算结果用来评价数据集中参数值的不确定性和复杂性,信息熵值越大,表明该参数在样本集中数据取值越不稳定,数值差别较大,存在明显的动态变化特征。信息熵的评价方法可以帮助领域人员从数值变化角度进一步识别与评价各个参数的分析价值。
(2)通过量化一个变量根据另一个变量数据所获得的信息量来衡量2个随机变量之间的相互依赖关系即互信息,互信息越高,表明两参数间的相关性越强,更适合划分到同一组中进行分析。计算公式如下所示:
(3)基于信息熵和互信息的评价将关联性较强且包含特征较多的参数划分为同一参数组,然后通过因子分析法进行融合得到可以代表原始参数的综合参数。
接下来针对时空模式提取的问题,本文设计了一种结合聚类的连续秩一张量分解方法用于综合参数时空模式的提取,具体过程如图1所示:
图1 连续秩一张量分解示意图
Step1,张量建模。将综合参数的时空数据建模为三阶张量。其中S(Station)代表多个站场,D(Day)表示天数,T(Time)表示时间段的个数,将每天再分成多个时间段,例如按小时划分。得到的张量可表示为,其中代表在站场s处第d天第t时间段综合参数的数值。
Step2,张量分解。本文采用连续rank-1的CP分解方法,即每次分解用秩为1的张量来拟合原始张量,然后将原始张量与拟合后的张量做差得到剩余张量,对剩余张量再继续执行秩为1的CP分解,直到达到迭代次数或连续2次分解误差变化不大即可停止,其中误差计算如下所示:
本文将第一分解向量组用来表达原始张量的多维时空模式概览并对其进行可视化,得到综合参数在不同维度上的整体变化趋势。
Step3,模式提取。通过连续秩1张量分解得到了多组低维向量,这些向量组都不同程度保留了原始三阶张量的特征。将每个张量中包含的3个一维向量按不同维度进行划分,得到描述不同维度特征的特征向量组。通过聚类方法对特征向量组进行聚类,可以得到综合参数在不同维度上更详细的时空模式。
本文将以上时空模式提取方法与交互式可视化技术相结合,面向成品油管道运行多参数历史数据设计并实现了可视分析框架MPVis,如图2所示。
图2 MPVis主界面
实验结果及分析:
图3 管线输运模式分析(左),局部地区用油模式分析(右)
本文根据某成品油运输管道历史运行数据,选取管线输运模式和局部地区用油模式2个具有实际意义的角度进行了案例分析,如图3所示。两个案例的分析结果验证了MPVis系统的可用性和有效性。领域专家认为本文的分析方法及可视化手段能够在很大程度上降低工作复杂度,对现阶段管道领域基于数据驱动的决策支持来说具有较大指导意义。
表1 算法特征损失对比
另外,本文构造了多参数时空模式提取的基线方法,并利用上述两个案例数据从不同时空维度分别对多参数特征损失误差(越小越好)进行计算来对比分析本文方法的有效性。实验结果如表1所示,本文方法在各个维度上都有更好的表现,也就是说本文基于参数融合的张量分解方法可以更好地保留多参数的综合时空特征,同时提取的结果更为可信。
结论:
面向成品油管道历史运行的多参数数据,本文提出一种基于多参数融合的张量分解方法,用于提取历史数据中蕴含的时空模式,并从多参数分组融合、时空模式提取及可视化、原始多参数对比分析等角度设计了可视化系统MPVis。该分析方法及分析流程可以进一步应用到其他更广泛的工业过程领域,为多参数综合表征的时空模式提取与分析提供了有力支持。
作者简介:
纪连恩,博士,副教授,研究生导师。主要研究领域为大数据可视化与智能分析、可解释机器学习及工业领域应用、虚拟现实与计算机仿真、计算机图形学和人机交互技术等。主持和参与了国家自然科学基金、国家科技重大专项和重点企业合作项目多项。现为中国计算机学会(CCF)人机交互专委会委员、中国图象图形学学会(CSIG)可视分析专委会委员以及虚拟现实专委会委员。
联系方式:jilianen@cup.edu.cn