点击数: 更新日期: 2023-02-23
中文题目:基于随机森林与图波网络的时空数据预测方法
论文题目:Combining Random Forest and Graph WaveNet for Spatial-Temporal Data Prediction
录用/见刊时间:2022.12.02
作者列表:
1) 陈冲(教师) 中国石油大学(北京)信息科学与工程学院
2) 许艳博(学生) 中国石油大学(北京)信息科学与工程学院 研 20
3) 赵继轩(学生) 中国石油大学(北京)信息科学与工程学院 研 20
4) 陈陆陆(学生) 中国石油大学(北京)信息科学与工程学院 研 19
5) 薛亚茹(教师) 中国石油大学(北京)信息科学与工程学院
文章简介:
摘要:
随着自主传感器网络的广泛应用,时空数据的数量在迅速扩大。然而,传统方法在处理时空依赖性方面有其局限性。本文结合随机森林(RF)和图波网(GWN),提出了一种新的深度学习模型(RF-GWN)。在RF-GWN中,通过将RF的变量重要性测量(VIM)与GWN的长时间序列特征提取能力相结合,制定了一个新的自适应权重矩阵,以捕获潜在的空间相关性并从输入数据中提取长期相关性。
背景与动机:
时空数据预测的关键是从数据中准确提取时空属性,并在此基础上建立预测模型。RF由多个决策树(DT)组成,不仅可以处理分类和回归问题,还可以分析关键度量。因为我们设计了一种新的时空序列预测模型(RF-GWN),它有效地结合了RF和GWN。该模型可以利用RF的变量重要性测量(VIM)有效地提取时空数据中复杂和动态的时空相关性。在时间相关性方面,融合了GWN的长序列时间特征提取能力,以堆叠多个时空层,以较浅的网络捕获较长的时间序列特征,有效地缓解了过度拟合。
设计与实现:
在时空图模型中,时序预测的映射关系可表示为:
所提出的深度学习框架(RF-GWN)如图1所示。该框架由输入层、堆叠的时空层和输出层组成。时空层由图卷积模块和门控时间卷积(门控TCN)层构成。在图卷积模块中,通过引入RF来构造自适应邻接矩阵以捕获潜在的空间相关性。
图1 RF-GWN的框架
结合RF的图形卷积层
重要性得分用于测量图结构中节点之间的空间相关性。
基于从RF的VIM计算的节点的重要性分数来设置阈值。大于或等于阈值的节点用作目标节点的实际预测邻居节点。阈值的具体值需要根据实际的图形结构来确定。
重要性得分作为自适应权重矩阵。权重矩阵不需要先验知识,将在整个模型训练过程中用作模型参数。
门控TCN
我们使用扩展的因果卷积作为时间卷积层来捕获时间关系。如图2所示:
图2 扩展的因果卷积
时间卷积模块选择门控机制来控制时间卷积网络的每一层中的信息流。如图3所示,门控TCN由两个TCN模块组成。TCN模块是扩张的因果卷积和双曲正切激活函数。一个TCN模块是扩张激活功能,另一个TCN模块是扩展的因果卷积和Sigmoid激活函数,以控制传递信息的比率。
图3 门控TCN模块
主要内容:
为了验证所提出的模型RF-GWN的有效性和适用性,在两个真实交通数据集(METR-LA、PEMS-BAY)和一个时空地下水数据集上进行了实验。比较了三种传统的基线模型,包括GWN、DCRNN和ST-GCN。RMSE、MAE和MAPE作为评价指标。
实验结果及分析:
交通数据集实验
图4 RF-GWN预测曲线(METR-LA)
图5 RF-GWN预测曲线(PEMS-BAY)
表1 METR-LA数据集上不同模型的性能标准比较
表2 PEMS-BAY数据集上不同模型的性能标准比较
地下水数据集实验(以观测孔"WangQiZha" and "22"为例)
图6目标观测孔地下水位预测结果
图7 42个观测孔的RMSE
表3不同模型的预测结果和训练时间比较
结论:
我们在这项工作中提出了一种改进的时空序列预测模型RF-GWN。在交通流量和地下水位两个领域的真实数据集上进行了实验,并从自适应权重矩阵、预测结果和多个基线模型预测结果的评价指标比较三个方面进行了详细分析。
结果显示我们的模型引入RF可以显著减少冗余参数、在两个领域的数据集上都能做到更好的提取局部特征、提高模型捕获时空相关性的能力,比基线模型的预测结果更准确。证明了模型的适用性和有效性。
作者简介:
陈冲,博士,中国石油大学(北京),信息科学与工程学院电子信息工程系,硕士生导师,中共党员。研究方向:数值模拟、参数反演、机器学习、信息融合、不确定性分析。
联系方式:chenchong@cup.edu.cn