点击数: 更新日期: 2020-08-13
A comparative study among machine learning and numerical models for simulating groundwater dynamics
in the Heihe River Basin, northwestern China
录用时间:2020年02月07日
期刊:Scientific Reports(JCR Q1)
作者列表:
1) 陈 冲 (中国石油大学(北京) 信息科学与工程学院)
2) 何 为 (中国石油大学(北京) 信息科学与工程学院 电子信息工程系 博16)
3) 周 涵 (中国石油大学(北京) 信息科学与工程学院 电子信息工程系 研17)
4) 薛亚茹(中国石油大学(北京) 信息科学与工程学院)
5) 朱明达(中国石油大学(北京) 信息科学与工程学院)
DOI链接:https://doi.org/10.1038/s41598-020-60698-9
背景与动机:
计算机建模已经成为各个自然学科的研究利器,也是地球系统科学的基本研究方法。目前,计算机模型主要分为经验模型、数值模型与统计模型。经验模型难以模拟动态系统;构建数值模型则需要大量的观测数据与专家知识,且难以权衡模型时空分辨率与计算消耗之间的矛盾;基于统计理论的机器学习模型则较好地解决了以上两种模型的不足。本研究以地下水系统为例,选择位于中国西北部的黑河流域作为研究区,对数值模型与机器学习模型在地下水系统模拟中的构建难度、模拟精度等进行研究,通过具体的性能指标为地下水系统建模中的模型选择提供依据,同时也将为其他领域的模型选择问题提供有益参考。
设计与实现:
1. 数据介绍。黑河流域位于我国西北部干旱区,是我国第二大内陆河流域,中游(38°38’N—39°53’,98°53’E—100°44’E;)为典型的干旱气候,年降水量稀少(69~216 mm),蒸发强(1453~2351 mm),是黑河流域经济和农业最发达的地区,全国最大的玉米制种基地。中游(见图1 (a))内主要河流有黑河干流与梨园河,莺落峡、正义峡水文站分别为黑河干流上下游分界点。研究者通过观测地下水位以及地表河流流量以认识地下水系统在驱动因素的影响下的动态变化,影响地下水系统动态变化的因素主要有自然因素(上游径流下泄、地下地表水交换、植物蒸散发、降水、南边界入流)和人类活动因素(抽水变化导致的地下地表水交换增加、地表植被的变化导致的蒸散发不同),地下水系统循环过程见图1 (b)。
(a) (b)
图1. (a) 黑河流域中游;(b) 地下水系统循环过程
2. 方法介绍。分别采用机器学习模型与数值模型构建黑河流域中游地下水系统模型。机器学习方法选择多层感知机(Multi-layer perceptron)、径向基网络(Radial basis function network)与支持向量机(Support vector machine)等典型方法;数值模拟则选择MODFLOW(Modular Three-dimensional Finite-difference Ground-water Flow Model)构建地下水系统模型。
3. 实验结果。对模型计算时间、模拟精度、预测精度以及模型的泛化能力进行评价(见表1、表2与图2)。经过对比发现,相比于数值模型,机器学习模型消耗了更少的计算时间得到了更优的模拟精度与预测精度;而数值模型的泛化能力优于机器学习模型。因此,机器学习模型适用于对实时性要求高、需要多次运行模型且不必考虑物理机制的情景(如实时模型、敏感性分析、不确定性分析、优化等)。
表1. 校正/训练期指标对比
Numerical model
MLP model
RBF model
SVM model
RMSE
Groundwater level (m)
5.61
0.99
0.84
0.83
Streamflow rates (m3)
1.76×106
1.09×106
1.16×106
R2
Groundwater level
0.52
0.71
0.75
0.76
Streamflow rates
0.51
0.66
Time
Calibration
months
days
Computation
1898 s
716.9 s
4.2 s
1.0 s
表2. 预测期指标对比
5.84
1.69
1.12
1.71
2.05×106
1.69×106
1.21×106
1.17×106
0.65
0.50
0.54
0.79
Time (s)
30
0.07
0.06
0.10
图2. 不同模型泛化能力对比