点击数: 更新日期: 2024-04-12
中文题目:基于离散元方法及可解释机器学习框架的砾岩水力裂缝扩展研究
论文题目:Investigation of hydraulic fracture propagation in conglomerate rock using discrete element method and explainable machine learning framework
录用期刊/会议:Acta Geotechnica(中科院大类一区 Top期刊;JCR Q1)
原文DOI:https://doi.org/10.1007/s11440-024-02317-9
原文链接:https://link.springer.com/article/10.1007/s11440-024-02317-9
录用/见刊时间:2024年4月5日
作者列表:
1)申屠俊杰 中国石油大学(北京)信息科学与工程学院/人工智能学院 科研助理
2)林伯韬 中国石油大学(北京)信息科学与工程学院/人工智能学院 教师
3)金 衍 中国石油大学(北京)石油工程学院 教师
4)Jeoung Seok Yoon DynaFrax UG 研究员
文章简介:
本文提出了一种基于离散元方法(DEM)以及可解释机器学习框架(XGBoost-SHAP)的裂缝形态预测模型。首先,采用Voronoi网格结构实现砾岩中砾石与基质的几何构建,建立了真实、精细的砾岩DEM数字模型。其次,考虑砾岩组分强度、渗透率、地应力及压裂液性质多种影响因素,开展参数敏感性分析,并为机器学习模型提供训练资料。最后,基于模拟结果训练XGBoost-SHAP,实现高精度裂缝形态预测并提供预测依据。
摘要:
砾岩油气藏作为重要的非常规油气资源,具有低孔、低渗等特点,通常需要配合大规模水力压裂技术实现增产,但其强非均质性会引发水力裂缝不规则扩展,增大裂缝形态预测及压裂方案部署的难度。为进一步探究砾岩中水力裂缝扩展机制并指导裂缝形态预测,本文提出了一种基于离散元方法(DEM)以及可解释机器学习框架(XGBoost-SHAP)的裂缝形态预测模型。此外,本文采用Voronoi网格结构描述砾岩的几何特征,建立了更真实、精细的三维砾岩DEM数字模型。在考虑到岩石基质-界面-砾石结构的前提下,研究了多种因素(包括各组分强度和渗透率、地应力、压裂液性质等)对裂缝扩展和诱发微地震事件点的影响,总结了穿砾及绕砾两种扩展行为。最后,本文讨论了不同裂缝行为的机理,揭示了多因素的协同影响机制,并采用了由XGBoost和SHAP组成的可解释的机器学习框架,在模拟数据上训练后可实现高精度裂缝形态预测,并为预测结果提供全面解释,为实际工程决策提供支持。
背景与动机:
在砾岩储层水力压裂过程中,其非均质性强化了裂缝扩展机制的复杂性,增加了裂缝形态预测难度。传统的砾岩水力裂缝扩展规律研究大多展示定性的分析结果,无法对实际工况进行预测。本文针对此不足,提出了基于离散元方法(DEM)以及可解释机器学习框架(XGBoost-SHAP)的裂缝形态预测模型,从而实现高精度裂缝形态预测,并为预测结果提供解释及依据。
设计与实现:
本文首先建立了基于Voronoi网格结构的DEM砾岩数字模型及流固耦合压裂算法,其次针对多种影响因素开展了参数分析,为机器学习模型提供训练资料,最后利用XGBoost-SHAP给出高精度的裂缝形态预测结果并提供预测依据。主要内容如下:
1.基于Voronoi网络结构的三维DEM砾岩数字模型
三维Voronoi网格结构表现为填充整个模型空间的三维多面体的集合,多面体间不存在重叠或间隙,且三维多面体可充分体现砾石的几何特征,是构建砾岩等类多晶材料的理想构型。此外,利用三维Voronoi网格结构可构建任意砾石含量的砾岩模型,弥补了传统随机生成砾石方法的不足。图1为不同砾石含量DEM砾岩数字模型。
(a) (b) (c)
图1 砾石含量(a)25%;(b)50%;(c)75%的DEM砾岩数字模型
2.三维DEM流固耦合压裂算法
水力压裂中的水力裂缝扩展被认为是一个复杂的流体-岩石相互作用过程,因此在模拟时需考虑流固耦合作用。本文提出了基于三维DEM的流固耦合压裂算法,其主要原理如图2所示。根据DEM颗粒分布实施Delaunay三角剖分并生成流体网络,其基本单元为四面体。流体网络中的单元代表岩石中的孔隙,两个相邻的四面体由流体通道连接,当相邻单元间存在压差时,流体通道中的流体运移速率由Hagen–Poiseuille方程表示:
(1)
其中,μ为流体粘度,△P为相邻单元间压差,和分别为流体通道的长度和半径。
图2 三维DEM流固耦合压裂模型示意图
3.XGBoost-SHAP可解释机器学习框架
XGBoost是一种集成学习算法,由多个决策树子模型组成,这些子模型按顺序构建并逐步缩小预测值与实际值之间的差距。样本i在经过t次优化后的预测值为:
(2)
其中,为第t-1棵决策树的预测值,为第t棵决策树的预测结果。因此XGBoost的优化目标可表示为:
(3)
其中,为样本i的实际值与预测值之差,为一正则化项,其计算所有t棵决策树的计算复杂度从而防止模型过拟合。
基于DEM砾岩数字压裂模拟结果,本文选取了对裂缝形态影响显著的6个因素,并重新组合形成4个特征作为XGBoost模型输入,分别为界面抗拉强度/砾石抗拉强度、界面渗透率、水平地应力差+垂向地应力差及压裂液粘度×排量。此外,根据模拟结果将XGBoost设置为二元分类模型,其预测结果为0(绕砾)或1(穿砾),以表征裂缝遇砾行为。训练数据集包含79组数据,其中50组由DEM模拟产生,29组来自参考文献。由于数据集规模较小,因此采用10组不同的随机种子分割数据集(90%训练集,10%测试集),形成80组测试数据。其次,本文通过SHAP模型对XGBoost模型的预测结果进行解释,给出预测依据。SHAP通过博弈论中的Shapley值计算每个输入特征对最终预测结果的贡献值:
(4)
其中,g为解释模型,M为输入特征的数量,为特征j的Shapley值,定义为某特征值对模型预测的边际贡献,是所有可能特征值组合的加权及总和,表示为:
(5)
其中val(*)为待解释模型,S为输入特征的子集,为不含的特征集合。
实验结果及分析:
一、DEM砾岩压裂模拟结果
基于Voronoi网络结构的三维DEM砾岩数字模型与流固耦合压裂算法相结合能实现精准的裂缝扩展过程计算。图3为砾岩压裂模拟结果与实验结果对比图,两者均体现了穿砾及绕砾两种遇砾扩展模式。
(a) (b)
图3 砾岩水力压裂结果:(a)室内实验;(b)三维DEM模拟
此外,开展多种因素(各组分强度和渗透率、地应力、压裂液性质等)对裂缝扩展和诱发微地震事件点的影响研究,揭示了不同因素对裂缝形态的影响机制,并为机器学习提供了先验知识(如输入特征选取依据及训练数据集构建等)。
二、XGBoost裂缝形态预测结果
根据DEM模拟获取的先验知识,选取对裂缝形态影响较大的6个因素并重组形成4个输入特征,分别为界面抗拉强度/砾石抗拉强度、界面渗透率、水平地应力差+垂向地应力差及压裂液粘度×排量,并将预测设置为二元分类任务,输出结果为0(绕砾)或1(穿砾)。预测结果如表1所示,在80组测试数据中,XGBoost的整体准确率达到了80%。
表1 五种模型在测试集上的评估指标
Actual value
Predicted value
Count
Deflection
40
Penetration
24
8
三、SHAP解释结果
在XGBoost完成预测后,采用SHAP对预测结果进行解释。图4展示了训练集数据的SHAP值,其中Feature value表示相应特征的输入值,SHAP值为正的特征值有利于穿砾,而SHAP值为负的特征值有利于绕砾,可看出较高的界面渗透率和强度差会促进裂缝遇砾偏转,而较高的地应力差、粘度和排量会促进穿砾。
图4 训练集数据SHAP值分布示意图
此外,SHAP可对所有输入特征的贡献值进行综合分析,计算每个特征的平均SHAP值并获取宏观贡献值。如图5所示,地应力差值对预测结果的影响程度最高。
图5 输入特征平均SHAP值
四、案例分析
利用XGBoost-SHAP可解释机器学习框架,可实现对单独案例的裂缝形态预测及结果解释,并生成特征对抗图以辅助理解。本文从参考文献中选取了6组案例,并将相应特征值输入预训练的XGBoost生成预测结果,如表2所示,可看出XGBoost对6组案例均做出了正确预测。进一步地,利用SHAP对每个案例的预测结果进行解释并生成特征对抗图,如图6所示。图中f(x)为所有输入特征的累计贡献值,当f(x)高于基准值(base value)时,代表预测结果为穿砾,反之当f(x)低于基准值(base value)时,代表预测结果为绕砾。特征颜色为红色时表示其有利于穿砾,为蓝色时表示其有利于绕砾,且特征条长度体现其贡献程度。
表2 五种模型在测试集上的评估指标
No.
Strength ratio (dimensionless)
Interface permeability (mD)
Sum of stress difference (MPa)
Viscosity injection rate (´10-10N∙m)
Fracture behavior
Predicted behavior
1
1.04
200
25
360
2
0.6
100
15
3
0.1
18
4
10
5
0.09
20
1´104
6
0.05
0
图6 研究案例特征对抗示意图
结论:
1. 基于Voronoi网络结构的三维DEM砾岩数字模型能准确体现砾岩的几何及力学特征,与流固耦合压裂算法配合实现精准的裂缝扩展过程计算。
2. 在从模拟结果中获取的先验知识指导下,通过优选输入特征,使得XGBoost在小样本数据集上取得较高的预测精度。
3. SHAP可对XGBoost的预测结果进行定量化解释,不仅可对整个数据集进行宏观解释,还可针对某个特定案例给出微观解释,从而为压裂方案制定提供有力指导。
通讯作者简介:
林伯韬, 博士,中国石油大学(北京)信息科学与工程学院/人工智能学院计算智能教学与研究中心教授/博导。主要研究方向为智能石油工程、工业数字孪生和智慧能源金融。