基于CNN-BiLSTM-AM的储层岩石脆性指数预测

2023-10-21 02:36杜睿山李宏杰孟令东
计算机技术与发展 2023年10期
关键词:脆性测井岩石

杜睿山,李宏杰,孟令东

(1.东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318;2.油气藏及地下储库完整性评价黑龙江省重点实验室,黑龙江 大庆 163318)

0 引 言

在处理岩石工程时,脆性被认为是一个重要的岩石参数。例如,在天然气和石油工程领域,评估井筒稳定性以及评估水力压裂作业的性能需要充分了解岩石脆性。岩石脆性是指岩石在发生很小变形即破坏的性质,是井筒稳定性评价和水力压裂评估的参数之一[1]。在非常规油气勘探开发过程,特别是页岩和致密砂岩油气,储层脆性评价和预测更是不可或缺的研究内容[2]。

脆性的定义已经提出了很多,但由于工程中需要的目的不同,脆性的测量和识别仍然没有统一的规则。目前测井数据评价岩石脆性的方法可以分为以下几类:基于脆性矿物含量的脆性评价、基于岩石力学参数的脆性评价和基于应力-应变曲线的脆性指数评价。现在应用较为广泛的是基于岩石力学参数的脆性指数评价,其计算需要杨氏模量和泊松比等弹性参数,而参数的计算需要横波测井和岩性-密度测井,由于测井服务成本高,传统上不采用,因此有时需要从局部经验拟合方程粗略计算弹性参数,这可能会给最终的脆性结果带来较大的误差。另外,由于岩石的脆性特征是在一定的地层条件下的岩石不同矿物组成、结构和物理力学性质的综合结果[3]。因此,想要全面体现岩石的脆性特征,需要综合考虑多条测井曲线。

近年来,岩石脆性已被许多地质力学领域的研究者广泛研究,大量研究使用机器学习(ML)和人工智能(AI)技术来解决科学和工程领域的相关问题。一些学者也比较倾向于建立基于数据的脆性关系,具体的测井曲线或储层属性与脆性指数的关系。部分学者的研究中,已证实了脆性指数与一些常规测井曲线具有良好的关系。在一些页岩气储层中,矿物学脆性与自然伽马/光电吸收截面指数(自然伽马与光电吸收截面指数比)、孔隙度、纵波时差等之间存在良好的关系[4-6]。时贤等人[7]利用人工智能技术预测了岩石脆性,并在论文中说明矿物学信息和测井信息的结合有助于更好地扩展有限的矿物学数据,同时反映井下情况。袁思乔等人[8]基于多测井曲线利用层次分析法对脆性指数进行了预测。叶亚培等人[9]基于常规测井数据,利用PCA-BPNN的方法对脆性指数进行了预测,实验结果表明,该方法具有较高的准确性。

1 相关工作

根据前人的研究表明,利用常规测井曲线去预测脆性指数是可行的,因此,该文利用机器学习和深度学习的方法进行脆性预测,基于岩石力学参数杨氏模量和泊松比构建的脆性数据集,建立常规测井参数与脆性指数的关系模型,准确地将脆性指数与测井参数关联起来。这种关联的优势在于:可以使用廉价且相对简单的预测技术来估计整口井的脆性指数,而且大多数井的测井输入数据都可以在整口井中获得,而不需要收集额外数据。

之前的一些研究承认机器学习技术在解决工程问题方面的适用性,但仍有一些技术未被使用或几乎未被用于预测岩石脆性指数[10]。前人的研究几乎都是利用传统机器学习方法或者统计学习方法,虽然可以建立常规测井曲线与脆性指数的模型,但是未能考虑测井曲线的序列特征,因此可能会带来一定的误差。该文选取双向长短期记忆神经网络,因为其可以综合考虑过去和未来信息,使得序列信息在模型中一直传递下去,从而更能保证结果的有效性。

该文基于常规测井曲线数据,选取多条测井曲线数据为输入,以脆性指数为输出,首次将双向长短期记忆神经网络引入到脆性指数预测中,采用CNN-BiLSTM-AM神经网络进行实验,构建出常规测井曲线和脆性指数的关系模型,对储层岩石的脆性指数进行预测与分析,并和多种机器学习方法进行对比,以验证该模型的优越性。借助Pearson相关系数分析,研究了各测井曲线对脆性的敏感性等级。利用这些变量,比较了若干种机器学习模型和文中所提模型的性能。从神经网络模型获得的脆性数值结果揭示了CNN-BiLSTM-AM在预测过程中的高精度和高效率,这有助于使用现有的实验数据进行更好的脆性预测。

2 方法原理

2.1 CNN概述

CNN(卷积神经网络)的局部感知和权值共享可以大大减少参数的数量,从而提高模型的学习效率。CNN主要由三部分组成:卷积层、池化层和全连接层[11]。每个卷积层包含多个卷积核,其计算公式见公式(1)。对卷积层进行卷积运算后,提取数据的特征。然而,提取的特征维数非常高。所以为了解决这个问题,降低网络训练的成本,在卷积层之后增加了一个pooling层来降低特征维数。

lt=tanh(xt*kt)+bt

(1)

其中,lt为卷积后的输出值,tanh为激活函数,xt为输入向量,kt为卷积核的权值,bt为卷积核的偏置值。

2.2 LSTM与BiLSTM概述

2.2.1 LSTM

常规的RNN会发生梯度消失或者梯度爆炸问题[12],导致不收敛,从而致使网络预测效果不佳。为此,后来的学者对其进行了改良,LSTM通过添加3个门来控制不同时序对后续信息的影响同时使用隐状态和细胞状态传递信息,使得LSTM能够综合局部信息和序列信息[13]。

图1是常见的长短期模型记忆单元,主要由遗忘门、输入门和输出门这三个门组成。

图1 LSTM 网络重复单元结构

每个门的具体公式如下所示:

ft=σ[Wf(ht-1,xt)+bf]

(2)

it=σ[Wi(ht-1,xt)+bi]

(3)

Ct=ftCt-1+itCtt

(4)

Ot=σ[Wo(ht-1,xt)+bo]tanhCt

(5)

式中,ft是t时刻遗忘门的输出,ht-1为前一时刻的隐状态,xt为当前时刻的输入,Ot是t时刻输入门的输出;Ctt是t时刻tanh层的输出;Ct为t时刻的细胞状态,it是t时刻输入门的输出,Wf、bf是遗忘门的权重和偏置;Wi、bi是输入门的权重和偏置;Wo、bo是输出门的权重和偏置。

2.2.2 BiLSTM

BiLSTM(双向长短期记忆)神经网络由两层独立的LSTM层构成(如图2所示),一层前向LSTM和一层后向LSTM,是对LSTM的改进,BiLSTM可以综合考虑历史信息与未来信息,所以较普通LSTM有更好的效果。

图2 BiLSTM示例图

2.3 AM概述

注意力机制(Attention Mechanism)的主要思想来源于人类视觉注意的过程[14]。AM选择性地关注一些比较重要的信息,忽略不重要的信息,可以分配信息的重要性。

如图3所示,AM的计算过程一般分为三个阶段:(1)相似度计算阶段;(2)归一化处理阶段;(3)注意力加权求和阶段,每阶段具体公式如下:

图3 AM流程

St=tanh(Whht+bh)

(6)

(7)

(8)

其中,Wh为AM的权值,bh为AM的偏置,ht为输入向量,Wh、bh为各层的共享权值,v为注意值。

2.4 CNN-BiLSTM-AM模型

CNN具有关注视线中最明显的特征的特点,因此在特征工程中被广泛应用。BiLSTM具有按时间序列展开的特点,在时间序列分析中应用广泛。AM具有将时间序列数据的过去特征状态添加到输出结果的重要特性。

根据CNN、BiLSTM和AM的特点,充分发挥各自的优势,该文提出了一种基于CNN-BiLSTM-AM的岩石脆性预测模型。模型结构如图4所示,主要结构有CNN、BiLSTM、AM,包括输入层、CNN层(一维卷积层、池化层)、BiLSTM层(正向LSTM层、反向LSTM层)、AM层、输出层。

图4 CNN-LSTM-AM模型

(1)输入层:对脆性数据集进行切片处理,并将处理好的数据作为CNN层的输入。

(2)CNN层:其有共享权重和局部感知等特点,这意味着CNN具有独特的优势。该文使用卷积和池化操作从测井曲线序列数据中提取特征。

(3)BiLSTM层:该层由正向LSTM和逆向LSTM组成。与LSTM相比,BiLSTM可以双向提取测井曲线序列信息,更好地收集来自CNN的数据的正向和反向依赖关系,对特征信息进行选择性记忆和遗忘,学习测井信息随深度的变化趋势和前后相关性,有效防止梯度消失或爆炸。

(4)AM层:注意力层可以对特征进行进一步的信息筛选,对不同的特征赋予不同的权重,有选择地从模型训练过程中学习特征和关键信息,过滤无用信息,从而提高模型预测的准确性。

(5)输出层:输出AM层加权求和的预测结果,然后将测试集输入训练好的模型进行预测,生成脆性指数预测结果。

该文研究的一种基于CNN-BiLSTM-AM的脆性指数预测模型具体流程如图5所示。

图5 CNN-LSTM-AM流程

(1)采集区域内井的数据,构建出基于岩石弹性参数的脆性指数数据集。

(2)对测井数据进行处理,并且进行Pearson线性相关性分析以及XGBoost特征重要性分析,筛选特征,提升模型预测的精度以及速度。

(3)划分步骤二中归一化后的数据集,按照7∶3的比例划分为训练集和测试集。

(4)利用前馈传播计算输出本次迭代的预估值,然后再反向计算每个神经元的误差项值,经过Adam优化参数后继续训练模型。

(5)将训练步数作为终止条件,若达到终止条件,则返回最优结果,否则继续步骤四。

3 实验及分析

实验环境:实验在Windows平台进行,计算机具体配置如下:处理器为酷睿i7-9700K,显卡为英伟达GTX2070和16G内存条,所提模型基于python深度学习框架。

3.1 数据获取

实验数据集来源于胜利油田某井的常规测井数据,脆性指数是基于岩石力学参数杨氏模量和泊松比计算而来的,具体计算公式如式(9)所示:

(9)

其中:

(10)

(11)

式中,BI0为岩石脆性指数;ΔEs为杨氏模量;ΔPRs为泊松比;Es为静态杨氏模量106psi(1psi=0.006 894 8 MPa);PRs为静态泊松比,无量纲。

3.2 测井参数分析

该文收集了完整的测井数据集,包括声波时差(AC)、井径(CAL)、密度(DEN)、中子(CNL)、伽马射线(GR)、自然电位(SP)和深度侧向测井(LLD)等曲线。其中LLD测井曲线表示地层电阻率,主要受地层流体和饱和度控制,与岩石力学性质无关,因此首先剔除LLD测井曲线。其次,通过分析实测BI(脆性指数)值与相应的测井数据之间的关系,选择合适的测井参数进行脆性评价是模型构建的关键步骤,因为输入参数与脆性指数值密切相关的测井数据可以准确地预测脆性指数值。以Pearson相关系数为关键指标,考察脆性对测井曲线的线性依赖程度,具体的Pearson相关系数计算公式如下:

(12)

从图中6可以看出,除了SP与BI无明显的线性相关性,其余曲线都与BI有着或多或少的相关性。AC、CNL、CAL与BI呈负相关性,且AC、CNL与BI的负相关性较大;DEN、GR与BI成正相关,其中部分结果可以从岩石物理角度加以说明。

AC、CNL、DEN曲线与脆性指数有着重要的关系,因为岩石孔隙度的增加会导致岩石脆性的降低。总有机碳(TOC)含量高的页岩会产生较高的伽马射线值,前人研究表明,有机质主要富集在硅质页岩和碳质页岩中,由于存在适量的石英和碳酸盐矿物,这类岩石具有较高的BI值,因此,BI高的岩石通常具有较高的GR[9]。本数据集中,SP曲线虽然与BI无明显的线性相关性,但SP与岩石孔隙度相关,也是一个十分重要的参数。从以上可以看出,本研究所选取的测井曲线几乎都是与BI有着重要的物理关系。

3.3 特征重要性分析以及特征筛选

虽然CAL、GR、SP与BI的线性相关性并不明显,但是不排除它们之间有着非线性关系,因此有必要进一步分析。采用XGBoost方法进行特征重要性分析,XGBoost可以找到特征和目标之间的非线性关系,其在分裂时会使用最高信息增益的特征作为分裂条件。当某一个特征多次被用来构建决策树,其重要性就会越高,经XGBoost排序后的重要性如表1所示。

表1 特征重要性排序

考虑到特征之间可能存在线性相关性较高的特征,即冗余特征,因此对两两测井参数之间进行Pearson相关性分析,图6可以看到测井曲线之间的线性关系。AC与CNL曲线相关性程度高达0.824,根据Pearson相关系数定义,AC与CNL具有强相关性,对模型最终结果有着几乎相同的影响,因此,舍弃CNL。再结合XGBoost特征重要性排序结果,CAL、SP和GR得分较靠前,也属于重要参数。因此将AC(声波时差)、CAL(井径)、DEN(密度)、GR(自然伽马)、SP(自然电位)作为神经网络的输入参数,这样可以避免规模过大的问题,保证更快的运行速度和更高的精度。

图6 皮尔逊相关系数

3.4 数据归一化

本研究的主要目的是利用常规测井资料对储层脆性指数进行预测。因此,将测井曲线作为网络的输入,而将脆性值作为网络的输出。考虑到每一种测井曲线的量纲不一,所以要进行无量纲化处理,通过归一化转换将数据集中的数据缩放到一个区间。采用常用的min-max归一化方法,将数据线性缩放到0~1之间的值:

(13)

表2 数据集部分数据

表3 神经网络超参数选择情况

之后是数据集的划分,将数据集以7∶3的比例划分为训练集和测试集。因此在这个模拟中,大约70%的数据用于训练,30%用于测试。为了评价预测结果,以均方误差(MSE)和均方根误差(RMSE)作为性能指标。表达式如下:

(14)

(15)

其中,yi为测量数据,f(xi)为预测数据,n为用于训练或测试神经网络的样本个数。

3.5 模型参数选择与训练

为了保证实验公平,对涉及到的神经网络模型统一采用Adam优化器优化内部参数。Adam是一种基于低阶矩自适应估计的随机目标函数一阶梯度优化算法,该算法易于实现,计算效率高,内存需求小。Adam通过优化目标函数,也适用于BiLSTM神经网络,其目标是找到一组使均方误差最小化的参数[15]。

在CNN-LSTM-AM模型实验过程中,需要对神经网络的超参数进行调整,以保证神经网络的性能尽可能最优,影响模型效果的超参数主要有四个:批处理参数、训练步数、学习率以及激活函数。超参数优化最常用的是人工搜索,人工搜索需要耗费较大的时间和精力。若通过正交试验法获得最优组合超参数,将耗费大量的资源和时间,并且不能确保得到的超参数组合是最优解。因此,该文选取经典群智能算法-粒子群算法进行超参数优化。

经粒子群寻优后,当批处理参数为32,训练步数为50,学习率为0.005,隐层神经元个数为64时,模型效果最好。

3.6 实验结果与分析

为了进一步验证文中模型在脆性预测中的效果,选取集中传统机器学习方法进行对比,并与文献[9]提出的方法进行了对比。同时为了减少实验误差,将模型运行10次,取平均值为最终预测结果,因测试集数量较多,不好进行观察,所以选择了部分测试集的预测进行结果展示,预测结果对比如图7~10所示,横坐标是测试集的数量,纵坐标是脆性指数。

图7 SVR预测结果

图8 随机森林预测结果

图9 PCA-BPNN预测结果

图10 CNN-BILSTM-AM模型预测结果

总体来说,CNN-BiLSTM-AM模型得到的低偏差说明了其具有较好的预测能力。虽然传统的机器学习算法在预测过程中不如CNN-BiLSTM-AM强,但是它们仍然可以被认为是一种较为可靠的脆性预测方法。

在训练和测试过程中,CNN-BiLSTM-AM在MSE和RMSE误差方面(见表4)都比传统机器学习模型表现更好。实验结果表明,该模型在预测岩石脆性精度方面要更加优于传统机器学习模型,符合实验的预期成果。传统方法忽略了测井曲线内部信息的关联,BiLSTM可以有效地考虑上下文信息,因此会比传统的方法更为精确,另外,在双向长短期的基础上添加了一维卷积进行特征提取,同时也添加了注意力机制,可以有针对性对地给特征分配权重,从而有更小的误差。

表4 各模型的MSE和RMSE

4 结束语

该文讨论了传统的机器学习模型和CNN-BiLSTM-AM模型在预测页岩储层脆性方面的应用,得出了以下结论:

(1)CNN-BiLSTM-AM模型选取多条常规测井曲线作为输入变量,脆性指数作为输出变量,成功地对岩石脆性进行了准确、可靠的脆性指数预测,为储层脆性预测提供一种新途径。

(2)传统的机器学习模型和CNN-BiLSTM-AM模型都可以进行脆性预测,但是CNN-BiLSTM-AM模型的误差小于其他模型,并且该文运用相关系数矩阵分析等数据挖掘技术有助于提取特定数据集的最重要和最相关的特征。

(3)建立的CNN-BiLSTM-AM模型较为复杂,所以运行速度比其他模型慢,仍可以进一步对其进行优化,提升预测的速度和效率。

猜你喜欢
脆性测井岩石
本期广告索引
第五章 岩石小专家
八扇区水泥胶结测井仪刻度及测井数据处理
3深源岩石
一种叫做煤炭的岩石
一种零件制造过程工序脆性源评价方法
海藻与岩石之间
考虑初始损伤的脆性疲劳损伤模型及验证
基于能量耗散的页岩脆性特征
高强度厚壁钢的回火脆性研究