基于常规测井数据的火山岩岩性神经网络识别:以松辽盆地南部长岭断陷为例

2021-08-10 07:16洪一鸣王璞珺李瑞磊边伟华黄布宙郑健
世界地质 2021年2期
关键词:角砾凝灰岩火山岩

洪一鸣,王璞珺,李瑞磊,边伟华,黄布宙,郑健

1.吉林大学 地球科学学院,长春 130061; 2.中国石油化工股份有限公司 东北油气分公司,长春 130062; 3.吉林大学 地球探测科学与技术学院,长春 130026

0 引言

含油气盆地通常具有“火山--沉积”二元充填结构,随着油气勘探开发程度的不断深入,位于盆地深层的含火山岩层逐渐成为油气勘探的重要目标[1--4],由于火山岩类型多样,形成条件复杂,加上后期成岩改造强烈[5],导致有关火山岩储层形成机理、储集空间的形成与演化等认识不够深刻,给油气勘探开发带来了极大的挑战[6]。火山岩岩性的连续准确识别是开展火山岩油气勘探的基础,由于岩芯和岩屑来源的局限性,仅使用地质样品无法实现全井段岩性序列的构建。相对而言,常规测井数据对火山岩岩性的变化响应明显,且具纵向连续性,近年来,前人先后开展了基于常规测井数据的岩性识别研究[7--9]。火山岩的测井响应受岩石成分、结构构造和成岩作用综合影响,在岩性复杂区,常规交会图法识别率明显偏低,此后,BP神经网络被尝试引入岩性识别[8, 10--12]。但是,常规BP神经网络[13]在岩性预测中经常存在过拟合现象,导致预测结果与实际岩性存在较大差异[14]。笔者在常规BP神经网络模型中引入Dropout机制[15],通过降低常规BP神经网络的过拟合,提升火山岩岩性识别的准确性,为火山岩储层岩性识别建立一种新的预测模型。

1 材料和方法

1.1 地质背景和采样

松辽盆地位于中国东北部,面积260 000 km2,是中国最大的中生代陆相含油气盆地[16]。长岭断陷位于松辽盆地南部(图1a),面积为1.3×104km2,深部断陷层自下而上分别为火石岭组、沙河子组、营城组以及登娄库组[17]。长岭断陷在断陷期火山活动频繁,形成了火石岭组和营城组两套广泛分布的火山岩层(图1b)[18]。研究区位于长岭断陷南部龙凤山地区,火石岭组火山岩主要为大段的中性火山碎屑岩以及少量的熔岩互层产出(图1c),成因机制复杂,具多期喷发特点。本次研究所用17口钻井在火石岭组取芯约303 m,揭示的火山岩主要包括玄武岩、安山岩、安山质角砾熔岩、安山质角砾岩、安山质凝灰岩、流纹岩、流纹质角砾岩和流纹质凝灰岩等。

1.2 测井资料

选取17口钻井的常规测井资料,包括自然伽马(GR)、深浅侧向电阻率(LLD/LLS)、声波时差(AC)、密度(DEN)和补偿中子(CNL)。测井响应通常受多种地质因素影响,上述6条测井曲线分别反映了岩石的放射性、导电性、声速、密度和孔隙度等自身属性,选用这6条测井曲线数据建立了标准测井数据,每组测井数据是由GR、LLD、LLS、AC、DEN、CNL,以及深浅侧向幅度差LLD--LLS组成的7维数组。

标准测井数据的选取,首先提取LLD曲线的极值,其余曲线取LLD极值深度上下各0.5 m的平均值。每条测井曲线的纵向分辨率为0.125,即每1 m有8个实测数据点,每个标准数据代表8个相邻数据的平均值。由于不同的岩性具有不同的双侧向电阻率幅度差,因此本次研究提取深浅侧向电阻率的幅度差LLD--LLS,作为数据的补充。经过对研究区17口钻井共126.8 m涵盖8种岩性的数据提取,共提取258组有效数据构成本次BP神经网络预测岩性的样本集,表1为根据选取的258组有效数据归纳整理计算得出的选取测井样本数据分布特征表。为验证BP神经网络预测岩性的准确性,将258组数据按比例随机分为训练数据184组和预测数据74组。训练数据用于建立岩性预测模型,预测数据用于统计岩性预测的准确性。

a.长岭断陷在松辽盆地的位置;b.长岭断陷构造分区;c.长岭断陷地层综合柱状图。图1 长岭断陷地质简图(据文献[19-20]修改)Fig.1 Geological sketch map in Changling fault depression

表1 火石岭组测井样本数据分布特征表

1.3 引入Dropout的BP神经网络岩性预测方法

常规BP神经网络预测岩性包括两个过程:学习过程和工作过程。学习过程的主要原理就是在采用已知学习样本集基础上,利用误差反向传播原理进行训练,利用训练结果建成网络[21]。工作过程就是将输入数据与期望数据用实际的测井数据表示,完成可以计算实际情况的神经网络结构构建。以本次研究中预测火山岩岩性为例,预设GR,AC,CNL,LLD,LLS,DEN等实际测得的测井资料信息为输入层的神经元,设置一个或者多个隐含层,其输出层可用预设的岩性代码作为神经元(图2),搭建好此神经网络的结构以后,便可以用于相似地层情况下岩性的预测。

将前文提到的258组数据作为神经网络的输入。为了能使神经网络计算高效准确,需将这些在不同量级的测井数据进行归一化处理,经过归一化后的测井数据均分布在0到1之间,消除了不同测井曲线不同量纲对神经网络运算的影响。归一化公式为:

(1)

注:若min<0,则按0处理。

(a) BP神经网络结构示意图;(b) Dropout模型示意图,通过引入Dropout将左侧复杂模型变得简单;(c)训练过程神经元以概率p留存,并以权重w连接到下一层的神经元,在预测过程神经元始终存在,权重w乘以留存概率p。预测过程的期望与训练过程的期望相同。图2 引入Dropout的BP神经网络预测岩性原理示意图(据文献[15]修改)Fig.2 Schematic diagram of lithological prediction by BP neural network with Dropout

BP神经网络岩性识别过程如下:

(1) 确定BP神经网络结构及激活函数

根据所选数据,确定输入层为7个神经元,分别对应GR、AC、LLD、LLS、DEN、CNL和LLD--LLS。输出层为1个神经元,即输出一个岩性预测结果。输入层与输出层之间为隐含层,这里设置两层隐含层(图2a)。激活函数选择tanh函数,即网络中各神经元的输出输入关系为函数:

(2)

在神经网络运行过程中,如果模型的神经元太多而训练样本又太少,则会产生过拟合现象,其表现为只能拟合训练数据,但不能很好地拟合不包含在训练数据中的其他数据的状态,整体预测的精度较低[14, 22]。本次研究由于训练数据仅为184组而神经元又太多,为避免过拟合现象的出现,引入Dropout来缓解过拟合现象的发生。Dropout由Srivastava et al.提出[15],其基本思想是在神经网络训练过程中随机丢弃输入层和隐含层一定比例的神经元。在训练阶段,每个神经元都可能以概率p留存,称之为留存概率,并以权重w连接到下一层的神经元;而到了预测阶段,每个神经元都是存在的,权重参数w要乘以留存概率p,这样便有了和训练阶段相同的期望输出(图2c)。Dropout减少了无关特征数据的特征提取过程,通过降低神经元之间复杂的关联(图2b)较好地解决了过拟合的现象。

(2) 反向传播计算误差,权值修改

BP神经网络学习的过程也是不断纠错减小误差的过程,通过不断的学习,反向纠错,以达到满足要求的输出值。在网络学习训练中,如果在输出层不能得到想要的输出结果,就会立即转入反向传播程序,误差信号沿原来的路径返回,然后修改各层神经元中的权值,使得误差信号降到最小,然后逐层计算反传误差[13, 23]。

(3) 运行程序,得出预测结果

在Python中编写BP神经网络程序,读取训练数据和预测数据,通过程序输出的误差信号调节BP神经网络的各参数。经过多次运行调试,发现当Dropout留存率设置为0.25,两个隐含层神经元数分别为90和40时,网络的误差最小。程序运行结束后会输出岩性预测结果,为减小偶然性误差,需多次运行程序,取平均值。

2 结果

2.1 火山岩主要类型和特征

通过对303 m的火石岭组取芯段进行岩芯观察、地球化学主量元素分析(表2)和薄片分析(图3),按照王璞珺等提出的火山岩储层岩性分类方案[4],确定了研究区发育的8种火山岩主要类型及其岩石学特征:玄武岩,斑状结构,斑晶为基性斜长石,基质交织结构,富含铁镁质矿物,块状构造,裂缝发育,充填钙质(图3a-b);安山岩,少斑结构,基质交织结构,块状构造,裂缝发育,充填绿泥石(图3c-d);安山质角砾熔岩,角砾灰白色,火山碎屑熔岩结构,碎屑含长石晶屑,碎屑棱角状,被灰黑色熔浆胶结。角砾基质交织结构,可见气孔,硅质充填(图3e-f);安山质角砾岩,火山碎屑结构,凝灰质胶结,角砾斑状结构,斑晶为蚀变严重的斜长石,基质交织结构(图3g-h);安山质凝灰岩,火山碎屑结构,岩石主要由粒径<2 mm长石晶屑和安山岩岩屑构成,安山岩岩屑中可见杏仁体,沿杏仁体边缘溶蚀形成溶蚀孔(图3i-k),发育高角度裂缝,充填硅质,基质存在钙质交代作用(图3l-n);流纹岩,见大量石英斑晶,具流动构造,发育网状裂缝(图3o-p);流纹质角砾岩,火山碎屑结构,岩石主要由>2 mm的火山碎屑组成,凝灰质胶结,角砾成分为流纹岩,斑状结构,斑晶为石英,可见流纹质岩屑和长石晶屑(图3q-r);流纹质凝灰岩,块状构造,碎屑为流纹质岩屑,棱角状--次棱角状,大小<2 mm,成分均一(图3s-t)。

表2 火石岭组火山岩主量元素(%)分析结果及自然伽马值(API)

a、b.玄武岩,SN185井,2 115.9 m,发育裂缝,钙质充填;c、d.安山岩,XS1井,3 532.4 m,斑状结构,斑晶为钾长石;e、f.安山质角砾熔岩,B215井,3 220.2 m,角砾为安山岩岩屑,被黑色熔浆胶结;g、h.安山质角砾岩,B216井,3 679.37 m,角砾为安山岩,基质交织结构;i-k.安山质凝灰岩,B203井,3 869.3 m,安山岩岩屑可见气孔;l-n.安山质凝灰岩,B204井,3 300.9 m,基质钙质交代;o、p.流纹岩,SN104井,2 398.4 m,流动构造,发育网状裂缝;q、r.流纹质角砾岩,L7井,2 135.6 m,流纹岩角砾斑状结构,斑晶为石英;s、t.流纹质凝灰岩,SN66井,1 906.3 m,碎屑为流纹质岩屑,棱角状--次棱角状。图3 长岭断陷火石岭组火山岩岩石学特征Fig.3 Petrological characteristics of volcanic rocks in Huoshiling Formation in Changling fault depression

2.2 火山岩的测井响应

笔者对数据选取段的各种岩性的测井曲线对比分析发现(图4),自然伽马(GR)响应在不同岩性中变化最为明显,玄武岩呈现最低值,流纹岩及其碎屑岩显示最高值,安山岩及其碎屑岩的GR值介于二者之间;在深浅侧向电阻率曲线(LLD/LLS)上安山岩以及流纹质凝灰岩表现出较其他岩性高的电阻率特征;玄武岩和流纹岩在电阻率上呈现出正幅度差。补偿中子(CNL)曲线显示玄武岩和流纹质凝灰岩具有高的CNL值,安山质凝灰岩较上述二者低,其余岩性基本维持同一水平;在密度(DEN)曲线上,安山岩和安山质角砾熔岩明显高于其他岩性;在声波时差(AC)曲线上,玄武岩最低,安山质角砾熔岩和流纹质角砾岩相较于其他岩性高。

图4 长岭断陷火山岩测井响应特征Fig.4 Logging response characteristics of volcanic rocks in Changling fault depression

笔者基于258组标准测井数据,分别建立了火石岭组火山岩GR--AC(图5a)与GR--CNL交会图(图5b)。面对火石岭组复杂的火山岩岩性,交会图仅能对基性、中性和酸性岩有一个初步的区分,对具体8种岩性的识别,通过统计黑色轮廓数据点正确落到相应区域的个数,计算出最高识别率仅为55.41%,无法实现岩性的有效区分。

图5 火石岭组火山岩 GR--AC 交会图(a)与 GR--CNL 交会图(b)Fig.5 GR--AC (a) and GR--CNL(b) cross plot of volcanic rocks of Huoshiling Formation

从BP神经网络最终的预测结果来看(表3),直接预测具体岩性的符合率可达到74%。考虑到研究区的岩性复杂,可将整个岩性预测过程细分为两步:首先按基性岩、中性岩和酸性岩划分大类,然后进一步在每个大类中预测具体岩性。结果显示,BP神经网络预测大类岩性的符合率为94.59%,进一步预测具体岩性时,总符合率达94.12%,综合这两步,整体符合率为89.03%。与传统的双参数交会图相比,引入Dropout的BP神经网络预测岩性的符合率明显提高,针对研究区火石岭组火山岩的岩性预测是准确且有效的。

表3 Dropout--BP神经网络预测岩性符合率

3 讨论

火山岩的成分、结构复杂多样,再叠加孔缝发育及充填、喷发期次等因素,导致即使同一种火山岩其测井响应特征在不同井段出现差异[24--26]。图5的交会图岩性识别率较低,主要体现在以下两个方面:①部分安山岩的伽马值偏高,与酸性岩的GR值存在重合;②图5b的GR--CNL交会图中,安山质凝灰岩数据点的集中区域有两块。

火山岩GR值主要是受到岩石中铀、钍、钾等放射性元素的影响。因此,火山岩中钾长石(K2O·Al2O3·6SiO2)的含量成为影响其GR值的主要因素。通过对中性岩和酸性岩的地球化学主量元素分析(表2),发现研究区的中性岩K2O含量明显高于酸性岩,初步推断K2O的富集是该深度段安山岩自然伽马值异常高的主要原因。

在火山岩测井响应中,直接影响CNL值的是孔隙度,岩石的孔隙度越大,则CNL值越大。图5b的GR--CNL交会图中,安山质凝灰岩值在4%~6%和14%~17%这两个区间出现了两块数据集中区域。对比B203井、B204井的安山质凝灰岩铸体薄片发现,B203井成岩作用弱,未发生明显的交代作用与充填作用,且在安山质岩屑中还发育着残余气孔和杏仁体溶蚀孔(图3j-k)。B204井中钙质交代、硅质充填、蚀变均有发生,交代作用以及充填作用破坏了先期形成的粒间孔和溶蚀孔等,因此在薄片中几乎未发现B204井的有效孔隙(图3m-n)。CNL值出现两块富集区间。B203井拥有比B204井更深的埋深但更好的物性,预示着当火山碎屑岩处于深埋藏阶段时,埋深的变化对其物性的影响日趋减小,而交代作用、充填作用则对其物性起着决定性的影响。

本文建立的Dropout--BP神经网络同时结合6种常规测井参数,将常规双参数交会图升级到多参数神经网络,综合火山岩的成分、结构和电性,开展岩性预测,极大提升了火山岩岩性的预测精度。在火山岩岩性类型简单地区或识别精度仅需达到酸性--中性--基性等成份大类时,双参数交会图法基本可满足需求;若遇到与本文研究区类似岩性复杂多变情况,引入Dropout的BP神经网络法则是一种更有效的手段。

4 结论

(1)研究区火石岭组主要发育了8种火山岩。基性岩的GR均值最低,其次为中性岩,酸性岩有最高的GR均值。中性火山岩GR均值由低到高依次为:安山岩<安山质凝灰岩<安山质角砾熔岩<安山质角砾岩。

(2)建立的Dropout--BP神经网络对研究区的火山岩岩性二级识别的总体符合率达89.03%,相较于传统双参数交会图法,大幅提升了岩性识别精度,可满足生产需求。

猜你喜欢
角砾凝灰岩火山岩
养护温度对凝灰岩基胶凝材料力学性能的影响机理
兴隆太平村钼矿区隐爆角砾岩特征及成因探讨
龙塘沿铁矿区角砾岩地质特征及形成机制探讨
柴北缘锡铁山铅锌矿床喷流通道口的识别及其对矿床成因和找矿勘查的指示
接财接福
内蒙古巴尔陶勒盖-复兴屯发现特大型陆相火山岩型铅锌银矿床
凝灰岩中微量元素的指标检测
福建平和深坑饰面石材(沉凝灰岩)矿地质特征及成矿规律研究
渤中34-9油田古近系火山岩岩相特征与分布预测
凝灰岩资源化综合利用研究