测井资料人工智能处理解释的现状及展望

2021-10-28 03:30王华张雨顺
测井技术 2021年4期
关键词:岩相测井反演

王华,张雨顺

(电子科技大学资源与环境学院,四川成都611731)

0 引 言

地球物理测井是在井筒开钻同时或开钻后,利用特定的仪器测量井下地层的物理、化学性质、地层结构及井身几何特性,以了解井中及井周地层情况的一门学科。该学科的理论基础为地质学、物理学和数学,涵盖电子信息技术、传感器技术、特定场景仪器的研发以及数据的高效传输和处理解释等。它既是识别地下流体性质、储集层岩性及物性的有效途径,也是石油工程技术人员解决相关问题的必要资料来源。早在1876年,中国四川自贡地区就利用湿泥巴缠裹的木棒测量盐卤水层的深度和出水量。现代地球物理测井则起源于人们对石油资源探测的需求,物理学家于1927年将地面电阻率探矿装置用于定性识别井中油水层。1942年,Archie的实验及分析结果将现代地球物理测井从定性推动到定量化的阶段,基于此结果建立起来的岩石物理体积模型为后续出现的各种测井方法的应用提供了理论依据。经过近一个世纪的发展,地球物理测井已经成为石油科学的十大主干学科之一,也逐渐从油田勘探开发拓展到了深地、深海、地下工程、生态监测等领域。面对越来越复杂的应用场景,测井领域研究往往是方法研究先行,在电子信息技术的发展下不断发展新仪器。测井也从早期模拟记录时代过渡到数字磁带、数控测井时代,直到近20年的成像测井时代。新的仪器、采集方式、数据处理方法不断涌现,使得我们能获取丰富的井下信息来定量评价地层岩性、物性、含油性等。

测井资料处理解释长期面临的一个问题是需要解释专家具有丰富的区域地质经验。即便如此,不同专家的解释结果还存在很大的差异,尤其是非常规油气藏等复杂岩性的测井解释。在电子信息技术的高速发展下,采用新的、高效的观测方式和技术(如分布式光纤技术),服务公司得以快速实时地采集越来越多的测井数据。海量的数据随时间增加呈指数增多,加剧了人工测井解释的压力,同时油田公司和服务公司普遍存在用人紧张的问题。如何在新形势下高效开展地球物理测井资料解释成为了一大难题。

互联网时代下,大数据、机器学习(Machine Learning,ML)及人工智能(Artificial Intelligence,AI)正逐渐成为各个行业的热门词汇。自2016年起,几乎所有石油行业相关会议都专门开展了机器学习或人工智能与行业结合的主题探讨会。许多勘探领域的学术期刊也专门为应用于地球科学、石油工程领域的机器学习及大数据专题提供了专刊及主题会议[1]。各大国际石油公司和服务公司也在调整发展战略,将数据作为宝贵资源,在数据科学、人工智能领域持续发力,如斯伦贝谢公司就已着手建设自己的智能化测井处理解释平台[2]。作为勘探和开发领域中重要的组成部分,地球物理测井相关从业人员也在逐渐探寻人工智能、机器学习技术与自身研究领域的高效融合。

基于以上挑战与机遇,本文首先介绍人工智能、机器学习间的关系,总结归纳若干类较为典型的测井资料智能处理研究,并对测井资料智能解释的未来提出思考及展望。

1 人工智能在测井资料处理解释应用的适用性分析

人工智能是指利用特定算法获取信息后,执行具有人类特征任务的能力,如识别物体、声音及从环境中学习以解决其他问题。人工智能的关键在于自动化方法的设计,即设计出一种学习算法,使计算机能够在没有人类干预或帮助的情况下自动获取知识。机器学习方法的不断优化,促进了人工智能领域相关技术的发展。机器学习是计算机科学子领域及统计学研究的领域之一,旨在针对给定数据设计及训练出具有拆分、排序、转换等能力的特殊算法[3]。根据学习任务的特点,可分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)和半监督学习(Semi-Supervised Learning)。

训练数据样本包含了输入向量以及对应目标向量的机器学习任务被称为监督学习。根据学习目标的不同,可分为分类与回归这2类任务:分类任务用于为每个输入向量分配离散标签;回归任务则用于输出1个或多个连续变量,以表征输入变量与目标变量之间的统计关系。诸如支持向量机(Support Vector Machine,SVM)[4]、人工神经网络(Artificial Neural Network,ANN)[5]、决策树(Decision Tree)、随机森林(Random Forest)[6]等经典监督学习方法,正逐步被应用到测井解释作业中。

训练数据仅由1组输入向量组成、不含对应目标标签的机器学习任务称为无监督学习。根据学习目标不同,无监督学习任务可分为聚类(Clustering)、密度估计(Density Estimation)与数据可视化(Visualization)等。聚类任务的目标是将样本整体划分为若干个由相似对象组成的类簇;密度估计用于确定输入数据在空间中的分布;数据可视化主要利用降维方法,将数据从高维空间投影到二维/三维空间,供从业人员直观可视。常用无监督方法包括K-Means聚类[7]、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类[8]、主成分分析(Principal Component Analysis,PCA)[9]等。

为了最大限度提高机器学习任务模式识别能力,可构建具有一定深度的模型,获取数据更深层次的特征或表征,以提升算法在处理更大数据量、更高维度的数据集时的准确度和可靠性。这些具有层次结构更为复杂的机器学习方法被称为深度学习(Deep Learning,DL)[10],包括卷积神经网络(Convolution Neural Network,CNN)[11]、堆栈自编码网络(Stacked Auto-Encoder Network)[12]、深度置信网络(Deep Belief Nets)[13]等。

还有1类模式识别任务利用少量标签数据和大量未标签的数据实现,此类任务即半监督学习。研究表明,少量标签有助于显著提升聚类效果[14-15],结合无监督学习降维方法的半监督分类任务则可在标签不足的情况下提升监督学习分类效果[16]。

通常而言,地球物理领域所获取到的数据是海量的,数据分析人员可根据数据及待求任务的特点,应用或自定义最佳机器学习算法(见图1)[17]。

图1 多种机器学习算法使从业人员得以按需选择(图片重制自Bergen等[17])

整体而言,目前的地球物理测井领域的数据量呈现了大容量、多尺度、高维、多噪声等特点。同时,基于物理或经验模型的数值模拟任务也为测井领域带来了大量的待处理数据及海量的计算任务:如Prioul等[18]基于物理模型正演了井外各向异性介质(裂缝)对井壁电阻率成像、声波测井、垂直地震剖面等的响应情况,助力实际诱发裂缝方向研究;Wang等[19-21]则利用三维有限差分研究了套管偏心、不同胶结情况、方位窜槽等情况下的单极子和偶极子声场特征,有助于利用声波测井资料解释套管井的固井质量。基于物理模型驱动的处理解释的实例不胜枚举,其核心在于探索以领域知识为基础的变量间的可靠关系,所提供的假设及函数对应的映射均来自用户的有限定义,不同变量和潜在物理知识间的重要关系难免存在遗漏。以测井解释为例,一个刚学完测井解释课程的学生和一个有多年丰富地质经验积累的测井解释资深专家给出的结果可能会完全不同。这是因为常规定量解释手段往往基于岩石物理体积模型建立近似的线性方程组来优化求解。这种做法在岩性简单的常规地层应用问题不大,但在复杂岩性地层中,测井响应与物性参数呈非线性关系,需要结合当地的地质情况进行相应的调整。同样,以声波全波形测井资料应用为例,复杂环境下波形多变,需要经验丰富的专家来识别。此外,基于数值模拟的方法存在耗时久、运算量大等问题。因此,从业人员已经开始探索更为高效可靠的解决方式:采用基于人工智能、机器学习的测井资料智能处理方法。

同图2(a)提到的模型驱动方法相比,基于数据驱动的机器学习方法[见图2(b)]通过探索数据本身内存在的更大函数空间(见图3)[10],以新的视角挖掘数据内潜在的知识,将数据与目标(或称为标签)相联系,以非线性方式,从高维空间中发现变量间关系[22-24]。随着计算成本和运行时间的减少,内存、网络深度和可用数据样本的不断增加,Scikit-Learn[25]、Tensorflow[26]等易于实现的机器学习算法库的开源使用,传统机器学习算法及更多新算法可以在学术和商业环境中方便各行业的人们使用。

图2 地球物理测井领域的2种数据分析工作流

图3 人工智能适合于地球物理测井领域的原因(图片重制自Bergen等[17])

2 测井资料智能解释现状

从测井资料中识别储层的岩性及沉积相是地下储层建模及地下资源开发的关键。岩性及沉积相分析的常见方法有测井曲线解释、岩心分析等。常规测井曲线[27]是记录井眼岩石物理性质最直接也最基本的方法,包括电法测井、核测井、声波测井等。钻井液对电阻率测井曲线的侵入效应受孔隙尺寸、孔喉尺寸、迂曲度和Maxwell-Wagner极化的影响,这些影响与孔隙尺寸分布相关;中子测井对地层中流体含氢量敏感,而氢原子含量又与地层平均孔隙度高度相关;伽马射线用于测量地层中的自然辐射,同砂岩、石灰岩相比,含有黏土的岩石能够释放出更多的伽马射线,可用于计算泥质含量;密度测井可直接显示井下流体和矿物体积浓度关系。岩心分析[28]则可获得关于矿物学、化学成分、物理特性(孔隙度、渗透率)等信息。

早期研究中,根据2种不同的测井曲线绘制交会图,运用判别分析或简单基于截断值的分析方法即可得到岩相及孔隙度分类信息[29]。而随着测井技术的不断发展、面临的测量环境更加复杂,有必要在实际工程中进行更为细致的岩相划分,对地下介质性质分析的精度要求也逐渐提高。常规测井曲线间隐藏着复杂的关系,虽然不同曲线可以感知不同的物理现象和地层性质,但某些测井曲线的组合往往相互关联,简单的线性判别分析方法难以满足需求。虽然岩心分析可以精确获取整个工区地下介质的多种物理参数信息,但耗时较多。受人工智能监督学习领域发展的启发,大量研究以测井曲线等序列数据及对应的岩相解释结果或敏感参数作为算法模型输入,训练机器学习算法,以建立已有数据和待求参数间的映射关系,借此实现测井资料的近实时解释。由于老油田积累的一些岩心分析结果和专家的解释结果有利于建立稳定的机器学习模型,这些稳定模型将有望应用于新的测井资料,并取得非常好的效果。基于此,笔者汇总了人工智能在测井资料智能解释中的应用,并对智能方法未来的发展道路提出了一些展望。

2.1 常规测井资料模式识别任务

手写数字体的识别,即通过训练算法学习手写数字体图片和各数字标签之间的映射关系,是机器学习中经典的学习案例之一。这些算法能够综合考虑数字的各种特点,完成分类任务。利用测井曲线进行岩相智能分类类似于手写数字体识别。对同一地层,不同的测井曲线提供了不同的属性信息,且曲线之间相互补充,综合使用可以更好地区分井下介质的岩相类型。通过构建输入测井曲线和标签(专家解释或岩心分析得到的岩相结果)之间完备的数据集,训练监督学习模型用于岩相分类,能够为还未经专家解释的地区进行岩相分类。该类研究在近年来较为热门,在2007年Dubois等[30]利用了7种分类器研究了测井曲线岩相分类问题,包括利用贝叶斯准则方法的经典分类法(即二维或三维交会图)和3种非参数方法(模糊逻辑方法、K-最近邻、BP神经网络)。结果表明,基于判别分析的经典线性分类方法(如交会图)[31]在某些应用场景会存在分类不充分的问题。非参数方法中,BP神经网络具有强大非线性映射能力,可以很好地实现测井曲线的岩相分类任务。相关数据集由Hall[31]加以整理,供从业人员进行方法测试和复现。Ouadfeul等[32]采用自组织映射(Self-Organized Maps,SOM)与多层感知机(Multilayer Perceptron,MLP),以及将传统信号分析与神经网络结合的方法,验证了神经网络在岩相自动分割任务中的有效性,并获得了优于传统方法的结果。基于决策树的多种分类器也被用于岩相分类研究,如随机森林[33]、梯度提升树[34]、XGBoost提升树[35]等。Ao等[36]结合Mean-shift算法与随机森林算法,从原型相似度的角度进行岩性识别,取得了优于直接采用决策树等算法的效果。Jaikla等[22]提出FaciesNet,用于捕获地质信息、叠加模式的岩相及地质相关性,模型将卷积自编码器(Convolutional Autoencoder,CAE)与双向递归神经网络(Bi-directional Recurrent Neural Networks,BRNNs)相结合,用于预测测井曲线资料中具有地质意义的岩相,实现了储层相与非储层相的分割。Feng[37]将ANN与隐马尔科夫模型(Hidden Markov Models,HMM)方法结合,以储层研究岩相的概率分布,结合统计学及地质学的角度实现分类过程,取得了优于其他分类方法的性能。此外,叠前地震资料等地震数据也可以被从业人员存储为与测井曲线类似的序列数据,部分研究通过利用叠前地震资料等地震数据,实现了在更大空间尺度上的岩相识别:Hami-Eddine等[38]利用地震数据作为岩相预测的传递手段,结合测井曲线数据的岩相识别结果,训练神经网络从地震数据中寻找可用于岩性分布和不确定性预测的模式。

类似测井曲线的储层及沉积相分类任务,从常规固井测井资料中获得的水泥胶结质量评价信息也可作为监督学习目标,实现固井质量自动评价。相关研究[39-41]按水平好坏划分出若干表征固井质量的类别相(如胶结质量好、一般、较差等)。整个工作流程以测井数据作为输入向量,以质量类别相作为目标向量,训练得到能够自动输出盲井的固井质量评价结果的监督学习模型。具体的,Reolon等[40]结合MRGC(Multi-Resolution Graph-based Clustering)聚类手段与贝叶斯框架,实现了井下水泥胶结相、水力间隔相的分类,并给出了分类相概率及不确定性。Viggen等[41]则设计特征工程方法,采用领域知识从测井资料中提取特征,获得了更好的分类效果。相关方法虽然还不能完全替代人工解释,但足以作为人工解释过程中的重要辅助资料,极大提升固井质量解释效率。

综上所述,相较于传统信号处理方法,基于机器学习方法,建立非线性映射的处理方法,对岩相识别任务准确度有极大的提升。同时,更先进的算法,以及针对特定任务的网络结构设计,还能够更好地实现诸如储层相与非储层相的分割、固井质量评价等衍生任务。

2.2 常规测井资料参数反演任务

与分类任务类似,机器学习的回归算法也被广泛应用于测井资料解释中。该类方法主要是通过建立已有测井曲线资料与地层参数之间的样本数据集合,训练机器学习算法的回归模型,从而实现工区目标参数的反演。如Meshalkin等[42]利用回归算法反演测井资料中岩石热导率。他们比较了K-means、ANN、高斯过程(Gaussian Process)、随机森林、自适应提升算法(Ada Boost)、梯度提升算法(Gradient Boosting)、极端随机树(Extra Trees)等监督学习算法的反演结果,在不依靠额外参数的情况下直接预测不同深度的岩石热导率。Gasior等[43]则利用密度、声波、中子、伽马、井径及电阻率等测井资料,采用多元回归和神经网络方法建立数学模型,实现了连续导热值系数的反演,与实验数据具有较好的一致性。Li等[44]提出一种基于深度CNN评价随钻电阻率测井的地层几何参数的流程,将目标检测领域中的智能方法(You Only Look Once,YOLO)应用于随钻电阻率测井地质导向任务中,以数值模拟的随钻测井资料作为输入,实现了地层电阻率的反演。Kisra等[45]通过搭建CNN,以原始声波测井资料作为输入,实现了地层纵波和横波慢度的近实时反演。Li等[46]采用井下磁共振测井数据,选择长短时间记忆网络(Long-short Term Memory,LSTM)、变分自编码器(Variational Autoencoders,VAEs)模型用于合成核磁共振T2谱分布数据,实现对含油气页岩储层的充液孔隙大小分布的量化。Shahriari等[47]通过训练深度神经网络,实现了对井眼测量数据的实时反演,并利用LSTM实现了数据降维。该实时反演方法有望应用于随钻测井(Logging While Drilling,LWD)技术,提升井下测量信息的实时传输效率。Garcia等[48]结合ANN与无监督学习方法,对缺省的光电因子参数进行了反演重建,并基于重建资料,采用无监督神经网络方法改进了岩相分类效果,并量化了岩石物理性质分配的不确定性。可见,不论是经典机器学习算法还是深度学习算法,在测井曲线解释任务上均有较好表现。然而,现有研究[42]也表明,忽略数据集本身特点而盲目选用先进算法,不一定会改善测井曲线的解释效果。因此,近来研究大都选用多种方法,通过对比择优更好地实现测井曲线参数反演。

3 测井资料智能解释思考及展望

前文主要阐述了测井领域中应用较为系统及广泛的人工智能应用。显然,人工智能在测井领域中的应用远不止所列出的方面。然而,这些应用由于起步时间较短,还未形成较为完善的工作流程。笔者将简述已有的基于测井资料的创新解释流程,这些方法还未大量见诸于地球物理测井领域,但对于测井行业的未来有一定的指导性意义,可供相关从业人员借鉴。

3.1 基于机器学习的智能正演过程探索

相比于常规测井曲线或成像测井等,阵列声波测井则是另一种高分辨率测井方法,可用于求解地下介质参数及表征储层特征。阵列声波测井数据量丰富,为消除冗余信息,一般需要从阵列波形中提取某些敏感特征(如频散曲线),再将提取的特征与基于假定模型的数值模拟的特征对比,通过最小化观测数据和合成数据间差异的Misfit函数,不断更新正演模型并最终得到同实测数据对应的相关模型参数。这其中存在3个问题。

(1)阵列波形中敏感特征的提取。目前针对复杂井孔模型阵列波形敏感特征的提取研究一直是声波测井领域的重要议题之一,也是声波测井资料应用的难点之一。

(2)大量的正演模拟。井孔声学的正演模拟一直是声波测井研究中较为困难的一环。虽然随着科研人员计算机知识的丰富,正演模拟已经不再遥不可及,但复杂井孔环境的数值模拟仍需要一定的技巧。同时,尽管并行计算等高性能手段能够在一定程度上加快计算速度,但大量的正演模拟仍需要较多的计算时间,使得现场应用受限。此外,目前的正演过程采用的是基于物理驱动的模型,可能会忽略变量之间的隐含关系。

(3)快速准确的反演。目前反演方法大多为全局优化非线性方法,如模拟退火算法[49]等已被应用到了偶极声波测井反演地层各向异性研究中[50-51]。但反演过程仍存在耗时的问题,难以达到现场应用的实时性要求。

为了满足现场应用的实时性需求,从全波资料中挖掘更多的有用信息,目前的一种可能思路是利用机器学习方法来缩短以上过程(见图4),以尽可能地利用全波资料同时达到实时解释的效果。在地震资料处理领域,已有研究[52]将模型参数作为网络学习目标,训练深度神经网络,直接预测了输入实际数据对应的模型参数资料。但对于测井领域,由于井下环境的复杂性,根据少量井下介质表征参数(如井径、单一地层纵横波速度等)建立的数值模拟模型因缺乏对实际环境的周密考虑,且由于复杂环境下的有限元、有限差分等数值模拟建模计算量大,难以满足实际生产过程中反演过程的准确性和时效性。诸多现状表明,直接建立效果良好的智能反演算法任重道远。

图4 同基于物理驱动的数值模拟模型相结合的机器学习全波形反演流程展望

目前有学者对此开展了一些工作。如2019年,Giannakis等[53]探寻了基于机器学习的快速正演方法。他们通过训练特殊的深度神经网络,近实时地获得了与数值模拟正演结果匹配良好的机器学习正演结果,极大节省了探地雷达正演的计算成本。这也为地球物理测井领域带来启发:借助机器学习强大的非线性拟合能力,以较为完备的模型参数向量集作为输入,通过将模型正演结果作为目标输出,以替代耗时费力的数值模拟正演过程。相关方法已经见诸于套管井频散曲线正演应用中:斯伦贝谢公司道尔研究中心的科研人员在其智能化处理平台上挂接了智能化的井外地层径向速度成像方法[2],针对实际数据处理过程中多层柱体模型频散曲线求取病态问题而引起的计算速度慢的问题,利用神经网络方法替代频散曲线正演解算器,实现了频散曲线快速正演。随着正演过程的不断完善和提速,在不久的将来,机器学习模型可以贯穿于整个全波形声波测井资料的反演过程,为智能反演速度带来数量级提升,从而满足现场应用的实时性要求。

3.2 结合常规测井资料及成像测井资料的模式识别任务

结合智能解释方法,常规测井曲线从数学及统计学层面反映了储层岩石物理性质和沉积相信息。高分辨率井下成像仪器能够真实地从视觉角度观察到丰富的地质信息。成像测井资料经图像处理方法,如Hough变换[54]、结合灰度直方图的阈值分割Otsu算法[55]、边缘检测滤波[56]、形态学滤波[57-58]等,可实现裂缝、断层识别。发展至今,成像测井领域积累了大量高分辨率井下图像数据,随深度学习在图像分割领域的不断发展,深度学习方法在基于图像的模式识别任务中表现出比传统方法更好的性能[59]。这些方法最早在勘探地震资料上加以应用,如Wu等[60]提出FaultSeg3D网络,该网络结合医学影像分割领域中应用广泛的U-Net网络,利用大量合成数据训练网络,实现了对三维工区的断层检测,引领了一波基于深度学习的地震数据断层检测浪潮。对于成像测井领域,成像资料一方面缺少大量可靠且质量统一的标签数据集;另一方面,受测量盲区的影响,成像资料中存在宽尺度条带的缺失,给算法的特征提取带来一定干扰。因此,相关研究还不够成熟。已有研究中,Cruz等[61]提出了基于深度学习进行断层与裂缝识别的工作流程,通过Hough变换发现可能的断层及裂缝,并利用深度学习确定其是否为断层及裂缝;Dias等[62]则建立了快速区域卷积神经网络(Fast Region Convolutional Neural Networks,Fast-RCNN)自动从模拟的井眼声波测井图像中拾取裂缝与断层,并给出所拾取的目标的置信度。

裂缝、断层在成像测井图像中直观而明显,因此,业界人员通常从成像测井资料中获取井下裂缝、断层等图像信息。常规图像处理手段对井眼图像进行分析具有简单易行的优势,但算法对于图像失真、图像噪声高度敏感,具有不稳定的特点。结合机器学习的裂缝、断层自动拾取手段又因标签数据的缺乏,难以用于实际工程数据分析研究。近年来,在机器学习方法的帮助下,利用成像测井图像资料估算孔隙度、渗透率,甚至实现地层解释的任务逐渐涌现,并取得了很好的效果。这些方法很好地利用了成像测井资料分辨率高的优势,并提升了井下参数在空间上的精确度。Valentin等[24]将不同测深处的井眼图像数据转换为纹理信息,以此保留测深周围井壁处观察到的地质构造信息,并基于堆栈自编码器构建深度编码-解码模型,利用井眼图像数据对地层渗透率和孔隙度进行了有效估计,在测试数据集精度达到了96%;Al-Obaidi等[63]将井眼成像测井数据中提取的基于图像的岩石结构相关的特征与常规测井资料及常规岩心分析数据相结合,实现了岩相及岩石类别的检测;Gonzalez等[64]采用图像分析方法将电成像测井资料提取为基于图像特征的岩石结构参数变化曲线,结合常规测井曲线信息,利用无监督聚类方法进行岩相分类,为常规测井曲线进行逐层联合反演,并借此估计孔隙度、流体饱和度及总有机碳含量。

这些创新解释方法表明,随着人工智能及地球物理测井领域的不断发展,从业人员有望基于机器学习强大的非线性映射能力,吸纳更多来自新测井手段的有用信息,以跳出对测井资料的固有认识,获得比现有智能岩相分类、参数反演等更为可靠的预测结果。同时,还可以通过不确定性分析,为地球物理测井分类或回归任务的精度和可靠性进行评价,并通过影响因素评价分析不同输入资料的重要性,更系统地解释测井手段蕴含的深层次信息。

3.3 开源数据集、标签数据扩充及无监督方法结合

为训练出用于测井数据智能解释的鲁棒性强、泛化性好的算法,需要可靠的标签数据集。计算机视觉、图像处理领域作为机器学习发展的先导领域已经证明:不断涌现出的性能优良的新模型离不开高质量数据集的帮助[59]。但是,在地球物理测井这样一个垂直领域,由于测井仪器研发的成本昂贵、采集数据的成本较高,通常难以获取足量且高质量的、适用于机器学习任务的标签数据集。因此,对于地球物理测井领域,开发及编译大量高质量具有代表性的标签数据集,有利于数据驱动的机器学习方法研究,并有望促进计算机视觉等其他机器学习应用领域的算法改进。Hall[31]曾于2016年在The Leading Edge地球物理教程系列中,为地球物理从业人员展示了简单的基于机器学习的岩相分类应用(文中用到的分类器为SVM)的工作流程。通过将相关数据集开源,吸引了大量人员探索岩相分类机器学习方法[34-35],并付诸于实际应用[36],取得了优于传统方法的效果。

挪威Equinor公司[65]于2018年公开了其在北海Volve油田测量的数据,包含了来自挪威大陆架Volve油田从2008到2016年投产期间的约40 000个文件,用以支持学术机构、学生和研究人员进行能源创新智能研究。过去,测井数据格式纷繁复杂,学术界即便拿到数据,也难以实现数据解编,而随着该数据集中常用的测井数据格式DLIS的编辑、读取方式公开[66],多位学者基于此数据集进行了相关的研究,取得了可观的研究成果,如2.1节提到的挪威科技大学的Viggen等[39-41]以及Reolon等[40]的研究。美国科罗拉多矿业学院的Ghaithi等[67]则利用人工神经网络预测了Volve油田的横波测井资料。

虽然行业逐渐意识到标签数据集对创新智能解释应用带来的极大帮助,然而,受限于现有数据集,需多次训练[24]或设计复杂的训练过程[53]以保证网络性能。简单分类器难以在测试集上得到优良的分类精度,而先进算法因样本数量有限难以获得显著的效果提升[68]。同时,监督学习算法只能为测试集数据分配训练集中存在的标签类别。以岩相分类应用为例:训练数据仅包含砂岩、页岩及碳酸盐岩的岩相标签,输入模型的测试数据将只能被预测为这些岩相标签。对于实际工区数据,若测试数据确实存在新的岩相,已有模型将无法正确为这些岩相样本做出正确预测。因此,如何设计新方法,以降低对完备数据集的需求程度,有极大的研究意义。

机器学习的发展使得数据分析人员可以根据数据特点选择最合适的处理方法。经典聚类算法(如K-Means)在计算给定的含有多个数据样本的低维度样本集时,能够很快地将它们划分为K个分区。在成像测井领域,Yamada等[69]结合图像分割技术与无监督方法,通过计算井眼图像各个深度的边界似然值,并用聚类算法为相似边界进行聚类以构造标签参考区域。但该方法对于成像资料分辨率及成像质量要求较高,一般工区难以实现。聚类方法也可以根据常规测井资料内不同深度的相似特征自动将不同深度归为相同的簇[23],但归类后各深度的地质意义仍需要资深的测井解释人员来分析。在这些应用中,不同测量深度所对应的不同测井曲线值被视为代表该测深岩相特征的向量。聚类算法为不同测深的特征向量聚类,以类比真实的岩相分类,取得了一定效果。当数据维度增大,利用经典算法进行聚类分析将十分耗时,聚类效果也会受到影响。随着深度学习卷积层为深度学习算法带来的飞跃式发展[11],这一问题得到了一定改善。同样以手写数字体识别为例,可以利用CAE获取手写数字体的深度表征,并将其用于聚类分析,以降低聚类方法的时耗,显著提升聚类效果[70],该方法以新角度改善了标签不足的问题。相关思路已经见诸于地球物理领域,如Qian等[71]通过设计CAE对叠前地震数据进行特征提取,并为所提取特征执行聚类分配,实现了地震相识别。Wen等[72]在Qian的基础上设计了多种损失函数,得到更好的重构效果,在一定程度上改善了聚类效果,但并未将聚类损失纳入网络训练中。Nalepa等[73]将三维卷积自编码器架构用于遥感高光谱图像的特征学习,并将嵌入式特征用于聚类,这种聚类是在网络训练过程中进行的,即在损失函数中加入了加权聚类损失,同时考虑嵌入式特征层设计对算法性能的影响,实现了对无标签数据的分割。Duan等[74]同样将编码器提取的深度表征与聚类分配之间的散度作为联合损失,以提升编码器表征提取能力,获得更佳的聚类效果。

随着深度聚类方法在勘探地震领域取得成功,这些方法也有望从新的角度帮助测井从业人员对数据集进行解释,以改善测井资料智能解释中普遍存在的数据集不足等问题。例如,针对成像测井资料,可设计具有一定深度的表征学习网络(如深度卷积自编码器),用于提取成像测井资料的嵌入式特征(见图5)。选择合适的聚类方法对嵌入式特征执行聚类分配,可改善成像测井资料分类任务精度,帮助实现高质量储层模型建立及精细的储层解释。如Lima等[75]率先做出相关尝试,并给出了相应的聚类簇中各个成像资料所蕴含的岩相信息解释,节省了人工解释时间。相关方法或许仍难以完全替代岩心分析、专家解释,但可作为人工解释或完备数据集制作等工作的先导研究,极大节省从业人员在数据预处理、数据集准备过程中耗费的时间和精力,更好地推动智能方法在测井领域的应用。目前笔者的课题组在这个方向已经取得了初步的成果。

图5 用于成像测井资料的深度聚类方法示意图(图片重制自Lima等[75])

4 总 结

通过介绍人工智能、机器学习相关概念及其分类,将基于物理模型的传统建模方法和基于机器学习手段的智能方法进行对比,简述了人工智能方法对于地球物理测井领域数据分析任务的适用性。用这些方法探索更大的函数空间,以非线性方式从高维空间中发现变量间的关系。并从2类发展较为系统的常规测井资料智能解释领域(常规测井资料岩相分类和参数反演)列举了这些智能算法的工作流程。最后,笔者从3个方面为测井资料智能解释的未来发展提出了思考及展望。

(1)借助大量理论模型正演资料,机器学习方法或能作为数值模拟方法的替代模型。

(2)开发适用于更多来自新手段的测井资料的机器学习智能解释工作流,可为传统智能岩相分类及参数反演等任务带来更好的效果。

(3)如何高效扩充开源数据集或结合无监督手段提升智能算法表现,值得从业人员思考。

除了上述3点思考和展望外,还有不少新进展:如基于计算机视觉的成像测井裂缝识别及数字岩心图像重构;基于人工智能技术的测井仪器(基于集成电路技术发展定制化的测井芯片);基于边缘计算、深度学习的测井资料压缩(实现更快的数据传输);构建测井云平台,利用大数据技术将机器学习方法应用于海量测井数据的快速解释等。

相信,随着从业人员的不断探索,人工智能、机器学习方法同地球物理测井领域将实现更为紧密的结合,带来更多的进展与突破。

猜你喜欢
岩相测井反演
本期广告索引
反演对称变换在解决平面几何问题中的应用
渤中34-9油田古近系火山岩岩相特征与分布预测
砾质辫状河型冲积扇岩相类型、成因及分布规律——以准噶尔盆地西北缘现代白杨河冲积扇为例
拉普拉斯变换反演方法探讨
基于测井响应评价煤岩结构特征
随钻电阻率测井的固定探测深度合成方法
中石油首个全国测井行业标准发布
等效源反演成像在激发极化法中的研究及应用
叠前同步反演在港中油田的应用