应用快速不动点延续算法的地震数据重建

2019-12-05 07:25彭佳明付丽华张雪敏

石油地球物理勘探 2019年6期

关键词：范数复杂度信噪比

彭佳明付丽华张雪敏

(中国地质大学(武汉)数学与物理学院，湖北武汉 430074)

0 引言

从缺失的原始数据重建完整地震波场是经典的反问题。显然，地震数据重建可为后续的偏移成像、全波形反演等处理提供可靠的基础数据[1]。现今，地震数据的重建方法主要有以下六类。

基于滤波的重建方法是通过褶积插值滤波器实现插值，较常用的有基于预测误差滤波方法等[2]。此类方法的优点是不需反射同相轴的先验信息，不受假频影响；缺点是运算量较大，且只适用于规则采样的地震数据。

基于波场延拓算子的重建方法是通过Kirchhodff积分算子实现插值，主要有炮域延拓法[3]、炮检距域延拓法[4-5]和倾角时差校正法[6]等。该类方法的优点是灵活度高，能最大程度地利用地下信息；缺点是计算复杂度较高。

基于变换域重建的方法常采用Randon变换[7-8]、Fourier变换[9-10]、Curvelet变换[11-12]等，再在变换域完成地震数据的重建。该类方法的优点是计算速度快，可处理不同缺失形式的地震数据；缺点是不适用于有限带宽和含有空间假频的地震数据。

基于相干倾角插值的重建方法主要包括最大相干倾角插值法[13]和多倾角同相轴方法[14]。其优点是可自适应地做倾角扫描；缺点是不适用于含噪地震数据，对于高维地震数据的计算复杂度很高。

基于压缩感知理论的地震数据重建[15-18]，其思想是利用变换域的稀疏性，将重建作为反问题求解。其主要方法有正交匹配追踪算法[19]、字典学习法[20-21]、光滑L1范数法[22]和Bregman迭代算法[23]等。它们的优点是计算速度快，可处理大规模问题；缺点是受噪声干扰影响较大。

近年来，作为压缩感知的二维推广形式，“矩阵补全”得到快速发展，基于“低秩补全”的地震数据重建也成为现今主流方法。其优点是比现有方法更简单、高效；缺点是须通过预变换建立低秩结构。基于低秩补全理论的重建方法的主要原理是：有限个线性同相轴的无缺失或无噪声污染的地震数据在频率切片上是低秩结构[24]，而数据的缺失和噪声的存在导致地震数据构造的Hankel矩阵的秩的增加，因此可通过降秩处理实现数据重建。

经典的矩阵秩最小化是一个“NP难”(高复杂度)问题。对此，人们尝试将秩最小化近似转化为核范数最小化问题，再利用凸优化法进行求解。Trickett等[25]提出基于频率切片降秩的方法。Oropeza等[26]证明地震时频切片形成的块Hankel矩阵是低秩矩阵。Yang等[27]梳理了矩阵补全与地震数据重建的关系，针对地震数据重建提出核范数最小化模型，且说明了低秩矩阵补全的可靠性。Cai等[28]提出的奇异值阈值(Singular Value Thresholding， SVT)算法，主要是利用交替更新和梯度下降法求解核范数最小化问题，而SVT的加速算法可参见文献[29-30]。Goldfarb等[31]通过分离变量后，利用参数交替迭代更新和软阈值收缩算子求解，实现了不动点延续(Fixed Point Continuation，FPC)算法，且提出利用迭代方式更新观测数据，即FPC与Bregman迭代[32]相结合的算法。Toh等[33]通过利用目标函数的二阶泰勒逼近函数，再利用不同变量的相互交替更新，实现了加速近端梯度(Accelerated Proximal Gradient，APG)算法；并给出了改进的加速算法(Accelerated Proximal Gradient by Linesearch-like technique，APGL)。

FPC算法在每次迭代更新时都需进行奇异值分解(Singular Value Decomposition，SVD)，因此会降低算法效率。传统解决方法是利用PROPACK加速包，该方法能对矩阵进行快速SVD。为了进一步提高计算效率，本文提出一种快速不动点延续(Fast Fixed Pointed Continuation，FFPC)算法，利用块克雷洛夫迭代近似奇异值分解算法(Block Krylov Iteration Methods for Approximate SVD，BKIMASVD)和子空间复用技术，在保证重构精度的同时可大幅度缩短运行时间。BKIMASVD是基于随机投影形式实现的，其计算复杂度远小于PROPACK中所采用的快速算法；子空间复用技术则通过减少迭代次数，大幅度缩短运行时间。通过以上两种技术的运用，相比传统加速算法，FFPC有更高的计算效率。

1 基于FPC算法的地震数据重建

1.1 基于低秩理论的地震数据重建模型

地震数据重建的秩最小化模型为

(1)

式中：X∈Rm×n为重建的地震数据，其中m、n为重建地震数据的维度，且有p=m×n； Rank(X)表示求X的秩； A是一个Rm×n→Rp的线性映射；b∈Rp为缺失的地震数据列向量化结果。

式(1)的求解是个“NP难”问题，因此通常可将目标函数凸松弛为核范数最小化进行求解。

假设矩阵X有r个正奇异值σ1≥σ2≥…≥σr>0，则X的核范数定义为

则基于核范数最小化的地震数据重建的模型如下

(2)

式中μ为正则化参数。

1.2 FPC重建算法的步骤

式(2)目标函数关于X的次梯度为

μ∂‖X‖*+g(X)

(3)

式中： ∂‖X‖*为核范数的导数；g(X)=A*[A(X)-b]，且A*是A的“逆运算”。

假设重构矩阵X*为式(2)的最优解，则满足

0∈τμ∂‖X*‖*+τg(X*)

=τμ∂‖X*‖*+X*-[X*-τg(X*)]

(4)

式中变量τ>0。定义Y*=X*-τg(X*)，式(4)等价于

0∈τμ∂‖X*‖*+X*-Y*

(5)

对式(5)关于X*求积分，可知X*也是下式最优解

(6)

这样，式(2)的秩最小化问题即可利用文献[32]中定理3求解。表1给出了具体的FPC算法步骤。

表1 不动点延续算法(FPC)步骤

1.3 FPC算法复杂度分析

FPC算法中最重要的部分为循环体中的第2～第4步。假设循环终止迭代次数为M，由于第2步的截断SVD主要是针对稀疏矩阵Y操作的，再假设Y∈Rm×n中非零个数为Φ，选取的奇异值个数为k，则第2步复杂度为cSVDk|Φ|=O[mnmin(m,n)]，其中cSVD为标准SVD复杂度常数；利用PROPACK加速包，可将计算复杂度降低为O(kmn)。计算第3步的复杂度为O[m(k+n)(2k-1)]，第4步的复杂度为O(1)。

综上所述，FPC算法的平均复杂度为

kO[mnmin(m,n)]+kO[m(k+n)(2k-1)]+kO(1)

=M{cSVD[mnmin(m,n)]+

cmul[m(k+n)(2k-1)+1]}

(7)

传统加速型FPC算法的平均复杂度为

M{cSVD(kmn)+cmul[m(k+n)(2k-1)+1]}

(8)

式中cmul为矩阵乘法的复杂度常数。

2 FFPC算法

为了解决SVD算法复杂度较高的问题，本文提出的FFPC算法采用随机投影的分解方法，即将高维矩阵投影到低维矩阵，再进行SVD运算；同时利用子空间复用的方法减少迭代次数，降低计算复杂度，以进一步提高运行效率。

2.1 块克雷洛夫迭代近似奇异值分解算法

BKIMASVD算法的主要思想是基于RandQB过程[34-35]，将需要进行SVD的矩阵A降维分解，通过对维度更低的矩阵B进行SVD以达到快速分解的目的。RandQB过程可表示为

A≈QBA∈Rm×n,Q∈Rm×l,B∈Rl×n

(9)

式中l≪min(m,n)。

BKIMASVD的具体步骤为：首先对观测矩阵A随机采样得到采样矩阵AΩ，其中Ω∈Rn×(k+s)为随机产生的矩阵；将采样矩阵AΩ通过QR分解(将一个矩阵分解为一个正交矩阵与上三角矩阵的乘积)得到正交矩阵H0，在P次循环迭代过程中通过[Hi,～]=QR[A(ATHi-1),0]迭代方法逐步更新子空间Hi,i∈{1,2,…,P}；再将迭代产生的子空间Hi按列依次排列，扩充为更高维度的空间H；然后对高维空间H进行QR分解得到子空间矩阵Q，这样便得到低维矩阵B=QTA；最后对B进行SVD即可提高其计算效率。迭代参数P可提升子空间维度，提高重建精度[34]，详细原理参见文献[35-38]。表2为BKIMASVD的具体算法步骤。

表2 BKIMASVD算法步骤

2.2 子空间复用

在FPC算法中，每个观测矩阵需进行多次SVD迭代更新。事实上，当FPC算法执行多次迭代后，迭代更新的矩阵Yt会趋于稳定，因此在后续对Yt进行迭代更新时，可复用第P次迭代产生的子空间Q，再对B=QTYt进行SVD[34]。当FPC算法中迭代次数t超过P后，复用技术可省去高维空间H和Q的迭代计算，从而有效缩短运行时间。

具体操作步骤为：当迭代次数小于P时，利用BKIMASVD对迭代更新的矩阵进行分解；当迭代次数超过P后，保留第P次产生的Q，直接从BKIMASVD算法(表2中)的第6步开始执行，这样就可保证在高精度范围内提高计算效率。迭代中可将P设置较小，只要满足(k+s)P≪min(m,n)就可保证多次循环迭代时SVD的计算量大幅度降低，也就可在确保精度的情况下显著缩短运行时间。

本文提出的FFPC算法是以BKIMASVD替代SVD，同时利用子空间复用技术减少迭代更新次数，可极大地提高计算效率。表3给出了FFPC算法的具体步骤。

表3 FFPC算法步骤

2.3 FFPC算法复杂度分析

FFPC与FPC算法最大的不同点在第2步，因此需首先分析BKIMASVD的复杂度。对于矩阵A∈Rm×n，BKIMASVD的第3步(表2)中的每一次循环迭代所需计算量为2cmul(k+s)Nnnz+cQRm(k+s)2，则循环P次的计算量为

2cmul(k+s)PNnnz+cQRm(k+s)2P

(10)

生成Q的计算量为cQRm(kP+sP)2，生成B的计算量为

cmul(k+s)PNnnz

(11)

对B进行SVD的计算量为

cSVD[m(kP+sP)min(m,kP+sP)]

(12)

第8步(表2)计算量为cmul[(k+s)P]2m，第9步(表2)计算量为cmul[m(k+n)(2k-1)]。因此，BKIMASVD的复杂度为

cSVDm(kP+sP)min(m,kP+sP)+

cmulm(k+s)(2k-1)

(13)

式中：Nnnz表示矩阵A中的非零元素的个数；cQR表示QR分解的复杂度常数。且(k+s)P≪min(m,n)，而传统SVD算法的复杂度为cSVD[mnmin(m,n)]=O[mnmin(m,n)]，所以利用该算法可实现快速SVD。

同样，假设循环终止迭代次数为M，因第2步(表3)的SVD主要针对稀疏矩阵Yt，假设Yt∈Rm×n中非零个数为Φ，选取奇异值个数为k，子空间复用个数为P，则第2步(表2)主要复杂度为

(kP+sP)2m+cSVDm(kP+sP)×

min(m,kP+sP)+cmulm(k+s)(2k-1)]

(14)

当次数超过P以后，由于复用前面计算的Q，所以只需计算B的分解，那么循环所需时耗为

(M-P)[cmul(k+s)PNnnz+

cSVDm(kP+sP)min(m,kP+sP)+

cmul(kP+sP)2m+cmulm(k+s)(2k-1)]

(15)

则FFPC算法的复杂度为

3cmulkP2Nnnz+(cQR+cQRP)m(kP+sP)2+

M[cSVDm(kP+sP)min(m,kP+sP)+

cmulm(kP+sP)2+cmulm(k+n)(2k-1)]

(16)

当矩阵维度m、n较大、P很小(P≪M)，且满足条件(k+s)P≪min(m,n)时， FFPC算法的复杂度近似为

M[cSVDm(kP+sP)min(m,kP+sP)+

cmulm(kP+sP)2+cmulm(k+n)(2k-1)]

=M[(cSVD+cmul)m(kP+sP)2+

cmulm(k+n)(2k-1)]

(17)

而传统加速型FPC算法的复杂度可近似为

M[cSVDkmn+cmulm(k+n)(2k-1)]

(18)

当P、k、s满足以上条件时，对比FFPC与FPC算法的复杂度，可知FFPC算法相对FPC具有更高的计算效率。

3 基于FFPC算法的地震数据重建

理论证明了地震数据在频率切片上具有低秩结构特性，但地震数据的缺失会导致其构造Hankel矩阵的秩增加，于是缺失位置信息就可通过降秩进行重建。针对地震数据，图1给出了基于FPC和FFPC算法的重建流程图。具体操作过程如下。

首先对缺失观测地震数据做一维傅里叶变换，得到实部和虚部两部分，再在频率域的每个切片上构造Hankel矩阵；对于每个Hankel矩阵，分别利用FPC和FFPC算法进行降秩重建；针对重建的Hankel矩阵用反对角取平均，即可得重建的频率切片；最后将重建的实部和虚部频率切片通过逆傅里叶变换到时间域，即完成了地震数据重建(图1)。

图1 基于FPC和FFPC算法的地震数据重建流程

4 实验

测试实验选用两个主要衡量指标，即信噪比和运算耗时。信噪比的计算公式为

(19)

式中：Ps是信号能量；Pn是噪声能量；I为原始信号；In为噪声信号。此处运算耗时为重建过程所消耗的CPU 时间。采用重建信噪比相对误差表征不同算法重建信噪比的差异，其计算表达式为

(20)

4.1 仿真地震数据实验

仿真数据由Ricker子波产生，它包含两条交叉的线性同相轴，仿真地震数据(图2a)尺寸为256(道)×256(个)。对比原始仿真地震数据(图2a)、随机缺失50%数据(图2b)及其对应的频率—波数图(图3a、图3b)，可见图3b上有很明显的假频；从基于FFPC与FPC算法的重建结果(图2c、图2d)及其对应频率—波数图(图3c、图3d)上，清晰可见抗假频重构特征。当缺失率为50%时(表4)，FFPC与FPC的重建信噪比相对误差为0.38%，但FFPC算法耗时为FPC算法的1/1.66。显然，针对仿真地震数据，在确保高精度重建效果的同时， FFPC算法比FPC具有更高的计算效率。

为了更详实地对比不同缺失率下FFPC和FPC算法的重建效果，分别测试了缺失率为10%～80%情况下基于两算法的重建信噪比和耗时(表4、图4和图5)。可知在固定缺失率情况下，FFPC与FPC算法重建信噪比误差范围为0.38%～7.00%，而FFPC算法的重建耗时为FPC算法的1/3.53～1/1.59。FFPC和FPC算法的重建信噪比都随缺失率的增加而降低；重建耗时也随缺失率的增加总体上逐渐降低，且FFPC算法提升的倍率为先降后升(以60%缺失率为界)。当缺失率≤50%时，FPC算法耗时较长；而利用FFPC算法能在确保高精度重建的同时，显著缩短运行时间，提高计算效率。

4.2 叠前地震数据实验

选取实际叠前地震数据(256(道)×256(个))进行实验。对比原始叠前数据(图6a)、随机缺失50%数据(图6b)及其对应频率—波数图(图7a、图7b)、基于FFPC和FPC算法的重建结果(图6c、图6d)及其对应频率—波数图(图7c、图7d)，可见基于FFPC的重建效果与FPC基本相当，都可较好地对随机缺失数据进行插值。当缺失率为50%时(表5)，FFPC与FPC的重建信噪比相对误差为0.58%；但FPC算法的耗时是FFPC的3.83倍，表明针对叠前数据，在确保高精度重建效果的同时，FFPC计算效率更高。

图2 缺失率为50%的仿真地震数据重建效果对比(a)原始数据； (b)随机缺失50%的数据； (c)基于FFPC重建的数据； (d)基于FPC重建的数据

图3 缺失率为50%时仿真地震数据频率—波数对比(a)原始数据； (b)随机缺失50%的数据； (c)基于FFPC重建的数据； (d)基于FPC重建的数据

图4 不同缺失率下仿真数据FPC与FFPC算法重建耗时

图5 不同缺失率下仿真数据FPC与FFPC算法重建信噪比

图6 缺失率为50%的叠前地震数据重建效果对比(a)原始数据； (b)随机缺失50%的数据； (c)基于FFPC重建的数据； (d)基于FPC重建的数据

表4 不同缺失率下仿真数据FPC与FFPC算法性能对比

表5 不同缺失率下叠前数据FPC与FFPC算法性能对比

表5给出缺失率为10%～80%的叠前地震数据的重建信噪比和耗时(图8、图9)。可见在固定缺失率时，FFPC与FPC算法重建信噪比的相对误差范围是0.37%～3.80%，即二者重建的精度接近；而FPC算法的重建耗时却是FFPC算法的2.37～5.88倍。随着缺失率的增加，FFPC和FPC算法的重建信噪比都降低，二者的重建耗时也逐渐降低。当缺失率≤50%时，FPC算法耗时很长，而FFPC算法在确保高精度重建的前提下能显著缩短运行时间，具有更高计算效率。

图7 缺失率为50%时叠前地震数据频率—波数对比(a)原始数据； (b)随机缺失50%的数据； (c)基于FFPC重建的数据； (d)基于FPC重建的数据

图8 不同缺失率下叠前数据FPC和FFPC算法重建耗时

图9 不同缺失率下叠前数据FPC和FFPC算法重建信噪比

4.3 叠后地震数据实验

选取相同尺度和特征参数的实际叠后地震数据做进一步测试。得到并对比原始叠后数据(图10a)、随机缺失50%的数据(图10b)、基于FFPC(图10c)和FPC(图10d)的重建结果及其对应的频率—波数图(图11a～图11d)，可见基于FFPC和FPC的重建结果对抑制假频都起了较好作用。当缺失率为50%时(表6)，FFPC与FPC重建信噪比误差为0.15%，但FFPC算法的重建耗时是FPC的1/1.75。

表6给出缺失率为10%～80%的实际叠后地震数据的重建信噪比和耗时(图12、图13)。可见在固定缺失率时，基于FFPC与FPC算法的重建信噪比的相对误差范围是0.15%～5.20%；而FPC算法的重建耗时是FFPC的1.75～2.99倍。FFPC和FPC算法的重建信噪比都随缺失率的增加而降低；重建耗时也都随缺失率的增加而逐渐降低，且FFPC算法提升的倍率为先降后升。当缺失率≤50%时，FPC算法耗时很长，但利用FFPC算法却能在确保高精度重建效果的同时，有效缩短运行时间，提高计算效率。

因此，基于BKIMASVD算法与子空间复用的FFPC算法比传统加速型的FPC算法的效率至少可提升1.75倍。

图10 缺失率为50%的叠后地震数据重建效果对比(a)原始数据； (b)随机缺失50%的数据； (c)基于FFPC重建的数据； (d)基于FPC重建的数据

图11 缺失率为50%的叠后地震数据的频率—波数对比(a)原始数据； (b)随机缺失50%的数据； (c)基于FFPC重建的数据； (d)基于FPC重建的数据

表6 不同缺失率下叠后数据FPC与FFPC算法性能对比

图12 不同缺失率下叠后数据FPC与FFPC算法重建耗时

图13 不同缺失率下叠后数据FPC 与FFPC算法重建信噪比

5 结论与展望

基于核范数最小化的FPC算法在每次迭代过程中需进行SVD，导致算法的计算复杂度较高；传统的加速方法为直接利用PROPACK包，但仍然耗时较长。本文提出利用BKIMASVD算法和子空间复用的FFPC算法，并分析了该算法的计算复杂度。仿真数据和实际地震数据的实验表明：基于FFPC算法与基于FPC算法的地震数据重建精度基本相当，都可较好地对随机缺失地震数据进行插值，实现抗假频重构，但本文提出的FFPC算法进一步提高了计算效率。

实验过程中还发现：对于m≤n类型的矩阵，FFPC算法提速效果更明显。由于算法所涉及的参数较多，它们的选取和设定都会一定程度地影响重建效果。其中幂迭代次数P可通过前后两次迭代的重构矩阵误差满足一定精度而自适应地改变。