基于视频图像获取冰面特征的自动检测算法研究

2021-10-21 05:29周嘉儒王庆凯李润玲
水利科学与寒区工程 2021年5期
关键词:海冰冰面聚类

周嘉儒,卢 鹏,王庆凯,解 飞,李润玲

(1.大连理工大学 海岸和近海工程国家重点实验室,辽宁 大连 116024;2.河北建筑工程学院 市政与环境工程系,河北 张家口 075000)

在全球气候变化的大背景下,对气温敏感的冰冻圈是地球圈层中变化最为明显的[1]。因此对冰变化的连续监测是研究气候变化及其工程效应的重要内容。现场冰观测通常受到恶劣自然条件和后勤保障困难的限制;卫星遥感能够满足大范围监测要求,但在识别冰面小尺度特征,如海上流冰形状及其表面融池尺寸、冰面粗糙度等,显得无能为力[2]。河冰的流凌对冰坝形成,海冰的流冰对冰脊形成,它们对水工结构物、海洋结构[3]以及航行船舶抗冰设计都是必要的。因此需要这些冰块的几何参数和表面特征参数。随着数码摄影技术和硬件的发展,在岸基河冰发展过程的可视图像研究基础上[4-6],国内迅速发展出船基海冰[7]、岸基河冰[8-9]、无人机海冰[10]和河冰[11]的可视图像技术,从中提取冰面特征成为冰研究的重要手段之一。

目前制约该技术全面推广应用的主要瓶颈在于如何自动化地处理海量图像,从而高效提取冰面特征参数。国内已经完成对海冰图像人工处理得到海冰密集度[7];对CT图像裁剪、滤波和阈值分割等处理,构建了天然冰的三维孔隙模型,提取了其内部微结构信息[12];使用Canny算子对黄河冰晶体的边界进行提取,再基于连通区域原理统计分析冰晶等效直径的分布规律[13];对黄河防凌远程视频影像提取黄河沿岸流凌密集度和流速等[9]。然而,它们的图像处理方法都需要大量人工辅助,存在费时费力、效率低下的缺陷。本文基于自动海冰表面特征检测开源算法Open Source Sea-ice Processing(OSSP)[14],对其在船基海冰图像上的适用性进行应用探讨和算法拓展,同时与人工处理结果进行对比分析,为船基图像的自动处理和冰面特征参数提取奠定基础;也能支持岸基河冰可视图像分析技术的改进。

1 冰面特征参数提取算法

从数字图像中提取冰面特征一般包括两步:首先对图像进行有效分割,将不同表面特征的区域划分开;再将分割后的区域作为单独的对象进行分类和合并,对某一类对象进行统计分析。

1.1 分割算法

阈值法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术,也被应用于冰图像分析。例如,王明锋等通过RGB三通道灰度值与光谱反射曲线的关系,并依据贝叶斯原理寻找最佳阈值,对融池、融洞和海冰进行了分割[10]。然而,阈值法适合将海冰图像分割为两种表面类型,也就是简单区分冰和海水,而无法将冰面融池参数提取出来,所以它用于提取海冰图像融池的可行性不大。

K-means聚类算法因其高效简单的优势,在各领域实际应用中十分广泛。Xu等提出了一种从合成孔径雷达(SAR)图像中获取海冰信息的基于核主成分分析(KPCA)局部纹理特征的海冰分割方法[15]。此方法在对图像处理得到KPCA特征后,利用K-means算法分割图像。它与其他几种常用海冰分割方法相比具有较强的鲁棒性,并且更准确和快速。K-means聚类算法简单、快速、高效,并对大数据集处理具有一定的相对可扩展性和高效性。当分割图像包含的聚类数量较多,且每个聚类之间差异明显时效果较好。缺点是初始的聚类中心K值需要事先给出,而初始聚类中心的位置对分割结果有显著影响。而海冰图像常见的分割为三个聚类,即海冰、水和融池,聚类数目较少,并且融池和海水两种聚类的差异也较为不明显。因此,K-means聚类算法不适用于处理海冰图像提取融池信息。

分水岭变换已经被证明是一种非常有用和强大的形态学图像分割工具[16-17],也应用在海冰图像分割中。例如,赵庆平等人针对SAR图像分割仅考虑像素本身灰度值而不考虑空间特征的阈值法和聚类方法中存在的图像有噪或边界模糊问题,提出一种基于区域增长迭代算法的SAR海冰图像分水岭分割,真实SAR图像的实验结果表明该算法的快速性和有效性,同时保留了目标的细节信息[18]。由于分水岭算法相比于阈值法和聚类算法的巨大优势,本文描述的海冰图像自动处理算法选用分水岭分割算法,它能够有效分割出图像中感兴趣的海冰类型区域。

1.2 分类算法

支持向量机方法的原理是建立在统计学习理论的VC维理论和结构风险最小原理基础上,能够依据小样本数据完成分类。但是它对分类依据的特征标签要求较高,会直接影响分类结果的精度。张明等选用SAR遥感数据,结合纹理特征分析,通过实验得到适宜用于海冰分类的多特征组合。在此基础上利用支持向量机开展SAR海冰类型的分类研究。结果表明,该方法可以识别海冰SAR图像中一年冰、多年冰和海水3种类型[19]。但是此方法提取特征标签的前期工作难度和工作量均较大,对时空复杂的冰情和日照等条件下的现场实拍图像,优质特征难以提取。大样本、批处理和较强的泛用性是硬要求,目前支持向量机的功能还无法达到。

随机森林作为新兴起的、高度灵活的一种机器学习算法,拥有广泛的应用前景。随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习方法。随机森林算法简单且容易实现,计算量小,并且它在很多现实任务中展现出强大的性能。随机森林分类方法与海冰表面特征分类较为契合,分类结果不受分类个数的影响,包容性强,众多不同的环境下拍摄的图像也可以囊括在训练集的创建当中,通过较小的工作量即可完成一定量的批处理分类。尽管目前随机森林算法在海冰图像上的应用研究较少,但本文所用算法中最后的分类工作选择随机森林算法,并如期获得了较准确的分类结果。

2 OSSP算法与改进

2.1 OSSP算法

自动海冰表面特征检测开源算法(OSSP)[14]采用分水岭算法作为分割方法,并利用随机森林算法对分割后的对象进行分类。最初设计用来对不同种类的海冰图像进行自动化处理,主要包括下面四类:WorldView卫星全色高分辨率卫星图像,八波段多光谱格式的高分辨率卫星图像,SIZONet项目的航拍sRGB图像,和NASA冰桥行动数字测绘系统光学图像。对每一种图像来源都制作了相应的初始训练集,容量分别为1000、859、945和940,并且分类结果精度分别达到94%、89%、94%和91%,其处理流程见图1[14]。主要步骤包括:(1)在测试算法前,需要先对图像进行一定的预处理。(2)对预处理后图像应用索贝尔滤波器过滤,再转换得到标记有高梯度线的梯度图像。(3)利用分水岭分割算法基于分割出每一个完整且单独的对象区域,将算法从像素水平提升至区域水平,得到分割后的图像。(4)通过随机森林分类算法对分割出的所有对象进行分类。

图1 原OSSP算法流程图

但使用原OSSP算法对船基海冰图像进行处理时,还面临许多问题。(1)因为船基图像的分辨率远高于初始训练集中的卫星图像,而投影方式又与初始训练集中的航拍图像不同。所以船基海冰图像处理需要创建新的船基海冰图像个性化训练集。(2)原算法的输出结果是像素数比例,不能直接给出密集度。因此需要对原算法做些改进。当重点关注冰面融池覆盖率时,需要将原算法中多余表面类型移除,只留下冰、融池和水域三种;同时,输出结果由原来的像素数量改为输出更加直观的三色图(白色为海冰,蓝色为融池,红色为海水)。(3)船基图像处于倾斜拍摄,拍摄方式不仅影响了现有训练集对船基图像处理的可行性,也使得原算法在最终计算各种表面特征类型占比的结果出现较大偏差。需要倾斜图像几何校正算法[7],解决三色图中真实的冰、水、融池的面积比。

2.2 船基图像训练集

创建训练集是随机森林算法中的重要步骤,也是海冰图像自动处理的关键。训练集的大小在原算法中并未严格规定,需要首先研究训练集大小对冰面特征提取结果的影响。具体做法是(1)随机抽出100张船基海冰图像作为待处理图像,记为计算集J。(2)从剩余船基图像中随机选择三张进行训练,每张图像限制1000个训练对象,得到训练集X,利用算法基于训练集X对计算集J进行处理。(3)根据同样的方式随机挑选三张加入训练集X当中,再对计算集J进行处理,依此类推。(4)统计基于不同容量训练集X处理计算集J得到的融池覆盖率参数变化,结果如图2所示。

图2 计算集处理结果随训练集容量增大的变化

从图2中可以看到,在起始训练集容量较小时融池覆盖率曲线波动相对较大,而在训练集容量达到12 000个后,随着训练集容量的继续增大曲线逐渐趋于稳定。这说明融池覆盖率随着训练集容量的增大而趋于稳定。此外,随着训练集容量增大,融池覆盖率的标准误差逐渐减小,这说明选取训练集容量时较大的训练集容量依然占取微弱的优势。因此对于海冰表面特征应选取容量尽可能大,本文取84 000个的训练集对计算集进行处理。

3 结果与讨论

2018年7月30日—9月1日是中国第九次北极科学考察冰区航行,船基图像共计42 821幅。图像中包含的冰情分为三类。第Ⅰ类为只存在冰和融池的“冰融池”类型,约占总图像的10%,如图3(a);第Ⅱ类为水、冰和融池共存的“水冰融池”类型,约占总图像的50%,如图3(b);第Ⅲ类为只存在水和冰的“水居多”类型,约占总图像的40%,如图3(c)。其中选择第Ⅰ类型148张;第Ⅱ类型124张和第Ⅲ类型183张,利用改进的算法进行自动处理,所得结果与人工处理结果[20]进行比较,如图4。SIC为海冰密集度,MPF为融池覆盖率。

图3 三种类型九北船基图像示例(2018年7月30日—9月1日)

图4 三种类型船基图像自动处理与人工处理对比

图4中“○”和“×”的数据点分别是海冰密集度(SIC)和融池覆盖率(MPF)。海冰密集度是指冰与融池之和的面积占比,融池覆盖率是指融池的面积占比。由图4(a)和4(b)发现,Ⅰ和Ⅱ两类海冰图像的改进算法和人工处理的海冰密集度(SIC)、融池覆盖率(MPF),二者基本相符。Ⅰ类型的SIC和MPF回归性分析的可决系数R2分别为0.416和0.564。Ⅱ类型的SIC和MPF回归性分析的可决系数R2分别达到0.713和0.409。两者处理结果均落在±2ε范围内,处于99%置信区间内。图4(c)中第Ⅲ类型的海冰图像SIC和MPF约有一半的数据点分布在等线附近,还有另外一半分布在等线右下方距离较远处(黑色三角框内部)。

当图像上半方受光照不均匀影响,暗蓝色的水域却呈现出与雪冰相近的白色(图5(a)),深色的海水也有可能呈现出接近于融池的蓝色(图5(b)),这些图像主要发生在第Ⅲ类型。图像处理结果欠佳,只有一半的图像自动算法与传统人工处理结果相符。

图5 第Ⅲ类型受光照不均匀影响处理欠佳图像示例

4 结 论

(1)对于船基海冰图像,随机森林分类器的训练集样本容量至少需要达到12 000个,自动处理结果才与样本容量无关。同时随着训练集容量的增大,融池覆盖率的标准差仍逐渐减少,因此应尽可能选择较大容量的训练集。建议采用84 000个。

(2)改进后的自动处理算法对“冰融池”“水冰融池”类型的海冰图像成功率接近100%;“水居多”类型的海冰图像成功率接近50%。就全部第九次北极科学考察的42 821幅图像,约80%能自动准确处理。剩余的20%主要是“水居多”类型海冰图像,它们因拍摄时光照条件的影响,常有将远方开阔水域部分分类为白色冰或者蓝色融池。

(3)以船基海冰图像中提取冰面融池为例,验证了OSSP算法的可行性。未来可以利用更多的现场图像来验证和拓展该算法的适用性,为船基、无人机海冰或者岸基、无人机淡水冰的现场可视图像的自动化地提取几何和表面特征参数提供有效手段。

猜你喜欢
海冰冰面聚类
冰面上的“魔力”
基于Argo浮标的南极海冰范围变化分析
在天然冰面上滑行
末次盛冰期以来巴伦支海-喀拉海古海洋环境及海冰研究进展
近三十年以来热带大西洋增温对南极西部冬季海冰变化的影响
基于K-means聚类的车-地无线通信场强研究
冰面精灵
不要在危险的冰面上玩耍
基于高斯混合聚类的阵列干涉SAR三维成像
基于SIFT-SVM的北冰洋海冰识别研究