基于人工智能的清水墙典型损伤智能识别与评估方法研究

2021-02-23 12:30张英楠谷志旺
建筑施工 2021年11期
关键词:锚框典型神经网络

张英楠 谷志旺 何 娇

上海建工四建集团有限公司 上海 201103

历史建筑往往采用清水墙作为建筑主体立面,由于人为因素及自然环境的长期影响,清水墙不可避免地会出现不同种类、不同程度的表面损伤,这些损伤给清水墙的修缮及复建施工工作带来了极大影响。常见的清水墙损伤类型包括风化、泛碱、绿植覆盖3种[1]。风化为清水砖表面与大气、水及生物接触过程中产生物理、化学变化,在原位形成松散堆积物的全过程。风化会使清水墙表面形成疏松的粉化层,导致清水墙强度降低[2];泛碱是指Ca(OH)2等可溶性盐随温度、湿度等外部环境变化,在水分吸收、水分迁移、水分蒸发过程中发生物理、化学变化,使清水墙表面破坏的一种病害现象,其发生与砌筑材料质量、可溶性碱性氧化物含量、空气湿度等多因素有关[3];绿植覆盖是在自然条件下,植被、苔藓、植物分泌物大量出现导致的清水墙表面脏污现象。

目前,清水墙损伤查勘工作基于人眼视觉及过往经验进行开展,查找、标记并测量清水墙表面损伤区域,目测评估清水墙表面损伤程度。这种传统人工查勘方法受人为影响因素大,损伤检测效率低,且大面积的清水墙表面损伤查勘工作极易引起人的视觉疲劳,经常造成错检、漏检等情况。此外,对于较高的墙面、地下室墙体等复杂、危险部位的损伤查勘工作,采用传统的人工检测方法通常需要搭设脚手架等辅助措施进行配合,操作流程较为复杂,同时也存在一定的危险性。

而随着人工智能的快速发展,深度学习与计算机视觉技术逐渐在各行业中推广实践。其中,在建筑工程领域,目标检测算法的应用最为广泛。目标检测算法主要用来从复杂场景中实现待测目标的自动分类与位置标记。利用目标检测算法,潘健等[4]提出了基于Faster R-CNN神经网络模型的村镇砖(混)木房屋识别提取方法,研究表明,该方法能够有效地实现砖(混)木房屋检测;陈利等[5]采用了改进的Faster R-CNN神经网络模型对故宫地砖缺陷进行了自动检测,平均准确率高达92.49%;李琛等[6]通过建立深度卷积神经网络(DCNN),提出了一种基于数字图像处理与深度学习方法的混凝土表面裂缝与孔洞检测方法。

基于此,本文利用人工智能手段,针对3种清水墙典型损伤,构建了清水墙典型损伤智能识别深度学习神经网络模型,提出了清水墙典型损伤自动评估方法,建立了全过程的清水墙典型损伤智能识别与评估系统,实现了清水墙典型损伤自动识别与快速评估。

1 基于YOLO v4的清水墙损伤智能识别

清水墙损伤查勘分为损伤诊断与损伤评估两部分工作,其中,损伤诊断具体包括损伤区域的查找以及损伤类别的区分,符合人工智能领域中目标检测算法的应用场景。现阶段,目标检测算法主要分为2种,一种是以R-CNN为代表的两阶段目标检测算法,该算法先生成锚框,再对锚框区域进行判断和修正,检测速度慢,但检测精度高;另一种是以YOLO为代表的单阶段目标检测算法,该算法直接将锚框提取与锚框检测整合为统一过程,检测精度低,但检测速度快。考虑到工程应用的时效性,本文采用现阶段兼顾检测速度和检测准确率的YOLO v4单阶段目标检测算法[7]开展清水墙典型损伤智能识别算法研究,通过建立图像数据集、搭建深度学习神经网络模型训练与运行环境、构建深度学习神经网络模型,提出清水墙典型损伤智能识别方法。

1.1 图像数据集的建立

首先,深度学习神经网络模型建立的前提是建立图像训练集、测试集与验证集。本文涉及的3种清水墙典型损伤具有各自独特的视觉特征:风化表现为明显的砖面表面脱落、缺失,泛碱表现为砖面表面出现白色结晶体,植被覆盖表现为砖面表面生长出绿色植被或绿藓等植物。基于上述视觉特征,本文从上海多个历史建筑项目中利用高清单反相机完成了高清图像采集,共1 000张图像。采集图像中包含风化、泛碱和植被覆盖3种典型损伤,损伤区域采用labellmg进行人工锚框预标注(图1),统一采用voc数据格式,即xml数据文件。由于采集图像样本数仅为1 000张,为提高深度学习神经网络模型应用的鲁棒性和适用性,本文采用多种图像数据增强技术扩充采集图像样本数据集,具体采用图像旋转、图像翻转、图像融合、图像填充、图像拼接、图像遮挡、图像畸变、图像随机擦除等多种图像数据增强手段,最终,扩充图像数据集至300万张。

图1 labellmg人工预标注界面

1.2 模型训练与运行环境的搭建

深度学习神经网络模型的训练与运行均需要消耗大量算力,对计算机硬件设备要求极高,因此,在构建深度学习神经网络模型前,应搭建深度学习神经网络模型训练与运行环境。

考虑到模型训练与运行的速度及稳定性,本文设置了包括16 GiB内存、520 GB硬盘空间、Nvidia Quadro T1000显卡(含GPU)、4 GiB显存、8核处理器、2.60 GHz主频的硬件环境以及包括Python(3.7.5版本)、Microsoft Visual Studio(2019版本)、CUDA(10.2版本)、cuDNN(7.6.5版本)、OpenCV(3.4.2版本)的软件环境,操作系统采用了Microsoft Windows 10,为本文后续研究提供了基础条件。

1.3 深度学习神经网络模型的构建

YOLO v4单阶段目标检测算法由Alexey Bochkovskiy在2020年正式提出[8],该算法将CSPDarknet53作为骨干网络,采用了Mosaic数据增强、cmBN、SAT自对抗训练、SPP模块、FPN+PAN结构等多种算法优化手段,验证了检测器训练过程中不增加推理成本和增加推理成本的算法优化手段的有效性。与其他主流目标检测算法相比,YOLO v4在保持检测速度的基础上,大大提高了检测精度,满足了实际生产生活中快速完成目标检测工作的应用要求[8]。与上一代YOLO系列算法的YOLO v3相比,YOLO v4不仅在检测精度上提高了约10%,同时在检测速度上没有衰减,其在COCO数据集上测试的平均精度和帧率精度分别提高了约10%和12%。此外,YOLO v4无需高算力环境配置,仅需单卡GPU(1 080 Ti或2 080 Ti)便可完成目标检测训练全过程,并修改了SOTA方法,使其更高效、更适合在单卡GPU上进行训练。

基于YOLO v4单阶段目标检测算法,本文建立的深度学习神经网络模型采用75层卷积层,学习率初始设定为0.001,最大迭代次数为100 000次,输入图像像素值为1 024h 1 024,梯度下降衰减系数为0.9,权重衰减正则系数为0.000 5,激活函数采用relu函数和leaky函数。其中,学习率变化策略不同于常规的手动修改学习率方式,本文采用了基于Adam的动态学习率控制算法,首先计算学习率梯度函数的一阶矩估计和二阶矩估计,并利用学习率梯度函数的一阶矩估计和二阶矩估计动态调整学习率。

在正式开展模型训练前,本文按照8∶2的比例分别建立了图像训练集和图像测试集(图像验证集与图像测试集相同)。为了降低误识率,本文增加了负样本图像(无损伤的图像样本),分别添加到图像训练集和图像测试集。此外,为了提高训练效果,本文采用了K-means聚类算法,根据多尺度锚框标记文件,生成9种锚框尺寸,输入到深度学习神经网络模型中。

K-means聚类算法在给定k值和k个初始类簇中心点的情况下,把每个点(即图像数据记录)分到离其最近的类簇中心点所代表的类簇中。当所有点均已分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(即平均值),然后再不断迭代,进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。

在本文搭建的模型训练环境下,风化、泛碱、绿植覆盖3种清水墙典型损伤检测模型的mAP最终值分别为91.2%、92.6%与94.1%,loss最终值分别为0.213,0.157与0.262,模型训练效果较好。

2 基于像素尺寸的清水墙损伤程度自动评估

OpenCV是Intel基于开源发行的跨平台计算机视觉库,它由一系列C函数和少量C++函数构成,拥有包括500多个C函数跨平台的中、高层API。OpenCV适用于多种编程语言,例如C++、Python、Java等,并且可以在不同的系统平台上使用,包括Windows、Linux、MacOS X、Android和iOS。在人工智能领域,OpenCV支持图像处理、计算机视觉和机器学习多种相关通用算法,能够实现图像分割、形状匹配、线条提取、曝光补偿等多种功能。此外,OpenCV的使用不依赖于外部库的建立,但可接入外部库,具有高度的用户友好性。

基于上述建立的清水墙典型损伤智能识别深度学习模型,本文根据识别锚框的像素坐标,利用OpenCV计算机视觉库,按照识别锚框区域范围,计算了识别锚框像素尺寸,通过识别锚框像素尺寸的面积除以图像像素尺寸总面积,分别得到了基于像素尺寸的3种清水墙典型损伤评估指标,即风化率、泛碱率、绿植覆盖率,形成了清水墙典型损伤像素级尺寸计算与损伤评估体系。

3 工程应用

利用上述研究成果,本文在上海多处历史建筑修缮及复建工程的现场查勘工作中开展了实践应用,查勘结果显示,采用本文所述方法,3种清水墙典型损伤均能精准诊断损伤类别,迅速标定损伤区域,准确计算相应的损伤评估指标,与传统人工查勘方法相比,显著提高了查勘工作的精度与效率。

4 结语

通过实际工程验证,本文所提出的基于人工智能的清水墙典型损伤智能识别与评估方法具有查勘效率高、诊断精度高、评估速度快、可操作性强等特点,且该方法对历史建筑和操作人员均无害,可在今后历史建筑修缮及复建工程中进行推广应用。

猜你喜欢
锚框典型神经网络
基于YOLOv3锚框优化的侧扫声呐图像目标检测
锚框策略匹配的SSD飞机遥感图像目标检测
用最典型的事写最有特点的人
基于SSD算法的轻量化仪器表盘检测算法*
基于GA-RoI Transformer的遥感图像任意方向目标检测
多项式求值题的典型解法
典型胰岛素瘤1例报道
神经网络抑制无线通信干扰探究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用