基于IMFO-Otsu的果实深度图像多阈值分割

2023-09-11 04:58陈汝杰唐文艳吕文阁李德源
现代农业装备 2023年4期
关键词:飞蛾剪枝适应度

陈汝杰,唐文艳,吕文阁,李德源

(广东工业大学机电工程学院,广东 广州 510006)

0 引言

机器视觉技术已经成为农业采摘机器人的核心技术之一[1]。图像分割是机器视觉的关键技术,是目标识别的关键和首要步骤,并为后续分类、识别提供依据。图像阈值分割以简单、快速和有效的特点得到了广泛的应用,文献[2-3]使用阈值分割算法对果实图像进行分割。但传统的果实图像是RGB 图像,使用颜色信息作为图像阈值分割的依据,但由于RGB 图像容易受到光照、环境等因素的影响,如果环境发生变化,设定的阈值可能会失效导致分割效果不理想[4]。

深度图像是描述场景深度信息的图像,其像素值表示距离的远近,具有不易受光照、环境等因素影响的优点[5]。在果实图像中利用深度信息是研究的热点,文献[6-7]在深度图像中使用边缘轮廓提取算法对果实进行分割,但是提出的算法较为复杂,实时性较差。因此需要研究简单、实时性强的深度图像分割算法。

传统的阈值分割算法只能将图像分割成2 个部分,不能完成复杂情况的分割任务,因此需要多阈值分割,但多阈值分割算法的计算量较大,难以做到实时性。本文提出一种基于改进飞蛾火焰算法的深度图像多阈值分割算法(IMFO-Otsu)并应用在果实图像的分割。

1 快速多阈值Otsu深度图像分割算法

1.1 构建深度直方图

由于深度图像的深度值没有固定的量化级,因此需要对其深度级进行量化,构建深度直方图,类似于灰度图像,可以设深度范围为[0,L-1],得到L个深度级,其中L=2d,d为图像的深度;设i为图像的像素即深度值,深度值为i的像素数为ni。这种方法能方便有效保留图像的深度信息和快速构建深度直方图。

1.2 快速多阈值Otsu算法

Otsu 算法是由日本学者大津提出的自适应算法,是目前最常用的图像阈值分割方法之一[8]。其主要思想是在寻找图像的最佳阈值使得类间方差最大[9],假设有m 一组阈值[t1,t2,…,tm],将图像分为m+1类,灰度级为i的像素数为ni,总的像素数为N,各灰度出现的概率Pi=ni/N。类间方差定义为:

Otsu 采用穷举法,随着阈值数量和灰度范围的增加,计算量会增加,因此需要提高算法计算效率。深度图像部分深度值对应的像素的数目为0,对于像素数nk为0 的深度值k,出现的概率Pk=nk/N=0,若假设以深度值a,b为阈值,Cb为a,b之间的类,设深度值j,a

所以b作为阈值和j作为阈值,对类间方差的结果是等效的。因此可以通过对阈值搜索范围进行剪枝处理来缩小搜索范围来提高搜索效率,具体操作为:寻找像素数nki≠ 0 的像素值集合K={K0,K1,…,Kk}∈L,阈值t在K里搜索。剪枝后的图像类间方差计算公式如下:

2 改进的飞蛾火焰算法(IMFO)

虽然剪枝后的Otsu 的搜索空间缩小,避免无效的阈值搜索,计算时间也会相应缩短,但其选取最佳阈值仍是采用穷举法。为提高算法的运行效率,引入一种改进飞蛾火焰算法,用于优化加速选取最佳阈值的过程。

2.1 飞蛾火焰算法

飞蛾火焰算法(MFO)[10]是一种新型的智能优化算法。在MFO 中,假设待优化问题候选解是飞蛾,其集合表示为其中d是变量维度,n是种群数目。火焰是记录目前飞蛾的最佳位置,其集合表示为

飞蛾位置更新公式:

式中:

Di——第i个飞蛾的位置与第j个火焰的位置之间的距离;

b——与螺旋形状相关的常量,取1;

t——随机数,取值区间为[-1,1]。

为了避免陷入局部最优,使用自适应火焰数目机制,火焰更新公式为:

式中:

flameno——火焰的数量;

t——当前迭代次数;

N——最大火焰数量;

T——最大迭代次数;

round——四舍五入函数。

2.2 改进的飞蛾火焰算法

由于标准的MFO 算法具有易陷入局部最优解、收敛速度慢等缺点,为了解决其缺点,在标准MFO算法的基础上提出一种改进飞蛾火焰算法。

2.2.1 精英准反向学习

TIZHOOSH[11]首次提出反向学习的概念,反向学习是在当前解的基础上,通过反向学习机制生成反向解,对比保留较优解。准反向学习[12]是在反向学习基础上,提出使用准反向解代替一般的反向解,准反向解比一般的反向解更靠近最优解。

准反向学习定义为:设xi(g)和别为第g代的当前解和准反向解,则可定义为:

式中:

IMFO 采取动态切换概率策略,用于控制是否进行准反向学习。动态切换概率p的公式如式(9)所示:

2.2.2 柯西变异

针对标准MFO 算法种群多样性少的问题,对种群进行变异操作,增加种群的多样性。利用标准的柯西分布具有较好的两翼概率特性,对适应度较好的飞蛾个体引入服从柯西分布的随机向量进行柯西变异,变异的飞蛾数量是种群数量的10%。柯西变异的公式如式(10)所示:

式中:

Mnew——变异后的飞蛾;

M——变异前的飞蛾;

C(0,1)——标准柯西随机数。

2.2.3 惯性权重策略

标准MFO 算法后期收敛速度较慢。为了解决这个问题,受到改进粒子群算法中惯性权重思想的启发[13],在式(5)引入惯性权重因子,当惯性权重比较大时,提高算法的全局搜索能力;当惯性权重比较小时,提高算法局部搜索能力。惯性权重的公式如式(11)所示:

式中:

ωmin——最小权重,取0.4;

ωmax——最大权重,取0.6;

k——权重因子,一般取0.1;

i——当前飞蛾根据适应度值排序后的次序;

NP——所有飞蛾的数目。

引入惯性权重ω飞蛾位置的更新公式如式(12)所示:

2.3 基于IMFO-Otsu多阈值深度图像分割算法流程

将剪枝后的Otsu 算法作为适应度函数,与IMFO算法结合为IMFO-Otsu 算法,其流程如图1 所示。

图1 算法流程图

3 试验与分析

为验证IMFO-Otsu 在果实图像的分割效果,分别对测试图像进行双阈值、三阈值、四阈值图像分割。结果如图2 所示(第一列从上往下分别为图像a、b、c 的原图)。使用的仿真软件为MatlabR2018b。将IMF-Otsu 与基于标准MFO 算法的MFO-Otsu、基于标准粒子群算法的PSO-Otsu 进行对比,采用峰值信噪比(PSNR),结构相似性(SSIM),适应度值及运行时间作为评价标准。为减小算法的随机性影响,试验的种群数量均设为30,最大迭代次数为30。

图2 基于IMFO-Otsu 分割效果图

PSNR是评价图像失真程度的指标,PSNR越大,失真越少。其定义如下:

式中:

MSE——原图像与分割后图像之间的均方误差;

——图像可能最大的像素。

SSIM是一种衡量两幅图片相似度的指标,SSIM越大,分割后的图像与原图相似程度越高。其定义如式(14)所示:

式中:

μx和μy——分别为原图像和分割图像平均灰度;

和——分别为两幅图像的方差;

——原图像和分割图像的协方;

c1=(0.01L)2;

c2=(0.03L)2,L为像素值范围。

表1、表2、表3 和表4 分别为分割时间、最佳适应度值、PSNR值和SSIM值的结果,表中的m均为阈值数量。

表1 运行时间 单位:s

表2 适应度值

表3 PSNR

表4 SSIM

从表1 可知,3 种算法中PSO-Otsu 算法运行时间最长,其它2 种运行时间相近,均在0.8 s 以内。表明IMFO-Otsu 的运行速度快。从表2 可知,在阈值数为2 的时候,三者的适应度值一样,在阈值数为3、4 的时候,IMFO-Otsu 的适应度值均为最大,表明IMFO 在多阈值Otsu 分割问题上具有良好的寻优性能。从表3 可知,阈值数为2 时,三者的PSNR值相等,当阈值数为3 和4 时 候,IMFO-Otsu 的PSNR值是最大的,即IMFO-Otsu 分割后的图像失真较小。从表4 可以得到,阈值数为2 时,三者的SSIM值相等,当阈值数为3 和4 时候,IMFO-Otsu的SSIM值在3 种算法中是最大的,即IMFO-Otsu分割后的图像与原图的结构更相似。

试验结果表明,IMFO-Otsu 算法与其它对比算法相比,寻优质量和稳定性更高,对果实深度图像的分割质量更好。

4 结语

颜色、光照等因素影响传统的果实图像阈值分割的效果,深度图像相对于传统的颜色图像不容易受颜色和光照变化的影响,适合使用阈值算法分割,本文提出一种基于IMFO-Otsu 算法的深度图像算法。由于传统的多阈值分割算法运行时间较长,通过对算法的阈值范围进行剪枝处理,引入改进飞蛾火焰算法优化算法寻找最佳阈值的过程,不仅具有传统多阈值算法的简单、有效等特点,而且计算效率高。试验表明,提出的算法寻优质量和稳定性高,对果实深度图像的分割快速且准确,有利于复杂环境的果实定位和识别。

猜你喜欢
飞蛾剪枝适应度
改进的自适应复制、交叉和突变遗传算法
人到晚年宜“剪枝”
可爱的你
Trolls World Tour魔发精灵2
基于YOLOv4-Tiny模型剪枝算法
飞蛾说
剪枝
勇敢的小飞蛾
基于空调导风板成型工艺的Kriging模型适应度研究
一种面向不平衡数据分类的组合剪枝方法