基于MobileNet-v3与CNN进行垃圾分类

2022-02-17 00:29钱嵩橙，董博文，樊继午，牛曌，蒋欣洳，方智

电脑知识与技术 2022年35期

钱嵩橙，董博文，樊继午，牛曌，蒋欣洳，方智

摘要：由于垃圾种类较多，颜色与形状差异大，选用人工分拣垃圾分类存在着非常大的困难，劳动力不足，工作量大，缺乏精准度。文章以MobileNet-V3small网络算法为基础，对垃圾图像进行准确识别和分类，达到速度快、准确度高，借助CNN模型进行光谱特征分析并分类。通过自动化分拣垃圾，实现垃圾分类，大大降低了人工投入量，提高垃圾分类效率。

关键词：垃圾；分类；MobileNet-V3；CNN

中图分类号：TP18 文献标识码：A

文章编号：1009-3044（2022）35-0014-02

伴随中国经济社会的发展，人们日常生活质量的提高，以及城镇化的迅速深化，生活垃圾生产量持续推高，全球已经面临垃圾危机[1]。在我国当前城市建设中，目前城建基本定型，其中垃圾中转站的建设也会对环境产生污染，所以垃圾分类的实施不容乐观。在我国，垃圾分类还存在类别不够细致、标准不够清晰，居民的相关分类知识缺乏。因此，自动化智能化的分拣设备被逐渐运用在垃圾分类工作中。

另外，由于城市生活废弃物中大多是废弃物和废物，因此人工分类也是废弃物分类中必不可少的关键环节，有利于筛选无法使用传统手段筛选的废弃物以及对废弃物实施质量管理。但是，进行人工垃圾分类将面临工程量大、工作劳动强度大、分类效率低下和工作环境较差的问题，因此，亟须以智能、信息化的分类方式代替传统分拣方式。本课题采用基于MobileNet-V3与CNN的深度学习分类模型。该模型将常见垃圾分成四种：其中包含可利用垃圾、危险垃圾、厨余废物和一些其他垃圾。该模型将Mobilenet-V3 small网络算法为基础（主要设计载体），并使用新搭建的CNN模块对数据集的光谱特征提取垃圾分析和计算，实现对垃圾目标的识别进行分类。

1 算法设计

在本次的实验中，模型的调用中通过搜集垃圾图片进行整合，每一组图片里有且只有一种垃圾的一个图片，照片的格式统一为jpg，标签格式为txt，在此过程中始终保持两者为一一对应的关系，由于采用的垃圾照片是随机的，光线、尺寸、大小、对比度等不尽相同，其内部数据也很复杂多乱，所以更加符合平时垃圾识别的标准，贴切我们的生活实际情况。在进一步整合之后，添加数据集标签，将垃圾种类分为数类，一个数字对应一个标签即一个类别。

根据实验要求，为了合理精准分类出实验所需垃圾图像。采用以MobileNet-V3 small网络算法为基础（此计算为本次实验的主要设计载体），而在此基础上优化该算法，采用CNN来进一步准确提高垃圾分类的效率。CNN 是通过模拟生物神经系统进行特殊设计的一种网络模型，在图像特征提取的过程中不需要人工思考具体特征，其局部链接和权重共享的特性在二维图像处理上有着明显优越性，可以直接作用于图像的像素位置，因此人们能够使用该网络对输入的垃圾像素进行获取特性，完成了对垃圾目标的鉴别和分类。其中，CNN一般包含的内容块有最大注入层、卷积层、最大池化层，全连接层和最大输出层等，而其要使用的基础模块则为最大卷积层（用来获取特征）和最大池化层（用来采样并不会破坏识别结构），对垃圾进行初步识别分类。

最后，将已实现精准分类的图像输入MobileNet-V3 small网络，并使用分组卷积减少了网络的计算工作量，同时MobileNet也将分组卷积技术应用至极致，即网络的分组数量和网络的channel数量相当，从而将网站的计算量减少至最小化，并且使用NetAdap技术可以在计算与参量均受限的条件下，实现对不同网络模块的查询，将搜索到的完整网络模块进一步输入platform-aware NAS中，从而进一步微调，在确保精度的前提下大大提高了效率，得到所需的分类结果。

2 算法模型

2.1 CNN模型

CNN是一个具有卷积构造的深度神经网络。CNN模型的使用能够在保证一定精度的前提下进行高效、迅速地处理二维图像[2]。CNN的出现，代替了常规全连接神经网络中的矩阵加减法运算，其优点就是在GPU的并行计算能力下，还能有很大的运算效能，最经典的CNN包括输入与输出层、卷积运算层、池化层，全连接层与输入输出层等，实现了提取图形特征功能的内核模块为卷积层和池化层[3]。

卷积层与池化层可以将被提取图像的特征进行从浅到深进行剖析，使原有的特征细节变得更加具体。在卷积运算的过程中，若在核维度为x的图像里，要使上层网络的m-1的输出值<E：＼2022知网文件＼35＼1xs202235＼Image＼image3.pdf>输入下层的m中，此过程的计算公式为[4]：

[Zmx=g（lmx⊗zm-1+amx）] （1）

其中：[Zmx]代表在上一層卷积运算中，核维度为x的特征图，[lmx]代表第m层维度为x的权向量，[amx]代表第m层且维度为x的偏置单元，运算符[⊗]代表本次卷积运算的操作，g（y）为非线性的激励函数。

在经过卷积层的运算后，需要提取的特征图像会在池化层中进行卷积特征降维，其目的在于简化运算，并对特征进一步具体化，从而提取出更加典型的特征。

在本次实验中共运用四层CNN模型，先将图片中的数据输入输入层中，其目的是保存图片本身的结构。紧接着通过卷积层滤波的处理进入卷积层中，使用卷积核进行特征提取和特征映射，同时利用卷积层处理公式进行特征处理，使每一个卷积层中的神经元是都对应一个权重。当输入进入池化层时，池化层中的“池化视野（filter）”会对输入的数据进行扫描、计算，进一步进行卷积特征降维。再CNN模型尾部的全连接层主要对输入的特征进行重新整合，避免特征信息的丢失。最后则由输出层输出初步的分类结果。

2.2 Mobilenet-v3 模型

在深度学习的过程中，使用轻量级网络的优势在于模型参数少、计算量小、测试速度更快，且适用于存储空间和功耗受限的场景。而缩小模型的参数量一直是科研人员的研究努力方向，MobileNet-v1、MobileNet-v2便是其中的佼佼者。而本实验中就使用了结合二者之间优点的生物识别网络MobileNet-v3。MobileNet-v3的独特创新的地方在于采用了互补搜索技术结构：即在同一网络结构中，它可以通过顺序的原则对每一层进行微小调整，而不是通过试图推断出不精确但整体的体系结构，同时调用NetAdapt技术和platform-aware NAS方法。其中，NetAdapt的普遍应用特点就是能够在计算时间和参量均受限的条件下完成对各个互联网模型的查找，使扩展层使用滤波器的数量达到最佳，并且瓶颈层输出的通道数量也为最佳输出，NAS主要是在查找并确定模块之后完成对互联网层的微调。在MobileNetV2模型中反转残余的误差结构和变量[5]，采取了1*1卷积算法构造，以便拓展到更高维的特征空间中，而其缺陷则是带来了巨大运算费用和延迟。同时，为在保持低维数约减特性图的前提下减少延迟，可以将平均池化前的层删除并采取1*1逐点卷积来完成特征图。特征生成层被删除后，先前作为瓶颈映射的层不再要求。MobileNet-v3是继承了MobileNet-v1与MobileNet-v2的优点且重在提高精度与检测速度方面。MobileNet-v3集现有MobileNet-v1与MobileNet-v2思想于一体，其中最为关键是使用分段线性函数模拟sigmoid函数激发变量swish进行数值逼近的h-swish触发变量，如公式（2）所示：

[h-swish[x]=x[ReLU6（x+3）]/6] （2）

随着模型参数的不断缩小，应用非线性激活函数的成本逐渐降低。Sigmoid不便于保持数据的准确性需要烦杂的计算过程，其中，采用新的激活函数h-swish，在确保精度的前提下，也具有诸多的优势，最重要的是实现了ReLU6的优化且能在量化模式下，减少误差、提高精度的同时，也能极大提升速度，这些修改超过了当前的空间搜索范围。

当然，使用h-swish还会带来一定部分的延迟，但是量化版的h-swish能够带来精度的提升是值得的，在具体实验中，还可以进一步进行软件优化，在实际计算时，可以减少对内存的访问开销。

3 结束语

传统的人工垃圾分类方法已经不足以处理人们生活中产生的垃圾，工作量大、工作强度高、分类效率低等问题亟待解决。基于MobileNet-V3和CNN的深度学习分类模型对垃圾图像分类进行研究，根据算法提取图像特征，采用以MobileNet-v3网络算法为基础，同时优化此算法，并用CNN和特征优选实现对垃圾目标的识别，提高垃圾分类的效率，并得出以下结论：

CNN可将大量参数降维成少量参数，将大数据量的图片降维成小数据。通过搭建CNN模型对数据进行光谱特征分析实现初步垃圾分类与制图。

MobileNet-V3具备互补搜索技术方式的优点，采用了NetAdapt和platform-aware NAS两个网络结构技术方法，可以在时间和参量的限制下查找网络模块，并微调网络层。

本文通过基于CNN算法和MobileNet-V3算法的结合，对垃圾数据集以及图像的处理进行实验，并利用扩充垃圾指数等新特性，以增强输入信号的时效性，并优化了基于CNN的垃圾分析和制圖的技术，是今后科研今后的主要工作方向。在将输入的特征维度扩展后，便可深入分析研究网络层次、参数对分类过程的作用，从而全面发掘CNN和MobileNet-V3的技术优点，以获取表现更优的模型。

参考文献：

[1] 吕君，翟晓颖.基于横向视角的垃圾回收处理体系的国际比较研究及启示[J].生态经济，2015，31（12）：102-106.

[2] Li E Z，Xia J S，Du P J，et al.Integrating multilayer features of convolutional neural networks for remote sensing scene classification[J].IEEE Transactions on Geoscience and Remote Sensing，2017，55（10）：5653-5665.

[3] Hinton G E，Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science，2006，313（5786）：504-507.

[4] 刘戈，姜小光，唐伯惠.特征优选与卷积神经网络在农作物精细分类中的应用研究[J].地球信息科学学报，2021，23（6）：1071-1081.

[5] Shi C P，Xia R Y，Wang L G.A novel multi-branch channel expansion network for garbage image classification[J].IEEE Access，8：154436-154452.

【通联编辑：唐一东】