候选框

  • 迭代框架优化的密集场景单棵树木检测
    预设的锚框产生候选框,然后进行特征提取,最后进入分类和回归的流程.Mask R-CNN[11]采用RoI Align代替RoI Pooling进行进一步优化,解决了RoI特征和回归位置的不匹配问题.王文豪等人[12]认为该类算法感受野较大,不适合遥感图像中目标偏小的情况.单阶段检测以YOLO系列[13]和SSD系列[14]为代表,跳过了候选框的生成步骤,直接回归得到类别概率和样本坐标.YOLO系列对比两阶段检测速度更快,但精度有所下降且泛化性弱.SSD系列

    小型微型计算机系统 2023年11期2023-11-10

  • 基于改进AI-YOLO v4算法的施工现场安全预警技术研究
    定框;B为预测候选框。很明显,如果A∩B=∅,那么交并比为0,无法进行网络训练[14]。结合前人的研究成果,对其进行改进,定义边界框回归损失函数(GIOU)为:(4)式中:C为包含A和B的最小框。很明显所定义的边界框回归损失函数没有考虑真实标定框和预测候选框中心的距离,对其进行修正,提出新的边界框回归损失函数,即:(5)式中:b、bgt分别为预测框与真实框的中心点;ρ(b,bgt)为预测框与真实框中心点欧氏距离;c为预测框与真实框相交矩形区域对角线长度;ω

    粘接 2023年10期2023-10-20

  • 图像级标记弱监督目标检测综述
    上生成大量目标候选框,然后对目标候选框提取特征并预测其类别,最后将预测结果与输入的图像类别标记计算损失并以此更新模型参数。所以,整个弱监督目标检测问题可理解为学习一个从图像包含的若干候选框到图像类别标记的映射关系。图1 弱监督目标检测训练和测试示意图Fig.1 Illustration of training and test phases in weakly-supervised object detection1.2 基础框架弱监督目标检测所需解决的问

    中国图象图形学报 2023年9期2023-09-26

  • 改进YOLOv4的安全帽佩戴检测方法
    数;最后采用多候选框学习策略减少漏检的概率。实验表明,改进后的方法在视频监控下满足安全帽佩戴检测的准确性和实时性。1 YOLOv4原理1.1 特征提取网络CSPDarkNet53YOLOv4使用新的特征提取网络CSPDarkNet53代替YOLOv3[5]中采用的darknet53特征提取网络。新的特征提取网络首先借鉴CSPNet[6](Cross Stage Partial Network)网络结构,将梯度变化整合到特征图中,增强卷积网络的学习能力,在保

    计算机应用与软件 2023年2期2023-03-15

  • 基于改进Faster R-CNN的航空发动机制件表面缺陷检测算法
    测精度,并根据候选框尺度截取对应层级的特征图,该模型在传统目标检测中检测精度有较大提升,但在航空部件的缺陷检测中效果并不好,仍有较大改进空间。在此次研究中,由于实际生产数据未脱敏,同时也为了更好地和其他模型进行比较,本文作者选取和实际制件数据较为接近的东北大学钢带表面缺陷公共数据集NEU-DET[7]作为研究对象,提出一个基于Faster R-CNN的改进模型(如图1所示)。该模型使用深度残差网络ResNet-50[8]作为卷积部分提取缺陷特征,使用含有内

    机床与液压 2022年23期2022-12-29

  • 面向设备开关图像识别的改进Faster R-CNN①
    强、特征融合和候选框的设计改进Faster R-CNN 模型.上述方法均是针对单一的开关类型,只能应用到相近的领域,限制了方法的普适性.相较于上述文献中所述的设备开关操作场景,本文研究的操作场景更加复杂,具体表现为设备控制所涉及的开关种类繁多、同类开关形状与大小也各异.从开关的类型及其状态划分,总共分为18 类开关,36 种开关状态; 从图像数据分析,图像中的开关密集分布,形状相似,数量较多.这些都给开关识别带来了很大的困难.针对这些挑战,本文提出了一种面

    计算机系统应用 2022年10期2022-11-07

  • 一种改进的多任务级联卷积神经网络人脸检测算法
    质就是筛选人脸候选框的过程,在这个过程中使用的筛选算法是NMS算法。该算法在目标检测领域被广泛应用,其主要目的是更好地排除冗余的检测框,保留精准度更高的回归窗口。在传统的NMS算法中,交并比(Intersection over Union, IOU)阈值的设置会直接影响到候选框的保留或者删除,若阈值过高则达不到过滤的作用,而阈值设置过低则会删除掉大量的候选框,难以实现分类平衡。因此,在实际应用的过程中找到一个合适的阈值是困难的。IOU是判断人脸框扰动程度的

    信阳师范学院学报(自然科学版) 2022年4期2022-11-01

  • 结合强化学习自适应候选框挑选的SAR目标检测方法
    N)产生的大量候选框进行挑选时,往往采用非极大值抑制(Non-Maximum Suppression,NMS)方法。在大场景SAR图像检测中,由于目标特征易受杂波影响,可鉴别性更差,并且单个目标占据图像比例更小,导致基于Faster R-CNN的目标检测方法在整张特征图上产生的候选框会包含大量杂波,而NMS方法无法在筛选候选框时有效去除杂波,导致目标检测产生大量虚警。近几年,在人工智能领域中,强化学习[14,15]得到了广泛关注。强化学习根据当前自身状态(

    雷达学报 2022年5期2022-11-01

  • 基于轻量化SSD算法的行人目标检测
    )减少筛选区域候选框以及选用自适应极大值抑制方法排除重叠检测框,在人群密度不一致的情况下,提高了检测的精度和速度。2)通过使用MobilenetV2网络代替传统的VGG网络进行特征提取,减少模型规模。2 相关工作2.1 SSD检测算法针对传统目标识别中的问题,基于深度学习的目标识别检测方法被提出,Ross Girshick等人于2014年提出R-CNN算法,这是首个将深度学习成功应用于目标识别检测上的算法,Ross Girshick等人又于2015年提出F

    计算机仿真 2022年9期2022-10-25

  • Fast Stereo-RCNN三维目标检测算法
    采样,生成三维候选框.第2步三维候选框投影生成二维检测框,Faster-RCNN[5]提取特征,依据语义、上下文、先验信息计算检测框的损失函数,精确提取三维检测框.Mono3D用复杂的先验信息提取三维检测框,存在损失函数误差累计问题,平均检测精度为2.38%.候选框密集采样与多个先验特征融合计算量大,检测速度为3秒/帧.Li等人在2019年提出了基于Faster-RCNN的Stereo-RCNN[7]三维目标检测算法.Stereo-RCNN将双目图像作为网

    小型微型计算机系统 2022年10期2022-10-15

  • 面向多目标跟踪系统的专用循环目标检测器
    ch 方法选取候选框并分别进行分类和位置回归。在此基础上,文献[2]和文献[3]分别实现了端到端的训练方式、ROI Pooling 技术和候选框推荐网络(RPN)代替Selective search 选取候选框等优化策略,进一步提高了网络的训练速度和检测速度。文献[4]通过级联几个检测网络达到不断优化预测结果的目的,与普通级联不同的是,它的几个检测网络是基于不同IOU 阈值确定的正负样本上训练得到的。对一阶段目标检测器,文献[5]首先在图像上预定义预测区域

    计算机工程与应用 2022年18期2022-09-21

  • 基于多阈值判断的单线激光雷达草丛识别方法
    的差值。图6 候选框示意图Fig.6 Candidate box schematic分析可知,草丛障碍物与其他障碍物的特征区别在于相邻点云之间的斜率变化。从图5中的点云连接线的斜率分布情况可以看出,从左到右,斜率不断在突变,因此相邻点云连接线的斜率差值比较大,对于其他连续体障碍物来说,斜率虽有变化,但是突变情况很少,因此对于这类障碍物的斜率差值变化就比较小。通过这一特征规律,斜率差值可以作为草丛障碍物和其他连续体障碍物的根本区别。相邻两红色连接线间的斜率差

    科学技术与工程 2022年20期2022-08-24

  • 结合Faster-RCNN和局部最大值法的森林单木信息提取
    络用来获得单木候选框,外包框提取网络基于单木候选框获取最终单木外包框。1.2.1 特征提取网络VGG-16 网络[14]被用来作为特征提取网络,该网络结构简洁,具有良好的迁移能力,适合在CHM 模型上进行提取特征。VGG-16 网络的输出为CHM 特征图,大小为CHM的1/16,CHM特征图是RPN的输入。传统方法中为减少点云噪声和CHM 中空洞对寻找树顶点的影响,会利用不同窗口大小的滤波器对CHM进行滤波,滤波器窗口大小的选择会对提取结果有巨大影响。窗口

    实验室研究与探索 2022年4期2022-08-06

  • 重定位非极大值抑制算法
    置和尺寸不同的候选框,这些候选框大部分聚集在可能包含感兴趣目标的区域,对这些候选框执行保留和抑制操作很有必要。这些候选框只包含坐标与类别置信度信息。其中,坐标并不能作为决定最优边界框的依据,而类别置信度作为一个类别概率标签,用于表示候选框中存在某个类别物体的概率,类别置信度越高,候选框中存在某个类别物体的可能性越大。最优边界框的选定会影响后续的候选框抑制操作,如果不选择类别置信度得分最高的候选框而是选择其它候选框作为最优边界框,会导致类别置信度得分最高的候

    光学精密工程 2022年13期2022-08-02

  • 基于改进MDNet 的视频目标跟踪算法①
    的高层特征, 候选框的选取部分借鉴了RCNN[12], 具有很高的跟踪准确率. 但一般来说, 跟踪模型会随着目标的变化而稳定变化, 当目标出现一些复杂情况时, 模型更新会使得模型的可靠性降低, 用这样的模型去进行后续的跟踪, 很难重新准确定位目标; 跟踪问题中, 每帧的正样本在空间上高度重叠,不能捕获丰富的外观变化, 并且正样本和负样本极度不平衡. 本文在MDNet 算法基础上提出了一种基于候选框置信度与坐标方差阈值判断相结合的模型更新方法, 使其正样本在

    计算机系统应用 2022年5期2022-06-27

  • 基于Two-Stage的目标检测算法综述
    oposal(候选框)+卷积神经网络+SVM(支持向量机)的组合模式出现在大众的视野中,这种Two-Stage目标检测模型以其优秀的准确率为目标检测的研究提供了一个新的思路。Two-Stage(两阶段)目标检测是将检测流程分为两部分,首先要生成候选区域,再判断候选区域中是否存在需要检测的物体,以及该物体的类别。目前最为流行的Two-Stage算法是R-CNN系列,其中包括R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN等,本文就以

    河北省科学院学报 2022年2期2022-05-18

  • 基于头部姿态识别的学习状态检测系统的实现
    处理,得到最优候选框。图1 SSD算法模型架构Fig.1 SSD algorithm model architectureSSD算法模型使用了6张大小不同的预测特征图来检测不同尺度的目标,分别来自conv4_3,conv7,conv8_2,conv9_2,conv10_2和conv11_2卷积层,前端网络提取的特征图尺寸大,细节性较好,适用于检测小物体。随着特征图尺寸的变小,细节性也随之变差,适用于检测大物体。除此之外,SSD网络设置了不同宽高比的预测候选

    沈阳师范大学学报(自然科学版) 2022年1期2022-05-05

  • 基于YOLOV4的港口作业人员检测系统研究
    和回归器,得出候选框类别和精确位置,最后利用非极大值抑制算法去除高度重叠的检测框,获得高质量的检测目标,从而实现目标的精确分类和定位,其工作过程如图2 所示。Fig.2 Working process of Faster R-CNN algorithm图2 Faster R-CNN 算法工作过程1.1.1 区域建议网络大部分目标算法生成的候选框都比较耗时,例如利用滑动窗口法和图像金字塔生成候选框,又如RCNN 算法中使用选择性搜索方法生成候选框。Faste

    软件导刊 2022年3期2022-03-25

  • 基于改进Faster RCNN 的目标检测算法∗
    择性搜索来提取候选框使得模型无法满足实时性检测的需求。于是任少卿等继续提出了Fast R-CNN 的改进版Faster R-CNN[15],使用区域生成网络RPN(Region Proposal Network)代替选择性搜索方法,更高效地生成候选区域。以上这些网络模型都需要先生成一系列的候选区域,再通过卷积神经网络进行分类。Joseph Redmon 等提出的YOLO(You Only Look Once)[16]网络模型取消了区域生成网络,直接回归目标

    计算机与数字工程 2022年12期2022-03-18

  • 联合YOLOv4检测的候选框选择和目标跟踪方法
    和跟踪结果作为候选框,通过分类选择器选择最优的候选结果。本文还加入了基于外观向量身份重识别(ReID)算法提取深度外观特征,用于将跟踪轨迹和选定候选对象关联。1 基本概念当前的目标跟踪算法主流是DBT,所以检测质量对跟踪的性能影响很大。将深度学习检测分为两类:基于分类的R-CNN系列目标检测算法和将检测转换为回归的检测算法。前者首先通过Selective Search等算法产生候选 区域,代表算 法有R-CNN、Faster R-CNN、Mask RCNN

    现代电子技术 2022年3期2022-02-16

  • 基于改进SSD算法对奶牛的个体识别
    特征图。此外,候选框的尺寸比例也需要人工根据经验设置。本文以SSD算法为基础,针对前文提到的两个缺点,对SSD算法进行改进,提出了基于浅层特征模块的改进SSD(shallow feature module SSD,SFM-SSD)算法。SFM-SSD在原始SSD算法的基础上,将主干卷积神经网络由VGG16换为MobileNetV2,利用MobileNetV2网络结构中的深度可分离卷积[14]来降低网络的运算量;再利用浅层特征模块(shallow featu

    计算机工程与应用 2022年2期2022-01-25

  • 面向自然场景文本检测的改进NMS算法
    算法会产生大量候选框,其中大部分候选框并不紧靠目标文本区域,并且该类候选框的存在将直接导致最终检测效果较差。检测效果较差主要由两种情况造成:(1)如图1(c)中紫色检测框所示,对长文本区域,受卷积核感受野等影响,选择单一检测框定位往往不够准确。(2)如图1(c)中红色检测框所示,对多个邻近文本区域,相邻检测框易产生混叠现象,对文本区域定位较差。在本文中,针对自然场景文本检测在后处理阶段产生的检测结果不紧靠文本区域的问题,提出了一种改进的NMS算法。图1 N

    计算机工程与应用 2022年1期2022-01-22

  • 基于优化候选区域的战场目标检测研究
    PN网络来提取候选框,该改进算法对车辆有较高的检测精度,但在物体模糊不清或者有遮挡发生时,会出现漏检的情况。张御宇等[5],针对小尺度目标提出改进的Faster R-CNN算法,该算法增强了高低卷积层间的信息传递,增加锚的尺寸和锚框选择策略,检测准确率有了明显的提高,但文中没有考虑改进算法的耗时问题。综上所述,本文提出基于优化候选区域的Faster R-CNN算法主要针对小型目标和存在遮挡影响的目标检测问题。1)在主网络conv3-3和conv5-3卷积层

    计算机仿真 2021年10期2021-11-19

  • 基于改进SSD算法的学生课堂行为状态识别
    对SSD算法的候选框设计及损失函数进行改进:一方面采用K-means聚类算法统计训练集真实框长宽比,重新设置SSD网络预测层候选框比例及分布,增大候选框与真实框的匹配度;另一方面融合焦点损失函数调节样本权重,解决训练时正负样本及难易分类样本不平衡问题。基于改进SSD算法对智慧教室中举手、睡觉、回答、写字、听讲5类学生课堂行为状态进行识别。1 原理与方法图1所示为基于改进的SSD算法的学生课堂行为状态识别的实现流程。由图可见,实现对学生课堂行为状态识别包括3

    计算机工程与设计 2021年10期2021-11-01

  • 融合神经网络与超像素的候选区域优化算法
    约2 000个候选框;在Faster RCNN中,使用候选区域网络(Region Proposals Network, RPN)生成大约800个候选框[5]。当前主流候选区域算法主要有Object-ness[6],BING[7]及Edge Boxes[8]。随着深度神经网络的不断发展,其已经在目标检测、图像哈希(Image Hashing,IH)、图像细分类、视觉描述与生成、视觉问答等方面有着广泛的应用[9]。特别地,文献[10]使用循环神经网络作为代理来

    国防科技大学学报 2021年4期2021-08-24

  • 改进Faster R-CNN的快件搬运机器人视觉定位策略
    rch算法生成候选框,但只在单层卷积层的feature map上生成候选框且RPN和最后的分类与回归层都各自用目标函数进行分类与回归,导致运算量还是偏大,精度仍不高。为改进上述问题, 在Faster-RCNN的网络模型基础上增加卷积层,在多层卷积层的feature map上生成候选框且用两个3×3卷积核分别进行卷积运算,直接进行分类和回归。该改进的Faster-RCNN检测到所设计导航图案中目标的区域后,再通过Harris角点检测算法提取目标区域的参考角点

    湖北工业大学学报 2021年4期2021-08-24

  • 基于YOLOv3改进的手势检测算法*
    (NMS)选取候选框不够准确的特点,引入了加权NMS[16],并根据候选框的位置关系去除冗余的候选框。在Egohands数据集[17]中实验表明,本文提出的算法相对于标准的YOLOv3算法在准确率和mAP上有较大的提升。1.1 Kmeans++重聚类原始的YOLOv3网络使用Kmeans在VOC、COCO等数据集上进行聚类,得到的聚类中心并不符合本文数据库中的手势分布,所以对数据集进行重新聚类有助于网络更快地收敛以及更准确的回归。Kmeans++相对于Km

    机电工程技术 2021年6期2021-07-25

  • 基于改进区域推荐网络的多尺度目标检测算法
    测器模块,加入候选框重叠度DOL,该公式的核心是分别计算出大目标与小目标候选框的重叠面积和单独一个小目标的候选框面积,若前者超过后者的θ倍,就把相应的小目标候选框删除,从而达到减少目标检测时间和提升算法对不同尺度目标的检测效果。3.1 区域生成网络RPNS和RPNB传统的Faster R-CNN 算法在目标检测时,首先将要进行目标检测的图片输入到网络中,通过卷积层的卷积操作,产生不同尺度的特征图(Feature map),特征图一部分直接送到分类器进行分类

    安庆师范大学学报(自然科学版) 2021年2期2021-06-28

  • 改进深度可分离卷积的SSD车型识别
    。由于该方法对候选框进行了预分类,虽然车型识别的精度有所提高,但是检测速度较慢。文献[9]融合循环神经网络和卷积神经网络嵌入二级框架,增强了内部特征信息的完整性,在对视频监控图像中车型识别的精确性上表现良好,但是其存在模型过大、运行时内存占用高的问题。SSD目标检测算法在检测精度和速度方面综合性能更好,但仍存在参数多导致模型臃肿的缺点[10]。结合上述研究,笔者提出使用改进的深度可分离卷积作为SSD算法基础网络,对特征提取过程进行简化,重新设计区域候选框

    重庆大学学报 2021年6期2021-06-24

  • 基于Soft-NMS的候选框去冗余加速器设计*
    网络输出的冗余候选框,找到最佳的目标位置,提高检测的准确率。文献[6]的研究表明NMS在基于RPN+Fast-R-CNN网络的目标检测应用计算任务中占22%左右计算延迟,因此对NMS的量化与加速也很值得研究。文献[7]中给出了最常用的Hard-NMS方法,将所有的候选框按得分值从高到低排序,选取得分值最高的候选框(本文称为靶候选框),删除所有与靶候选框的重叠率超出阈值(本文设为Nt)的候选框,对未删除的候选框选取得分值最高的继续此操作。Hard-NMS是一

    计算机工程与科学 2021年4期2021-05-11

  • 基于目标检测算法的安全帽佩戴智能识别
    像内的物体生成候选框,并对该候选框内的物体进行分类识别。基于目标检测算法识别图像时,首先将图像送入到训练好的模型中,然后对输入图像进行运算处理,生成候选框,同时对候选框内的物体进行分类,最后用NMS算法去除冗余的候选框。识别流程如图1所示。图1 目标检测流程常用的目标检测算法模型有基于区域的R系列模型和基于回归的模型。R系列模型的特点是:用端到端的卷积网络模型进行识别检测,保证一定的精度,但其实时性和检测速度有待提高。回归模型的特点是:将检测任务转换为回归

    水泥技术 2021年2期2021-04-20

  • 使用候选框进行全卷积网络修正的目标分割算法
    思路是首先依靠候选框网络,产生高置信度的候选框实现了对待检测目标的框定及分类,然后将框内的特征像素导入全卷积网络,进而得到分割掩码。这种方式能够实现较高的分割精度,但对于液晶面板场景中多种尺度共存、语义信息模糊的缺陷,其检测精度达不到要求,这是因为候选框内的特征图的像素分辨率相较于原图已经缩小了数十倍,在此之上进行反卷积操作导致最终分割粒度太粗,小目标的缺陷很容易被忽略;②直接将卷积神经网络最后一层卷积层的特征进行上采样,得到和原图相同分辨率的特征图,这就

    重庆邮电大学学报(自然科学版) 2021年1期2021-03-11

  • FRDet:一种基于候选框特征修正的多方向遥感目标快速检测方法
    重依赖高密度的候选框去覆盖目标所在的区域,尤其是在遥感场景中,通常采用的实现高覆盖率的方法是使用多种尺度和宽高比的候选框。例如,TextBoxes++[5]基于SSD[6]检测网络定义了7种特定的宽高比(包括1、2、3、5、1/2、1/3和1/5)的候选框。DMPNet[7]添加了几个旋转框,合计12个(6个常规和6个倾斜)用以完全覆盖任意方向的目标。DeepTextSpotter[8]跟着YOLOv2[9]利用训练集上的k均值聚类(k=14)框以自动找到

    计算机与现代化 2021年2期2021-02-27

  • 基于改进SSD 框架的遥感影像飞机目标检测方法*
    较高,但必须将候选框输入CNN 中再检测,导致检测速度较慢。第2 类方法的代表为YOLO[6](You Only Look Once)、单一目标多尺度检测框架[7](Single Shot MultiBox Detector,SSD)等,它的思想是利用深度卷积神经网络提取图像特征后,将特征图均匀分割成网格,在网格上使用候选框检测目标。由于减少了输入候选框到CNN 中再检测的环节,SSD 方法的检测速度相对较高,是飞机目标检测的首选框架,但存在的问题是对不同

    火力与指挥控制 2021年1期2021-02-03

  • 一种改进的轻量人头检测方法
    法分析设置初始候选框,提高候选框的精度。在测试集上对该方法进行测试,与改进前的方法对比,漏检率降低,检测精度和检测速度均有所提升。1 YOLOv3-tiny检测算法YOLOv3-tiny 是YOLOv3(You Only Look Once)的轻量级版本,作为目前最优秀的目标检测架构之一,采用回归的方式做到了真正的端到端检测,极大地提高了检测实时性,并且借鉴了FPN 的思想,在多个尺度的融合特征图上分别独立做检测,以轻量级、成本低的优点已被广泛运用于各大工

    计算机工程与应用 2021年1期2021-01-11

  • 基于深度学习的航空发动机安装位置识别
    ,每种尺度上的候选框数量为A,预测的类别是C,则最终每个特征尺度上预测得到的结果是一个S×S×A×(4+1+C)维度的张量.不同于SSD算法,YOLOv3没有将主干网络的中间特征图直接作为输出,而是将下一层的网络特征图进行上采样后与上一层特征图拼接.将3种尺度的特征图进行融合,丰富了网络结构,这也是YOLOv3检测效果要优于SSD算法的原因之一.3 算法改进与模型训练YOLOv3利用深度残差网络提取图像特征,并利用多尺度融合进行检测,可以较好实现目标检测任

    北京交通大学学报 2020年5期2020-11-17

  • 基于深度学习的多目标识别在移动智能体中的应用∗
    络的检测方法将候选框提取、特征提取、目标分类、目标定位统一于一个神经网络中。神经网络[9]直接从图像中提取候选区域,通过整幅图像特征来预测行人位置和概率。将行人检测问题转化为回归问题,真正实现端到端的检测。本文中的多目标识别主要是对移动智能体运动过程中采集的实时视频,首先进行候选框提取,判断其中是否包含障碍物,若有则给出目标位置。实际上,大部分的初始候选框中并不包含障碍物,如果对每个初始候选框都直接预测目标的概率,会大大增加网络学习的难度。在本文的识别方法

    计算机与数字工程 2020年5期2020-07-13

  • 基于Faster R-CNN的颜色导向火焰检测
    )来获取初始的候选框,以代替耗时的选 择 性 搜 索 算 法 。Faster R-CNN 在 COCO[15]与 PASCAL VOC[16]目标检测任务上取得了很好的效果,因此,本文选择Faster R-CNN作为文中方法的基础。Faster R-CNN的检测框基于锚生成,锚是在目标检测过程中生成的最初的一批候选框。依据人为确定的m种大小比例(Scale)与n种横纵比(Aspect Ratio),将这些比例与横纵比进行组合,可以在每个锚点处获得m×n种形

    计算机应用 2020年5期2020-06-07

  • 一种基于聚类特征的Faster R-CNN粮仓害虫检测方法
    -CNN模型的候选框提取网络更适用于VOC2007数据集中的20种分类任务,不符合粮仓害虫的形态学特征,用于检测粮仓害虫时会造成候选框冗余过大,因此本文使用聚类算法改进Faster R-CNN模型的区域提案网络,利用Faster R-CNN模型训练数据集来对粮仓害虫图像进行检测。本研究建立了粮仓害虫数据集SGI-6包括网络获取图像、显微镜采集图像和单反拍摄图像三种多目标尺度的数据集。实验室拍摄的图像以大米和小米为背景模拟粮仓的真实环境,并且对数据集做了翻转

    中国粮油学报 2020年4期2020-05-25

  • 基于Efficient高效网络的目标检测和识别
    在预测阶段生成候选框,然后对候选框做回归和非极大值抑制计算,筛选与真实框重合度最高的候选框。在Faster R-CNN中,VGG-16骨架网络输出h×w大小的特征图,对特征图上每个点设置3个尺寸和3种纵横比共9个候选框,特征图上每个点映射到原图中是一块区域[6],如图4所示。图4 特征图与输入图片的对应关系Faster R-CNN是对候选框中心坐标(x,y)和长宽(h,w)四个位置坐标相对于真实标记框位置的偏移量进行预测,这比直接预测框的位置坐标学习起来更

    沈阳理工大学学报 2020年6期2020-05-14

  • 结合动态概率定位模型的道路目标检测
    Net,通过对候选框生成网络RPN[14],改进概率定位模型以及目标识别网络进行联合训练,从而使得各个子任务之间相互协同,提高目标定位和检测的精度,有效解决了目标检测任务中定位信息少、模型不稳定和对小目标检测效果不理想等问题。1 HyperLocNet车辆检测网络目标检测包含目标定位和目标识别两个关键问题。针对现有回归定位和概率定位两种定位方法的局限,HyperLocNet 将定位和识别网络融合在同一个网络中共享信息,实现多任务的端到端学习,其模型结构如图

    江汉大学学报(自然科学版) 2020年2期2020-04-29

  • 基于卷积神经网络的SAR 舰船检测算法
    提案网络产生的候选框经过RoI 池化层(RoI 池化层用于不同尺寸的特征图变成固定长度的向量)输入到检测网络,检测网络用于对候选框的分类和定位。本文将引入Faster R-CNN 进行SAR 船舶目标检测,并与传统的CFAR 进行对比实验。1 神经网络技术原理1.1 人工神经网络受人类中枢神经系统的影响,人工神经网络由神经元构成的,如图1。单个神经元的作用是通过权重将输入信息进行连接并与阈值b(通常在深度学习中叫做偏置)进行比较,在激活函数的作用下得到神经

    现代计算机 2020年9期2020-04-25

  • 改进级联卷积神经网络的平面旋转人脸检测
    路由网络先估计候选框角度,再输入网络中识别,但由于没能精准估计角度及使用传统神经网络导致检测时间过长,精度不高。Cascade CNN[7]通过级联多个CNN逐步过滤非人脸样本,实验结果表明,该方法能够有效实现人脸检测;而MTCNN[8]将人脸分类、边框回归、人脸关键点定位3个任务合并,证明相关联的不同任务地实现多任务学习,可以互相提升性能;PCN[9]也通过级联网络检测了RIP人脸。本文由此在传统的级联CNN的基础上,嵌入一个32net的RIP分类网络,

    计算机工程与设计 2020年3期2020-04-24

  • 基于深度学习的重叠人脸检测
    得到大量的人脸候选框,并给这些人脸候选框一个初始得分。然后使用人脸肤色检测法二次检测来过滤掉无效的人脸候选框,并重新调整人脸候选框的得分,接着使用非极大值抑制法[9](non-maximum suppression,NMS)比较候选窗口之间的重叠度[9](intersection over union,IoU),删除重叠度大于阈值的候选窗口获得最终的人脸检测窗口。重叠人脸检测框流程如图1所示。1.1 人脸分类的学习人脸分类学习的目的是区分人脸和非人脸部分,

    计算机技术与发展 2020年2期2020-04-15

  • 融入帧间差分法的深度学习目标识别仿真研究
    过程,补充增强候选框分割图像,通过NMS算法对候选框进行筛选。仿真结果表明,该算法在识别目标种类的同时还能对目标在图像中的位置进行精确标定,并可判断目标是否处于运动状态,具有较高的识别率。目标检测与识别;创新性实验项目;帧间差分法;深度学习近年来,随着现代机器人技术的快速发展,机器工作的场景已不再局限于室内,在许多室外工作场所中,机器代替人工进行生产作业提高了工作效率、降低了生产成本。这些应用都需要可靠的目标检测识别算法[1]来帮助机器人完成任务。传统的识

    实验技术与管理 2019年12期2019-12-27

  • 空对地高度自适应目标智能检测算法*
    系列算法中区域候选框的尺寸设置对检测算法的影响进行了分析。在SSD系列算法中,区域候选框的尺寸设置通过预先设置的好的参数s1,s2和输入图像的尺寸共同决定,现有的SSD系列算法大都采用文献[13]中的参数设置s1=0.2,s2=0.9,而后依据式(1)和(2)分别计算出6个不同尺度特征图最大(max_size)和最小(min_size)区域候选框尺寸。以300×300大小的输入图像(这里定义尺寸为image_size)为例,依据式(1)和(2)可以计算得到

    现代防御技术 2019年6期2019-12-20

  • 基于FAST R-CNN行人检测识别的研究与改进
    得图像中约2k候选框。利用卷积收集提取图片特点,获得feature map后按照以前RoI框选择出对应的区域等三个进程。1.1 选择性搜索通常对一张图像进行检测会采用不同的滑窗进行穷举的方式搜索,这种方法计算量过大且速度慢,于是通过比较一张图片不同区域颜色、纹理等方面将相识度较大的部分划分为同一个区域,这便是选择性搜索的基本思想。(1)生成了一个区域。计算总相似度:(3)找相似度最高的区域,并将其合并。(4)从中移除与和有关的相识度。(5)计算新集与所有子

    网络安全技术与应用 2019年7期2019-07-10

  • 人脸检测算法的优化
    算法性能。1 候选框生成算法候选框是人脸检测网络的基础。检测任务与分类任务并不相同,检测任务需首先对单个样本进行分类并生成候选框,其后对所生成候选框的区域进行分类,而分类任务是直接对单个样本进行分类。2 Faster RCNN人脸检测网络框架考虑到区域候选框是检测网络最大的瓶颈,该系统中Faster RCNN使用RPN(region proposal network)来有效解决计算候选框耗时的问题。Faster RCNN[5]采用RPN生成候选框,RPN的

    计算机技术与发展 2019年6期2019-06-14

  • 基于单帧标注的弱监督动作定位
    作执行者的矩形候选框,然后连接候选框形成候选动作轨迹,利用人工标注的矩形框去除大量不满足条件的候选轨迹,同时对保留下来的候选轨迹打分,保留得分最高的提名作为训练视频中动作的位置,然后训练一个SVM分类器。测试阶段,先在测试视频的每一帧上给出矩形候选框,然后连接候选框形成候选动作轨迹,利用训练好的SVM分类器对候选轨迹打分,确定哪个候选轨迹是视频中动作的位置。2 提取候选框由于滑动窗口方法给出的矩形框数量过多,而且不适用于尺度变化较大的目标,这里利用目标检测

    电子技术与软件工程 2019年4期2019-04-26

  • 遗漏负样本挖掘的行人检测方法∗
    提出合理的区域候选框,然后在第二阶段进行细化。另一类方法旨在消除候选区域阶段,直接训练一个端到端的分类器[4]。第二种方法通常更容易训练,计算效率更高,但第一类方法在性能上往往更有利。Faster R-CNN[5]框架属于第一类方法。它主要由两个模块组成:RPN和Fast R-CNN[6]。其中,RPN是用于提取候选框的模块,它改善了过去提取候选框的方法,大幅度减少候选框的数量、提高了整体物体检测的准确性。Fast R-CNN检测并识别RPN提出的候选框

    计算机与数字工程 2019年2期2019-02-27

  • 基于改进型SSD算法的目标车辆检测研究
    2 SSD区域候选框SSD采用多尺度特征图方法,在不同尺度特征图上都会设置不同大小和宽高比的区域选框,区域候选框定义如下计算。式中:m为特征层数;smin=0.2为最低特征层尺度;smax=0.9为最高特征层尺度;中间特征层尺度均匀分布。区域候选框具有不同的宽高比 ar∈{1,2,3,。区域候选框的宽、高分别为同时对于宽高比为1的区域候选框增加一个尺度每个区域候选框的中心坐标为)。其中 w为第 k个fk特征图的宽,hfk为第 k个特征图的高,i∈[0,wf

    重庆理工大学学报(自然科学) 2019年1期2019-02-22

  • 利用深度学习进行目标检测
    个分支负责预测候选框,直接在特征图后接一个卷积层预测候选框即可,另外一个分支负责预测候选框属于哪一个类别,当然,每一层预测的候选框以及所属类别的个数都是固定的。因此,我们可以获得6组候选框,接下来只需要将6组候选框合并到一起并且计算损失函数,然后更新网络的参数即可。下面介绍网络的详细结构。对于上面的每一层中的一个特征图来说,会产生固定个数的候选框。比如说特征图的大小是m×n,并且每个位置产生的候选框的个数是k个,那么对于一个c类物体的检测任务来说,会产生(

    中国设备工程 2018年23期2018-12-18

  • 基于Faster R-CNN的榆紫叶甲虫识别方法研究
    的,生成的初始候选框为固定的三种尺寸、三种比例,用其识别榆紫叶甲虫时,初始候选框的长宽比不符合榆紫叶甲虫的长宽比形态学特征,容易造成候选框冗余过大。加之榆紫叶甲虫的甲壳反光,在框定榆紫叶甲虫目标时会出现误差,在榆紫叶甲虫和榆树叶片豁口或孔洞相邻时或者两只榆紫叶甲相邻时框定误差尤其严重。因此,本文使用Faster R-CNN模型识别榆紫叶甲虫时,对初始候选框生成网络进行改进,使其生成的初始候选框更加贴合榆紫叶甲虫本身的特征,减少周围复杂环境造成的影响,以提高

    计算机工程与应用 2018年23期2018-12-04

  • 迁移学习结合难分样本挖掘的机场目标检测
    识别能力,机场候选框的获取还是基于边缘或区域分割的手工方法,因此,传统方法的局限性依旧存在.2014年,文献[6]提出区域卷积神经网络(Region-based Convolutional Neural Networks, R-CNN)框架,使得目标检测取得巨大突破,开启了基于深度学习的目标检测热潮.为进一步提升R-CNN的准确率和速度,文献[7]提出了R-CNN的继承者Fast R-CNN.Faster R-CNN[8]采用区域建议网络(Region P

    西安电子科技大学学报 2018年5期2018-10-11

  • 自动驾驶场景下小且密集的交通标志检测
    类:一类是基于候选框提取的目标检测算法,另一类是基于回归方法的目标检测算法。下面介绍这两大类目标检测算法的代表性检测框架。R-CNN是Ross Girshick等[9]最早提出的用卷积神经网络做目标检测的框架,它是基于候选框提取的目标检测算法。首先通过selective search算法[10]提取候选框,然后用这些候选框微调卷积神经网络训练SVM(支持向量机)分类器,进行边框回归等。R-CNN在VOC2012数据集上mAP[11]达到了53.3%,和之前

    智能系统学报 2018年3期2018-07-20

  • 基于聚合通道特征及卷积神经网络的行人检测
    ,提取图像出的候选框。这个阶段提取候选框的算法有滑动窗口策略、Selective Search[2]等,其中基于滑动窗口策略具有代表性的工作是Felzenszwalb P F等[3]提出的形变部位模型(deformable part model,DPM),这个方法能一定程度上克服部分遮挡的影响。其次,提取候选框集的描述特征过程。Piotr Dollár等提出积分通道特征(integral channel features,ICF),利用积分图技术对图像的各

    计算机工程与设计 2018年7期2018-07-19

  • 基于YOLO网络的行人检测方法
    ,聚类选取初始候选框,重组特征图,扩展横向候选框数量,构建基于YOLO网络的行人检测器YOLO-P。1 检测方法基于YOLO网络的检测方法将候选框提取、特征提取、目标分类、目标定位统一于一个神经网络中。神经网络直接从图像中提取候选区域,通过整幅图像特征来预测行人位置和概率。将行人检测问题转化为回归问题,真正实现端到端(end to end)的检测。行人检测就是对输入的图像或视频,进行候选框提取,判断其中是否包含行人,若有给出其位置。而事实上,大部分的候选框

    计算机工程 2018年5期2018-05-30

  • 目标检测算法R-CNN在现实场景数字检测任务中的应用
    像处理技术完成候选框提取的思路,可极大提高目标检测效率,使其能够完成实时检测任务。【关键词】实时目标检测 深度学习1引言Ross Girshick在2014年于CVPR发表论文《Rich feature hierarchies for Accurate ObjectDetection and Segmentation》,第一次将在图像分类任务中表现优异的卷积神经网络应用于目标检测当中,该检测算法即R-CNN(Regionswith Convolutiona

    电子技术与软件工程 2018年24期2018-05-10

  • 一种针对特定目标的提议算法
    ,得到一系列的候选框,然后利用提取的特征和分类器对候选框进行处理,从而检测出要求的目标[2]。对于这种检测算法,如果要求检测结果的准确性高,就需要对图像的遍历过程更加精细,但是这样会引起计算量的增加,影响检测的速度;如果想加快检测速度,那么对图像的遍历过程就会相对粗糙,造成检测结果的准确性降低[3]。如何更加快速准确地检测出目标也已经成为当今学者们普遍关注和研究的一个重要课题[4]。近些年来,为了更好地调节检测的准确性和快速性之间的矛盾,人们对得到的候选框

    火力与指挥控制 2018年3期2018-04-19

  • 基于卷积神经网络的实时行人检测方法①
    图上,计算不同候选框的形状偏移量和该区域为行人的概率得分,通过非极大值抑制方法输出行人检测结果.图1 基于卷积神经网络的实时行人检测模型GoogleNet[14],VGG等作为当前流行的深度卷积神经网络模型,能够很好的提取图片特征.但这两种模型过于庞大,很难训练.文献[11]提出的特征提取模型作为GoolgeNet的精简版,取得类似GoogleNet的训练成绩,故采用其方法实现模型前端的特征提取.考虑到行人检测的特殊性,本文设计了如图2所示的多候选框行人检

    计算机系统应用 2017年9期2017-09-15