深度学习分类网络研究及其在计算机视觉中的应用

2022-07-16 08:18马骥
科学与财富 2022年4期
关键词:视觉深度学习计算机

摘  要:在通用人工智能中计算机视觉具有重要作用,主要表现在自动驾驶,智慧医疗和交通等方面。相比于传统机器学习算法在计算机视觉中的应用效果,近年所研究的新型深度学习方法在计算机视觉研究领域取得新发展。本文主要是探讨深度学习分类网络研究及其在计算机视觉中的应用,希望能够对相关人员起到参考性价值。

关键词:深度学习;人工智能;计算机;视觉

计算机视觉简言之即是依靠电子设备成像来代替生物视觉系统,随后依靠提前写好的程序对获取的图像信息实施处理。该技术的短期应用目的在于完成相对简单的智能视觉工作,而深度学习技术在计算机视觉领域的应用,在很大程度上丰富了其功能,提高了识别效率,让其能够在更多行业发挥出自身价值。

1 深度学习分类网络分析

1.1 LeNet

该分类网络是由卷积神经网络发明人员所提出的第一个分类网络,主要可以识别支票上的手写数字、整个网络主要包含七层结构,下采样为池化层,由于池化层不具备权值参数,所以无法将其确定为计算层,这样就导致网络具有五层计算层。从某种程度上看,该网络存在数个隐层。

LeNet最后一层主要采用欧式径向基函数单元,可以对前一层激活函数的饱和问题进行限制,减少梯度消失效应。所以从某种程度上看,LeNet是首个被成功训练的深层神经网络,然而由于此种方法代表性比较弱,因此多数学者不认可。

1.2 AleNet

该深度学习分类网络主要包含激活函数,局部响应归一化和抑制过拟合、其中研究人员己经发现激活函数的应用优势,在使用激活函数的同时能够避免梯度消失,全面提升训练速度、局部响应归一化特性不需要处理海量数据,以免其进入饱和区、抑制过拟合主要是对训练数据进行扩增,平移和反转线有训练图像,并且对训练数据集进行扩充、对于后续连接中神经元连接过多以及加剧过拟合问题,可以利用随机丢弃方式减少过拟合。

1.3 GoogLeNet

GoogLeNet设计思路是将所有连接转化为稀疏结构,此处所提及的稀疏结构是基于Hebbin原理、该种深度学习分类网络主要是使用庞大且稀疏的网络表达数据集的分布情况,因此建立稀疏网络的最佳方式在于将较高关联性的节点进行聚类,之后将所有聚类节点连接在一起、按照此种原理展开设计就会产生GoogLeNet基础结构。

在图像中索选取的区域具备较高相关性的是区域周围的像素,卷积操作可以有效连接像素。对于不同卷积核来说,其数对应的空间位置不同通道信息具有相关性、卷积核尺寸越小.不同通道信息相关性越高.能够代表不同的感受视野。

2 深度学习在计算机视觉中的应用

2.1 深度学习在图像分类中的应用

现阶段比较常见的用于图像分类的数据集是 Image Net,它包含的素材十分丰富,大约有一千五百万张高分辨率图像,所有的图像又被分为两万多个类别。Image Net 历年举行图像分类比赛,在比赛中图像分类的算法和技术也得到逐渐的进步和提高,提高图像分类的正确率、准确率。

具体的过程是卷积核中任一元素均可以成为权值参数,乘以输入图像相应区域的像素值,再将得到的每一个乘积相加,利用激活函数最终得到输出的像素。卷积神经网络的形式上通常表现为多通道特征图的三阶张量卷积操作,实际上却是多个输入的信号加权求和再作用于一个神经元,最后实现激活输出数据的过程。

第 l 层的第 个特征图矩阵 可能由前一层若干个特征图卷积加权得到,一般可以表示为

其中 , 为 神 经 元 激 活 函 数 ; 代 表 输 入 特 征 图 的组合, 表示卷积运算, 为卷积核矩阵, 偏置矩阵。经常用到的神经元激活函数有 sigmoid 函数、tanh 函数、ReLU函数等。

2.2 深度学习在无人驾驶领域的应用

对于无人驾驶领域来说,选择激光或雷达这类传感器的成本更高,基于深度学习的计算机视觉技术也能够提供新的解决方案。依靠摄像机对视频画面进行采集,对获取到的图像实施分析,提供类似于前车碰撞预警等功能。

在这一过程中,计算机视觉技术可以实现对目标的检测识别、对目标车辆的跟踪分析、对车道线是否偏离进行检测等。基于深度学习技术的检测识别表现出更加强大的优势,现阶段深度学习芯片日益增多,对于无人驾驶技术的发展也带来了更加有力的支持。

2.3 深度学习在面部识别中的应用

随着网络技术的不断发展,面部识别被广泛运用到各个领域,企业、小区在安装面部识别系统后,可通过人员面部的识别以此打开大门,在一定程度上确保安全;在医院、学校、超市等安装摄像监视系统对过往的人群进行监视,为公安破案工作提高了效率;通过人脸自动支付识别系统,可在安装有人脸识别自动支付的银行、商场等为人们带来便捷的支付功能。

由于生理学与心理学特征与人们脸部存在变化性具有密切的联系,所以,将人类视觉的特点与弹性建模进行相互的结合是十分有必要的,这不仅能为建立模型带来良好的效果,而且还能在建立模型中突破刚体特性的特征带来一定的效果。

3 深度学习在计算机视觉领域未来发展趋势

深度学习在计算机视觉领域的应用研究已经越来越广泛和成熟,并在更多方面取得实际的价值,其中最主要的是体现在商用方面,比如人脸识别技术,不僅可以用于手机等智能设备,也能用于门锁等安全设置。

在之后的发展中,其还将被应用到工业、军事、航空航天等高精密度的领域内,当然,只要在进步过程中成本得以下降,它也更能造福百姓的日常生活,促进生活水平的提高。

结 语

深度学习技术在计算机视觉领域中应用的终极目标是为了让机器可以和人类一样,观察并读懂世界。近年来AI技术的不断发展与普及应用,深度学习技术必然会在计算机视觉领域中发挥出更大的价值,为现代人的生活和工作带来更多便利。

参考文献

[1]龚方生. 基于深度学习的计算机网络数据包路由策略[J]. 网络安全技术与应用, 2021,12(5):3-5.

[2]陈旭, 孟朝晖. 基于深度学习的目标视频跟踪算法综述[J]. 计算机系统应用, 2019,45(6):14-16.

[3]仇秋飞, 周武源, 雷良育,等. 深度学习在机器人领域的应用进展[J]. 计算机技术与发展, 2021, 31(11):8-10.

作者简介:马骥、男、2001.02.08、安徽省滁州市琅琊区、本科、西北工业大学、无,深度学习、计算机视觉。

猜你喜欢
视觉深度学习计算机
计算机操作系统
信息系统审计中计算机审计的应用
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于深度卷积网络的人脸年龄分析算法与实现
亨利摩尔雕塑的外在视觉意义
Fresnel衍射的计算机模拟演示