人工智能深度学习的语音识别方法研究

2020-12-01 03:13周婧

卷宗 2020年24期

周婧

摘要：近年来，诸如机器人和智能家具之类的人工智能产品吸引了越来越多的关注。从而人们对人工智能越来越感兴趣。算法已经从人工智能，决策树发展到神经网络，机器学习再到深度学习。随着算法的进化，也促进了人工智能的应用，不得不说算法的演进也同样推动了人工智能的应用，核心算法的缺乏也将限制人工智能的发展和突破。

关键词：人工智能算法;图像处理;人工神经网络;进化算法;遗传算法

在第一次工业革命期间，机械的出现促进了当时社会的发展。随着计算机技术的不断发展，当今社会也为发展提供了革命性的机会。什么样的智能机器被人工智能用来帮助人们的智能劳动和完成智能动作？特别是在2016年，韩国围棋大师输给了计算机机器人，加深了大家对人工智能产品的了解。在全球高度关注的背景下，人工智能行业迎来了快速发展的新时代。诸如图像分析和行为识别之类的人工智能应用，例如视频分析和运动识别之类的数字图像处理技术无法分离。

1 人工智能的概述

人工智能或人工智能是指计算机模仿或使用的智能。像智能一样，人工智能的科学定义在学术界尚未统一。根据迈克尔和尼尔森对人工智能的定义，人工智能既是工程学科，也是理论研究学科。人工智能作为一门工程技术学科，其目的是为构建人工智能系统提出新技术，新方法和新理论，并在此基础上开发具有智能行为的计算机系统。例如，在医学和地质学领域，专家系统可以提供专家建议和意见，可以解决棋盘游戏和游戏系统，可以解决数学问题。作为理论研究的一个领域，人工智能的目的是解释智能行为。提出智能系统的概念和理论，为人工智能系统的建立提供了理论依据。也就是说，如果我们不能在计算机上解决问题，那就是人工智能。

2 人工智能深度学习的语音识别

2.1 语音识别理论

语音识别指的是通过语音来控制某项事务完成某项功能的行为。现代语音识别技术包括5个阶段，如图2-1所示：

在以上列出的5个语音识别过程，其中最重要的是预处理阶段和特征处理阶段，在预处理阶段需要对语音信号进行滤波以及采样处理，增强语音功能。在特征处理阶段需要提取出语音信号的特征点，识别人物信息。因为人的声音信息中包含着不同的频率特点，有些部分频率低，有些部分频率高，而频率高的部分容易受到噪声的干扰，这就需要对声音作滤波处理，选择合适的称函数对声音信号的干扰进行滤除。接下来将针对这两个主要部分分别进行阐述。

2.2 语音信号预处理

对语音信号进行预处理指的是通过滤波、采样、量化等手段对原始的语音信号进行加工处理，滤波时一般是采用合适的滤波器进行处理，一般情况下是采用带通滤波器，防止信号发生混叠干扰。采样过程是对原始信号进行离散处理，根据奈奎斯特采样定理，要让采样频率大于信号最大频率的两倍才能使最后采用的结果不失真。采样完成之后必须对语音信号进行模数转换，模数转换的目的是使得计算机能够方便处理。由于在家居环境中，主人说话的声音比较小，因此有时候会在软件设计时加入语音增强模块，防止因为噪声过大而掩盖了原始的真实语音信号。其次还需要对语音信号进行预加重处理，这是因为当语音信号的频率超过800赫兹时，信号会出现严重的衰减，为了使得信号不失真，就必须对语音信号进行预加重处理，使得信号在高频率部分变得平坦，便于后来的频谱分析。因为语音信号会因为声调声色等的不同而发生变化，因此是一个不平稳的信号，为了解决这个问题，还需要对语音信号进行加窗分帧，使信号尽量保持平稳的状态，方便进行频谱分析。最后，因为一段语音信号往往包含着有用信号和无用信号，为了提升工作效率，及时有效的检测到有用信号，这时还需要对语音信号进行端点检测，运用端点检测的手段，将一些无声信号或者有噪声的信号进行滤除，提升语音识别效率。

2.3 语音信号特征提取

语音信号的特征提取在语音识别技术中是一个关键点，通过对特征的提取能够有效的识别人物信息。对于大部分语音信号一般都处于低频带，但是仍旧有部分语音信号处于高频带，后者很容易受到噪声的干扰，因此需要采取一定的手段对高频信号进行滤除，增加语音信号的抗噪能力。常用的语音信号特征提取方法是梅尔频率倒谱系数分析法，本文也将采取这种方法对语音信号进行了特征提取。

3 人工智能算法发展趋向

近年来，中国在人工智能这一领域也有了很大的飞跃。我们将人工智能应用于工业发展，将其应用于社会生活的各个方面，并解决人们关心的安全，健康和环境问题。人工智能被称为智能的原因与一系列严格的逻辑算法是分不开的，并且该算法的支持是大量的数据训练。就像今天的人工智能算法 Alpha Dog的领导者一样，它也是数百万人类围棋专家的游戏数据的组合，并且还在继续学习和发展。当我们所有人都呼唤着人工智能的时代的到来，并且令我们感到高兴的是，我们在世界上拥有许多第一，我们的算法创新和发展的问题却越来越缺乏。

一方面，人工智能算法用于通过数据收集和机器学习对用户特征进行分析和分类，从而使用户成为不了解情况的观察，学习，分析和监控的对象。从积极的方面来说，人工智能算法收集用户数据应该是一种良性互动，既有利于供需双方。但是，在实际情况中，用户隐私保护与组织数据收集和使用之间的平衡是供给之间的积极文化，是形成供需之间良性互动的关键。首先，相关企业和技术层面可以在技术层面构建技术工程和标准化体系，而智能算法更客观、透明、杀伤力强和算法偏差。第二，有必要加强验证和监督，并对未经授权使用数据和其他行为的行为加重处罚。除了改进相关标准，规范和法律法规外，还必须防止使用人工智能算法标语而窃取用户数据的违反法律法规的行为。同时，必须确保收集，存储和使用个人信息的整个过程的安全性和控制性。另外，人工智能企业必须坚持底线思考，人工智能实际上是一种以人为本的算法模式，要始终以人为本，并始终优先考虑人的数据权只有在技术和算法上使用人，才能实现真正的人工智能。

4 结语

人工智能的研究一直在不断深入。对人工智能算法有详细而全面的理解。人们自然而然地受到启发，因此更适合人工智能算法。人们开发起来更方便，理解起来也更方便。生命得到了发展。因此，在今后的工作和生活中，我们应该积极向自然学习，从自然中汲取灵感，促进人类社会的进步。未来，人工智能的运行速度会更快，人工智能的发展所产生的人工智能的生产也会更先进、更发达，相信它会有所提高。

参考文献

[1]张国锋.人工智能下深度学习的语音识别方法分析[J].电子技术与软件工程，2020（11）：176-177.

[2]张良.人工智能下深度学习的语音识别方法分析[J].计算机产品与流通，2020（06）：121.

[3]崔娟，吴磊.基于人工智能深度学习的语音識别方法分析[J].信息记录材料，2019，20（09）：168-169.