人工神经网络在数据挖掘中的应用研究

2019-02-07 05:37梁春华

无线互联科技 2019年22期

梁春华

摘要：文章从数据挖掘基本概念和相关功能特点入手，阐述了人工神经网络技术的相关概念和应用优势。同时，重点以BP网络模型为例，从工作原理、实现算法、工作流程等方面，深入分析人工神经网络在数据挖掘中的应用要点。

关键词：人工神经网络;数据挖掘;应用

近年来，全球信息化技术发展进入到了新阶段，数据挖掘技术开始进入到广大普通企业当中，帮助企业执行数据库分析和数据应用工作。数据挖掘旨在从大量数据中提取有价值的信息，对“互联网+”时代各企业分析市场、制定策略有关键指导意义。近年业界提出的人工神经网络理论吸引了大量从业者关注，充分结合了数据库技术和人工智能，具备很好的应用前景。

1 数据挖掘的基本概念与功能

1.1 概念

目前，各行业、各企业单位会根据经营情况建立数据资源库。随着市场发展和经营方式多元化，数据库中收集和储存的数据信息越来越多，企业面临着在庞大数据库中难以快速、精准找到有应用价值信息的难题。随着时代的发展，人们对相关数据的种类和呈现形式有更多要求，例如，企业市场部人员不再是仅关注销售数据，还会对客户购买频率、时间、评价反馈等细节性信息有很高需求。显然，如今传统结构化、查询语言已经不能满足日渐增长且多样化的信息数据需求，急需更先进的数据挖掘技术提供支持。数据挖掘的关键在于从庞大且复杂的数据库中找到有隐性价值的数据信息，经过提取处理后给用户带来更多实用价值[1]。

1.2 功能

簡单来讲，数据库挖掘主要功能有两种：描述现在和预测未来。只有从现有数据中发现规律和价值，才能成功提取、分析出为未来发展工作提供依据、制定策略的信息。数据挖掘重点在于从数据库找到相关数据，形成描述数据集合、预测发展趋势的数据模型，其中，用到的分类法重点在于对数据离散类别进行描述，预测法则是基于数据规律对其连续进行预测，可见预测是数据挖掘技术中的关键功能。

2 人工神经网络的基本理论

顾名思义，人工神经网络的参照物是生物神经系统，相关技术专家依照生物神经网络架构、工作方式和支配管理机制，在信息数据领域进行人工模拟。人工神经网络即通过建立大量处理单元，组成非线性自适应动态系统，该系统可以对大量数据进行统一或精细化管理，同时具有抽象分析、联想记忆、自适应能力。与生物神经网络中的神经元相似的是，人工神经网络也拥有自学能力，加上该技术人工介入和干预很少，是信息技术领域中智能化的代表。在人工神经网络体系中，各系统会对数据进行分析，发掘其中规律，神经网络在发掘和学习过程中，基于相关逻辑规则自动调节神经元输入、输出机制，呈现某种数据信息规律。

3 基于人工神经网络数据的数据挖掘算法

3.1 数据挖掘中典型的神经网络模型

目前，在全球范围内数据挖掘领域中比较常见的人工神经网络模型包括反向传播（Back Propagation，BP）网络、循环BP网络、自组织映射（Self-Organizing Maps，SOM）网络、径向基函数（Radical Basis Function，RBF）网络等，这些模型是组成人工神经网络的框架和基础，是实现数据挖掘与智能分析应用的关键。

3.1.1 BP网络模型

BP网络模型主要构成要素包括输入层、输出层及中间层，整体构架属于多层向前的拓扑形状，可以应对大量输入参数形成的复杂局面，并通过一定机制实现简化。这种模型在知识发现（Knowledge Discovery in Database，KDD）任务中有大量应用，在非线性映射问题研究等方面也有较高的应用价值。例如，基于BP网络模型可以实现多类型数据压缩、图像处理、手写文字识别分析等。

3.1.2 RBF网络模型

在RBF人工神经网络模型中，主要是将非线性传输函数应用于隐单元中，如果隐层单元的矢量处于确定状态，网络则仅需修正引出线能至输出层的单层权值。显然，这种结构模型在收敛速度效率方面具备更高水平。作为前馈网络的典型，RBF网络在很多领域都有极高的应用价值[2]。

3.1.3 Hopfield网络模型

Hopfield网络模型理论架构于1984年被提出，主要架构基础是S型神经元，架构机制为单层全互联反馈动力学系统，具备连续性和精确定位特点，可以对系统状态空间的平衡点进行快速收敛。这种人工神经网络模型主要适用于数据库优化计算，广泛应用于系统优化领域。

在这些网络模型当中，如果KDD目标在于预测时间序列，那么循环BP网络本身的完善性和运行机制具备更高的应用价值;如果对人工神经网络模型自我学习能力有更高要求，RBF在训练数据模拟和执行方面的优势则比较突出。

3.2 人工神经网络的实现算法

目前，BP神经网络模型在我国多个地区和产业、领域中有大量应用，虽然具备稳定性强、覆盖面广等优势，但同时也存在动态信息处理能力缺失、泛化能力差等缺点，下面本文就分析BP神经网络模型在数据挖掘中的应用要点。

3.2.1 工作原理

如图1所示，BP神经网络模型主要以误差反向传播算法为基础，该算法在多层向前神经网络当中应用非常广泛。该算法多个层次神经元互为连接关系，层次内部神经元则相互独立。在该算法当中，网络计算起始点为输出层，再由此向前逐渐传递，整个过程中信息没有反馈操作，需要以专业方法对网络进行训练，一般是基于一套由输入数据及理想数据构成的训练样本来实现网络训练。在训练过程中，如果输入样本与理想样本保持一致，则证明数据算法运行良好;反之，则需要对权值进行调整优化，直到其保持一致。

3.2.2 工作流程

在BP神经网络模型中，正常工作开展一般由工作阶段和学习阶段组成。工作阶段中各个网络节点连接权值是保持不变的，网络计算依然自输入层向每一个节点输出值开展计算，确保每一个节点都计算完毕。学习阶段则是在模型中各节点输出保持固定的情况下，由输出层反向推算各节点连接权值的修改量，逐步优化各个连接权值。在该人工神经网络模型中，两个阶段相辅相成，前者旨在计算分析网络输出量和相关数值是否达到期望值，如果没有，则由后者对其进行修正，尽量减小误差。BP神经网络就是通过反复计算和修正，确保网络架构趋于稳定、输出层的输出值达到期望标准[3]。

BP神经网络模型中，输入层的各个节点主要工作是规格化处理相关样本数据，而一般在第二层至最后一层之间才是进行网络计算和处理分析的重要领域。一般情况下，大多数数据库中都会将各个处理节点中的阈值作为单个连接权值，目的主要是简化计算，便于人工查询和分析模型运行状态。一般人们会通过连接处理节点和虚节点，来达到简化计算的目的。在BP人工神经网络模型的计算阶段，计算过程和处理过程描述基本上能够保持一致，而在网络学习过程中，重点在于精确发现输出层实际输出和期望标准值存在的误差，再基于输出层来调整节点连接权值。显然，该模型的运行机制可以对数据计算和网络计算状态进行多次反复验证和审查，对输出数据准确性以及是否达标进行实时自我评估，让整个网络数据模型具备自我评估、自我调整、优化输出的能力，进而全面提升数据信息输出效率和质量。

4 结语

综上所述，当前以及未来的社会是一个基于互联网和信息化的大数据时代，数据的分析处理成为各个行业关注的重点。数据挖掘在数据爆炸的时代当中，是人们从纷繁复杂的庞大数据库中找到潜在规律、發掘有价值的信息、预估市场未来动向的重要手段。在传统数据挖掘手段已经不适用于当代及未来社会的情况下，具备更高自主性、全面性、精细化和智能化优势的人工神经网络模型被提出。从我国当前相关领域技术发展现状来看，需要进一步对BP，RBF，Hopfield，SOM等多种全球知名人工神经网络模型及技术进行分析研究，通过实践确定更适合我国各产业实际情况和应用前景的技术类型，全面提升我国各产业数据分析和价值挖掘能力，进而推动相关产业全方位、可持续发展。

[参考文献]

[1]温沁雪，李奕芯，杨硕，等.基于数据挖掘和人工神经网络的厌氧产气模型构建[J].中国给水排水，2019（1）：77-81.

[2]邱明月，王新猛，唐松泽.基于人工神经网络模型的抢劫犯罪微观研究[J].信息技术与信息化，2018（10）：140-143.

[3]张斌.数据挖掘在厦门第二西通道双连拱隧道围岩变形中的应用研究[J].施工技术，2019（13）：90-93.