关于数据挖掘技术在软件工程中的应用分析

2021-01-29 03:06谷安楠北京交通大学海滨学院
数码世界 2020年12期
关键词:结构化漏洞数据挖掘

谷安楠 北京交通大学海滨学院

引言

目前,我国互联网普及率已经超过了60%,并且互联网用户已经超过了8亿,这充分说明了我国互联网用户体量的庞大,在此背景下,有力的推动了软件行业的发展。为了进一步推动软件行业的发展,软件开法过程中对数据挖掘技术的应用越来越广泛,不仅提升了自身的竞争力,而且也能更好的满足用户的需求。

1 数据挖掘技术分析

1.1 数据挖掘的概念分析

数据挖掘技术伴随着计算机技术而产生,计算机科技的发展,产生了海量的数据信息,而这些信息有的属于显性信息,有的属于隐性信息。应用数据挖掘技术,便是对海量信息背后的价值进行充分挖掘和利用,使其更好的为人们服务。数据挖掘技术的实现,通常情况下都需要结合在线分析学、统计学、情报学等方面技术,这样才能更好的实现数据挖掘。

1.2 数据挖掘技术的流程分析

数据挖掘技术流程是指从数据清理到知识的整个过程,并且在此过程中的每一个流程都十分重要。第一,信息收集流程,在数据挖掘过程中,信息收集是第一阶段内容,信息收集的作用在于可以从数据中分析出需要的特征信息,并将需要的特征信息进行收集。信息收集完成后需要进行数据存入。第二,数据集成流程,通过信息收集流程,实现了对数据的收集和储存,在此基础上,对数据进行集成分类。数据集成分类的作用在于可以满足对数据的不同需求,能够为数据的共享奠定基础。第三,数据规约流程,数据挖掘通常都会面对数量庞大的数据信息,再加之数据挖掘的算法十分复杂,会消耗大量时间,因此,数据挖掘的压力相对较大。而通过数据规约流程,不仅可以减少数据处理的时间,而且还可以有效保证数据的完整性,避免因数据挖掘而影响数据的质量。第四,数据清理流程,通过这一流程,能够提升数据的有效性,虽然以上几个环节可以对数据信息进行处理,但是仍然还会存在无效数据以及数据不完整的情况,而数据清理便是将这些无效数据以及不完整数据进行清理,进而保障整个数据库的质量。与此同时,在数据清理的过程中,还可以对那些完整以及准确的信息进行分类与储存,进而可以进一步提升数据的有效性。第五,数据变换流程,在数据挖掘过程中,数据变换流程是十分重要的流程之一。数据变换流程实现了对数据形式的转换,为数据的离散以及数据的分层奠定基础。第六,数据挖掘流程,应用模糊集、统计方法以及决策树等方法进行数据挖掘,进而帮助人们获取有价值的信息。第七,模式评估流程,在此流程中,主要是由香港专家对数据挖掘结果进行评估,确保数据的有效性以及数据的真实性等。第八,知识表示流程,知识表示流程是指将所挖掘的数据呈现给用户。纵观整个数据挖掘的流程,其中成本耗费量最大的为数据收集环节,耗费精力最多的为数据处理环节,因此,在数据挖掘的过程中应加强对数据收集和数据处理两个环节的优化,在提升数据挖掘效率的同时降低数据挖掘的成本。

2 应用数据挖掘技术过程中存在的问题

2.1 信息数据具有复杂性

在开发软件工程系统的过程中,会涉及到结构化数据和非结构化数据,软件代码在非结构化数据中起到了非常重要的作用,而软件的版本信息则在结构化数据中发挥着至关重要的作用。这便需要明确区分结构化数据与非结构化数据,这是数据挖掘的关键所在。如果二者之间的区分不明确,则会导致数据处理的难度与数据挖掘技术水平不一致,这必将会给数据挖掘带来不利影响,导致数据挖掘质量相对较低。但是针对结构化属于与非结构化数据的分类十分复杂,难度较大,进而会导致数据挖掘技术的应用存在较大的局限性,难以充分发挥出数据挖掘技术的作用,因此也会给软件工程的开发带来不利影响。

2.2 工作标准方面存在问题

随着计算机科技的不断发展,计算机科技的作用以及影响范围也在不断扩大,目前计算机科技已经基本被应用于各个领域之中,绝大多数行业都需要应用计算机科技。这种现象决定了数据挖掘技术也会存在于多个行业之中,不同的行业对数据挖掘技术制定了不同的标准,因此便导致了数据挖掘工作标准多样化的问题,这在很大程度上提升了软件信息的复杂程度。除此之外,不同领域之中存在着较大的差异,相关的应用信息差别巨大,这些因素都会对数据的挖掘结果产生影响。

3 数据挖掘技术在软件工程中的应用

3.1 优化漏洞检测工作

在软件工程开发过程中,漏洞检测是十分关键的环节之一,通过漏洞检测,可以帮助人们发现软件工程中存在的疏漏,进而可以通过补丁来完善数据系统,有效弥补漏洞。根据相关调查显示,在商业应用过程中出现的信息泄露事件,有86%都是因为系统漏洞所造成的,而要想避免信息泄露事件的发生,应不断优化漏洞检测工作,提升系统的稳定性。要结合客户的需求来开展漏洞检测,对检测出来的漏洞要加强数据分析,为以后的软件工程提供数据参考。另外,还要注重数据清理工作,确保系统空间充足。应用数据挖掘技术,能够实现对漏洞的精准定位,进而为漏洞弥补带来了极大的便利。因此,合理应用数据挖掘技术,能在很大程度上提升漏洞检测的效率。值得注意的是,在数据转化过程中要保证数据转化后的有效性,避免出现数据不对等现象,因为数据不对等现象会给漏洞的检测带来不利影响。

3.2 提升挖掘版本控制信息水平

多人编辑统一档案的情况在信息挖掘过程中并不罕见,针对这种情况,需要对档案做出及时的更新,这样才能使每个工作人员都能了解到档案的最新情况。软件开发工程采用版本控制技术来达到这一目标。在版本控制信息挖掘的过程中,要加强对变更工作的重视,优化工作程序,提升对档案未来变化情况的检测能力。针对漏洞的检测,一方面要加强对当下漏洞的检测,另一方面要对未来漏洞进行预测,这样可以在很大程度上降低维护成本,同时还可以为系统软件维护效率提供保障。

3.3 将数据挖掘技术与软件项目管理相结合

项目管理对于系统的优化具有十分重要的作用,而数据挖掘有助于项目管理水平的提升,将数据挖掘技术与软件项目管理相结合,可以为项目管理带来极大的便利,同时还能够推动项目管理水平和效率的提升。除此之外,数据挖掘技术还可以为岗位工作人员的职责分配提供帮助,有助于保障软件工程的发展。将数据挖掘技术与软件项目管理相结合,可以更好控制软件工程,同时也给系统信息的查找带来了极大的便利。

4 结束语

随着软件工程的发展,其开发难度也在不断提升,而数据挖掘技术的应用,可以为软件工程提供重要的保障。因此我们应加强对数据挖掘技术的应用,同时拓展对该技术应用的深度和范围。

猜你喜欢
结构化漏洞数据挖掘
漏洞
改进支持向量机在特征数据挖掘中的智能应用
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
基于selenium的SQL注入漏洞检测方法
侦探推理游戏(二)