浅谈数据挖掘技术在统计学中的应用

2020-12-15 10:52张师玮
西部论丛 2020年14期
关键词:数据挖掘统计学效率

张师玮

摘 要:随着社会的发展和科技的进步,各行各业的统计需求都有所增长。在这一过程中,越来越多的先进技术和统计学的传统方法产生了融合,为我国经济决策提供了重大帮助。当前,我国一些地区使用的传统的统计方法已经不能满足新时代对于社会建设和经济发展的需要,在很大程度上影响了统计效率。而数据挖掘技术的应用,就让统计学的整体效率得到了大幅提升,同时,也让统计的科学性上升到了一个新的台阶。本文针对数据挖掘技术在统计学中的应用展开讨论,希望对相关人员有所帮助。

关键词:数据挖掘;统计学;应用

引 言

信息时代的到来,为很多行业的生产效率都大幅提升。尤其在我国进入信息时代之后,互联网快速普及,现如今已经成为人们日常生活中必不可少的一部分。在统计学中,信息技术的应用也越来越普遍。数据挖掘技术就为统计工作效率的提升带来了更多可能,互联网的发展同时也为数据挖掘提供了更多的数据资源,也让统计学中应用数据挖掘技术取得了更好的效果。

1.数据挖掘技术简述

网络的快速发展,使得信息呈现爆炸式增长,尤其在网络称为人们生活的一部分之后,人们对网络的依赖更加严重,虽然通过网络获得了巨大的便捷,但是不可否认的是,产生的数据信息体量也大幅增长。这在一定程度上阻碍了人们获取有价值的信息,鉴于这种现状,数据挖掘技术应运而生。它为人们筛选信息、挖掘有用信息提供了巨大的帮助,让人们能够在海量信息中,通过特定的筛选方法,获得最有价值的信息,让信息真正服务于生产和生活,做出更好的决策。

数据挖掘技术在实际应用的过程中,也发生了一定程度的变化。它从最开始的数理统计,到后来的人工智能分析,再到后来的机器学习,这一整个过程中,数据挖掘技术的功能越来越强大、效率越来越高。而且,经过多年的发展和实践,数据挖掘技术的应用领域也越发广泛,在很多行业中发挥着不可取代的作用,为我国经济发展提供源源不断的力量。而且,数据挖掘和其他学科的融合也更加深入,尤其和统计学的融合,为统计工作的效率和准确性提供了更强有力的保障。因为传统的统计方法没有办法针对目标数据进行深入挖掘,不能发现海量数据背后的有价值信息,这样一来,统计工作的效果就没法达到预期,影响了统计工作整体质量的提升,更为决策的制定造成了不同程度的影响。而利用数据挖掘技术和统计学进行融合,很多问题就迎刃而解了。它让很多领域的海量数据处理成为可能,为统计学数据采集范围得到了空前的提升,同时通过对有价值信息的挖掘,让统计工作的针对性更强。

2.数据挖掘技术在统计学中的应用

社会在发展的过程中,每时每刻都会产生大量的数据。人们利用现如今强大的计算机设备,能够对海量数据进行处理,让自身更加便捷地接触到有价值信息。在统计学中,数据挖掘技术就发挥着重要的作用。因为数据和字段之间的关系错综复杂,有函数相关关系,有关键词对应关系,还有数据引申含义的关系,无论是哪一种关系,要想通过统计方法来获得其准确的规律,都要对数据进行筛选。这时就需要根据统计学原理,对体量庞大的数据进行有效分析,将其中有价值的信息提取出来,再对其应用统计学方法。比较常见的是神经网络策略,它是通过计算机模拟人脑,来对数据进行加工和处理的模式,对数据进行分析和处理的效率非常高,而且针对不同类型的数据,还能提供一套相对完善的处理机制,进一步提高统计工作的准确性。网络上很多信息相对来说比较抽象,利用神经网络,还能让统计结果更加具象化、实用化,让人们能够更加方便地使用数据。这种处理方法的优势有很多,最明显的一个是这种方式是粗集理论策略的具体应用,而且容易操作,不需要给出额外的信息,这样不仅节省了空间,还能够提高数据信息的有效性。数据挖掘还能用来发现网络中的安全隐患,尤其对于那些相对隐蔽的安全隐患来说,数据挖掘能够发现潜在风险,并由相关人员及时做出应对。

3.数据挖掘技术在统计学中的体现

数据挖掘技术在统计学中的应用虽然能够带来非常大的便利,提高统计工作的准确性和效率,但是,要想让数据挖掘技术充分发挥作用,就要做好准备工作。具体来说,就是要将数据准备好,或者在网络上划定一定的数据采集范围,这样才能进行有效的挖掘,提高数据挖掘的效率,也更加方便对数据进行简化,为后续的数据处理工作打下基础。接下来,在进行数据挖掘的过程中,应当根据具体的需求,根据数据的不同类型,选择合适的算法,因为只有算法和数据的类型匹配时,才能得到预期的结果。现如今,人工智能技术越来越发达,在进行统计工作时,利用人工智能对数据进行初步的分析也是非常有效的一种方法,它能够模拟人脑对数据进行筛选,但是相较于人脑,人工智能的筛选速度更快,能够更为高效地得出有价值的信息,供统计工作使用。利用人工智能得出的有价值信息还能让后续的分析和评估工作更好地进行,方便统计工作人员进行总结。另外,机器学习也是一种在统计学的基础上发展起来的技术,它通過对大量的样本进行分析和总结,发现其中的规律,并形成一套类人的判断,进而像人脑一样对某一类事物形成一定的记忆。不过,这种技术的应用前提是在要有数量充足的样本,这样,计算机才能通过统计学方法,发现样本之间的相同和不同,进而完成学习。在这一过程中,计算机需要更加深入地对样本信息进行分析,挖掘不同样本信息中的有效内容,并将这些内容进行集中处理,这样才能完成学习。

结束语

数据挖掘在统计学中的应用非常广泛,尤其在我国进入信息时代之后,数据挖掘技术更是对统计学产生了巨大影响。人工智能、机器学习等一系列先进的技术,都是在统计学的基础上发展起来的。相关领域的技术人员应当积极应用数据挖掘技术对传统的统计学方法进行优化,为生产和生活创造更大的便利。本文简单分析了数据挖掘技术在统计学中的应用和体现,希望对相关人员有所帮助。

参考文献

[1] 马江洪,张文修,徐宗本. 数据挖掘与数据库知识发现:统计学的观点[J]. 工程数学学报,2002(01):1-13.

[2] 安康,韩兆洲. 对统计学领域数据挖掘研究的反思[J]. 统计与决策,2010(10):4-7.

[3] 孙薇斌. 数据挖掘中统计方法的作用和问题点[J]. 数理统计与管理,2004(05):78-80+39.

猜你喜欢
数据挖掘统计学效率
“慢”过程 “高”效率
选用合适的方法,提升解答选择题的效率
大数据的统计学基础分析
统计学教学与实验实践的一体化整合初探
聚焦立体几何命题 提高高考备考效率
数据挖掘综述
软件工程领域中的异常数据挖掘算法
省属地方高校应用统计学专业人才培养模式研究
基于R的医学大数据挖掘系统研究
跟踪导练(一)2