云计算下数据挖掘平台架构及其关键技术的探索

2017-05-08 06:48刘建东
科技与创新 2017年6期
关键词:数据挖掘云计算

刘建东

摘 要:云计算作为一种新型的信息化计算技术,已经被很好地应用于现阶段的生活当中,而随着大数据时代的不断推进,“数据挖掘”成为了当下的一个研究重点。借此,立足于信息化时代背景,对云计算下数据挖掘平台架构及其关键技术进行了深入的研究。

关键词:云计算;数据挖掘;平台架构;分布式存储技术

中图分类号:TP311.13 文献标识码:A DOI:10.15913/j.cnki.kjycx.2017.06.128

伴随着改革开放的不断深入,我国进入21世纪之后,综合国力有了全面的提升,无论是经济方面,还是科技方面,都取得了很大的进步与发展。我们希望可以通过不断地发展经济与科技来使社会发展获得更大的动力。经济全球化的大趋势在不断推动社会发展的同时也使我国迈进了信息化时代,而信息化的不断深入又使得大数据时代“如期而至”。云计算凭借其高强的存储能力与计算能力受到更多人的青睐。因此,对云计算下数据挖掘平台架构及其关键技术的探索有着鲜明的现实意义。

1 数据挖掘技术与云计算技术研究

1.1 数据挖掘技术

所谓的“数据挖掘技术”,主要是针对数据研究的一种新型技术。随着计算机网络技术的发展与移动互联技术的普及,现阶段生活当中,每天基于网络环境所产生的虚拟数据已经十分庞大。在大数据的时代背景之下,数据挖掘技术应运而生。而所谓的“数据挖掘技术”,其主要的研究对象便是众多的数据,工作内容便是在众多的数据当中“挖掘”出对自身有用的知识信息,然后加以利用。笔者习惯将这一过程看作一个“废物利用”的过程,其研究的范围将会涉及到人工智能等高尖端领域,而其内部的技术包括预测分析等。

1.2 云计算技术

云计算技术可以说是信息化的必然产物,但是其一经出现便被广泛地应用于企业发展之中,尤其是企业内部的财务管理,应用到的云计算技术是最为常见的。因此,云计算技术往往会被冠以“商业计算模式”的称号。但是从其本身的优越性来说,云计算技术可以被应用于社会当中的各个领域。简单来说,云计算技术的主要计算原理就是将各种计算任务按照一定的要求与规律分布在计算池当中,然后各个计算系統可以根据自身的需求获取相应的计算能力、存储空间及信息服务。这样就保证了计算任务的快速与高效,并且其内部大量的存储空间也是其被广泛应用的原因之一。

总的来说,云计算技术有着鲜明的优越性,尤其是在数据的处理过程当中有着众多优势。因此,云计算环境之下的数据挖掘技术将会有一个很好的发展前景。

2 云计算下数据挖掘平台架构

就云计算下数据挖掘平台架构来说,其主要还是应该集中于云计算技术进行研究。而云计算背景之下的分布式存储技术与分布式计算技术将会促进传统的数据挖掘平台开始新的变革之路。本文所建立的云计算下数据挖掘平台架构主要应用了分层设计的理念。在实践过程当中,本文将其分为了3个层次,其最上层为云计算支撑平台,中层是数据挖掘能力层,最底层是一个数据挖掘云服务层。

2.1 云计算支撑平台

简单来说,云计算的支撑平台其实是云计算技术支撑平台,云计算的支撑平台将会为数据挖掘平台提供分布式的数据存储技术、分布式计算技术、数据库存储技术和必要的云计算技术。

2.2 数据挖掘能力层

数据挖掘能力层主要提供的能力是数据挖掘的基础能力,其中包含算法服务管理能力、调度能力、数据并行框架处理能力和数据挖掘的云服务能力。同时,这个层次拥有相关的第三方挖掘工具的接入。这在设计过程当中是被允许的,例如Weka、Mathout等相关的分布式法库就是第三方的挖掘工具。

2.3 数据挖掘云服务层

数据挖掘云服务层主要是提供数据挖掘的云服务,其中,服务能力的封装接口样式可以是多种多样的,例如简单常见的Webservice等。在这个平台当中,可以根据不同类型的服务问题,为数据业务配置、组装相应的数据挖掘云服务。

3 云计算下数据挖掘平台关键技术研究

3.1 分布式存储技术

分布式存储技术主要被应用于数据挖掘当中,因为在对数据进行“挖掘”的过程当中需要应用到分布式存储技术。而分布式的存储技术在很大层面之上主要应用的是分布式存储系统。这种存储方法可以实现对大容量数据的存储,并且在存储的过程当中将会实现存储位置的明确、存储分类的清晰等。这种存储方式不仅可以保证数据挖掘平台的稳定,还可以保证用户的使用体验。

3.2 虚拟化并行云计算技术

虚拟化并行云计算技术的主要优势表现在高效率上。虽然其在实际的应用过程当中并没有分布式存储技术的应用射频大,但是其也是云计算数据挖掘平台不可缺少的环节之一。其应用主要体现为在一些大数据的处理当中,在云计算的运行环境中,其将虚拟技术和云计算技术进行有力的结合,然后进行数据挖掘服务。它主要是对数据进行重复性的挖掘,然后帮助用户考察。这种方式可以降低数据分析时的出错率,还可以保证数据挖掘的正确率。

4 结束语

云计算技术作为信息化时代的必然产物,在很好地推动信息化普及的过程当中具有鲜明的现实意义,同时对促进社会发展也起着重要的作用。因此,就现阶段的发展情况来说,无论出于何种原因,处于何种发展阶段,社会、国家以及其中的各个领域的发展都不能不结合时代特色。综上所述,云计算背景之下的数据挖掘平台是云计算技术与数据挖掘技术的强有力的结合。虽然现阶段在对该方面的研究中仍然存在一些问题,但是技术发展本就不是一蹴而就的,我们应该坚实地走好每一步。

参考文献

[1]丁岩,杨庆平,钱煜明.基于云计算的数据挖掘平台架构及其关键技术研究[J].中兴通讯技术,2013(01):53-56,60.

[2]温善毅.网络教学平台中数据挖掘云系统设计与开发[D].南昌:江西师范大学,2015.

[3]薛良飞.云计算在新型信息化系统中的综合研究[D].济南:山东大学,2013.

[4]王慧.基于Hadoop的并行挖掘算法的研究[D].北京:首都师范大学,2013.

猜你喜欢
数据挖掘云计算
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
志愿服务与“互联网+”结合模式探究
云计算与虚拟化
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器
云计算中的存储虚拟化技术应用
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书