大数据时代下数据分析思路研究

2022-03-27 22:37苑广
中国新通信 2022年1期
关键词:大数据时代

【摘要】    随着信息技术的迅猛发展,各项数据信息在互联网、物联网等相关渠道的支持下互相递进,人们逐渐步入大数据时代,数据信息的有效传递对人们的决策成本产生一定的影响,传统的信息不合理和不对等所形成的差异也已逐渐消失,而数据便可创造出更多的价值作用。基于此,本文主要分析大数据的定义、特征,并重点研究其大数据时代下的数据分析思路,仅供参考。

【关键词】    大数据时代    数据分析思路    数据价值

引言:

现阶段,对大数据的进一步探究和广泛应用已经逐渐受到各界人士和相关领域的高度关注,国家统计部门已经将信息处理技术纳入关键创新技术工程的主要内容之一。在我国大型计算机的发展趋势下,有效处理并分析复杂层次的数据能力逐步提升,也加强了在海量数据中提取价值信息的能力。我国朝向大数据时代得发展进程越来越快,为人们带来生活和工作上的便利。

一、大数据的定义

大数据指的是比普通数据含量大的资料,需要人们经过科学的处理和分析才可以获取其中具有价值作用的数据信息。世界各个领域对于大数据的表述都有所不同,究其原因主要是因为大数据的涵盖范围较为广泛,所涉及的知识层面过多,不同的人按照自己的想法和观点去看待问题,所理解的含义也有一定的差异性。在这个数据引领潮流的新经济时代下,数据不但将人们的生活方式有效优化并升级,也将传统的商业模式加以转化。从客观角度来说,可以将大数据作为一种纯粹的数据结构,也可以将大数据看作对庞大数据量深入分析的工具和途径,因其大数据具有多样性、价值性等相关优势特征。

二、大数据的基本特征

(一)大量性

這种特征主要指的是大数据的数据量较为庞大。在大数据时代中,快速发展的网络技术和储存数据信息的电脑、手机等网络工具的全面普及,数据资源的产生渠道不断拓展加宽,人们在不断获取资料的过程中更改数据的计量单位。数据的计量单位从原本的PB直到今天的ZB,由此可以看出数据的大幅度的增长。根据相关统计调查分析,早在2012年底,全球使用智能手机的用户总计13亿,而且智能手机每月产生的数据总量达到500MB,移动数据流量高达1.3EB。

(二)多样性

多样性特征意指数据的类型多种多样,大数据不仅仅局限于文本类资料的结构化数据,还涵盖网络日志、视频音频、地理位置等非结构化数据或半结构化数据资料。多样化的数据产生缘由主要有两种,一是非结构化数据资料的涉及范围广泛,二是开发潜能信息的需求。传统的数据处理对象主要是结构形式的,从数据大小入手感受处理对象的具体特征,但是这种方式还不够完善。大多数情况下,更多需要了解处理对象的位置、形状、颜色或者是人物的心理变化趋势等方面,这些因素都是传统数据无法详细描述出来的。为了充分满足新时代发展和人类对分析深层次数据的需求,同时在大数据时代下对视频或图片等资料的处理技术也克服了种种难题,所以半结构化数据和非结构化数据也逐渐融入数据处理的对象群体当中。

(三)价值性

价值性特征说的是数据所呈现的价值巨大,但是整体密度相对较低。大数据中具有反映商业活动、人类生产活动和心理活动等方面价值意义非凡的信息,但因为大数据的规模过于庞大,数据在潜移默化当中出现日益变化的趋势,一些具有价值作用的数据会在短时间内消失殆尽。通常情况下,价值密度的高低和数据整体规模的大小构成反比关系。比如在视频数据当中,一段长达1小时的视频,在连续监控处理期间,具有价值的数据信息显现出来的时间仅有一秒钟。由此看来,大数据的流动性较强,所以在大数据时代下,针对数据的收集和处理在思想模式上都要进行跨越式的转变,怎样利用机器算法在短时间内实现数据价值的“提纯”是当今社会需要重点关注的问题。

(四)高速性

高速性说明数据处理的时效性较强,因为大数据所含有的价值信息显现时间过短,要求在短时间提取出庞大数据量中夹杂的价值信息。在时代的变化过程中,全球的数据使用量会在各种因素的影响下逐步提高。在大量数据中,处理数据的效率直接关系到智能创新型企业的长足发展。

三、基于大数据时代的数据分析具体思路

(一) 数据的价值挖掘

对于海量的大数据环境,数据的使用人员需要将数据分析的科学目标及具体要求作为主体,并围绕此主体展开深入挖掘和数据收集工作,提取出更有用的数据,及时摒弃无用数据,在大量数据中实现价值挖掘,根据数据类型的不同选择最佳适宜的方式提升数据的使用价值。在实现大数据挖掘过程中要根据实际的案例来展开,比如在开展广告人群的匹配工作期间,在进行数据分析和数据价值挖掘中主要包含两方面的数据类型,一是广告库的数据信息。其中主要涵盖广告库和客户的相关信息等内容。这种数据类型大多数呈现出强度较高的结构性,可以在传统的数据库中实现有效采集和应用、分析等环节。二是客户后期的行为数据。通过以上两种类型数据的结合探究,可以深入挖掘出存在的有效价值。而且,在实际的应用和实践期间,还要不断利用第二种信息数据的功能和作用,只有这样才可以快速获取到用户需要的信息资源。按照对群体智能和行为的探究,可以在此过程中为信息使用人员提供条理清晰的反馈流程和机制,并为其自身的科学决策提供一定的数据支持。

(二)数据的整理

数据的整理主要包括四个环节分别为:审核资料、分配资料、汇总并编制统计表格或图表、保管和输送。现阶段数据资料过于庞大,其类型也多种多样,对数据处理的效率和质量提出更多的要求和标准,尤其是在大数据时代下对于图标的绘制来说难度更大。基于此,要针对所需材料进行反复审核和储存。大数据的审核和储存与传统数据审核保存方式相比存在一定的差异性,大数据时代可以利用现代化的专业工具实现数据的有效审核和保存。传统的数据审核主要目的在于检测原始数据是否具备准确性和完整性,而大数据的审核体现在兼顾数据精准预测和处理速度的前提下,明确处理的数据规模,简单来说也就是确定其数据量的等级[1]。大数据自身呈现出杂乱无章的特点,具有噪音和不稳定的相关因素,但是有噪音的数据也因其可以发现隐藏模式和知识而比其他普通数据更富有价值作用。所以,反映处理对象的数据有两面性,但无论是正确亦或是错误,都同属于大数据的重要部分,在法律规定允许的情况下,任何数据都具备一定的价值。除此之外,传统的数据储存主要是通过审核、汇总等加以保管,而大数据的储存大多数是为了控制储存成本,依据法律条件明确储存数据的具体规模。

(三)数据的开发

传统数据因其样本量较小、解决问题的目的性较强,数据的价值通常呈现出时效性的特点,也就是说数据价值会根据使用频率的增加或时间的推移而逐渐降低。而大数据的流动性较强,会在潜移默化当中将其价值重新塑造起来,数据价值呈现出再生性的基本特点。在大数据时代下,可以将数据比作为神奇的钻石矿场,其中所涵盖的价值被挖掘出来后还可以不间断的产生新价值。整体数据不会出现贬值的状况,还会在社会经济的推动下大幅度增值,为了可以全方位了解研究对象,一般情况下需要对数据实施有效整合,即将某部分数据加以合并。整合数据会对研究对象的反映更加全面、准确,会在其中发现新问题,构建创新体系和新价值。从客观角度来分析,整合数据的价值通常高于部分价值,所以分析研究大数据需要抱有积极奋进的态度,不要畏惧庞大的数据量,要具备整合大数据的勇敢信心,所以,开发大数据是一项具有深远意义的工作。

(四)数据的应用

传统的数据应用的初衷是为了预测未来发展趋势和解释现象,简单来说,就是探索各个环节的联系关系和因果关系,然后在此基础上实现良好的预测。在大数据时代下,构建在关系基础上的预测是大数据的核心内容,因为大数据具有价值性特点,所以在大数据时代背景下商业激烈竞争的环境中,要求数据处理得更加便捷和快速。需要重點注意的是,由于数据总量的庞大以及复杂的结构框架,在数据的应用阶段中,可视化是有效解释数据结构的重要因素。相关科研人员表明在大数据时代中,数据分析结果实现可视化是十分必要的,对解释分析结果具有一定的帮助[2]。通常情况下,数据的集约程度较大,对本地磁盘、主要存储器和远程磁盘的存储容积空间进行了大量的耗尽,在此情况下,人民群众还要密切关注数据的可视化,因为它是数据和心灵有效衔接的主要媒介。大数据的应用范围涉及十分广泛,能否对已经获取完毕的数据实施快速处理是当前各行各业发展的重要任务。

(五)合理运用统计学思想

在大数据背景下,传统的抽样分析已经满足不了海量数据的分析,在创新时代中需要及时转变思维和抽象的思想,数据样本就是一个整体,要分析与某种研究对象相关联的一切数据,而不是仅局限于分析少量数据样本,这样可以在一定程度上理解事物的发展变化规律,可以对数据信息进行良好的处理。更趋向于从不合乎常理的信息数据中掌握事物的实际情况,深入理解数据分析的严谨性和系统性,而不是单纯的追求精准数据。通过分析数据网络的交叉连接,有效掌握动态化的因果关系,通过分析处理相关数据精准的反映出发生变化后的具体状况。积极采用统计学思想,针对收集完毕后的数据和信息实施针对性较强的分类处理,有效掌控事物的变化趋势,为人们做出正确决策提供一定的参考依据[3]。

(六)数据的处理和分析

在此环节中,一方面要根据社会发展特点改变抽样调查的工作理念,通常情况下,大数据的样本资料主要是材料的汇总,这就需要在实现数据分析处理期间要全面了解和梳理数据的整体构造,并逐渐朝向数据的局部化展开延伸和拓展。与此同时,在大量数据开展分析处理过程中需要解决好调查目标构建不达标、抽样框架不稳定及样本数量受到约束等问题。另一方面,还要有效提升大数据环境下数据的精确标准和要求,因为大数据环境中获取数据的渠道多种多样,数据处理的质量和最终效果也会有所不同。所以在数据差异性允许的条件下提升精准度的标准[4]。除此之外,对数据关系进行重点分析,不但要注重数据关系的梳理,还要注重事物之间相关性的分析探究,及时转化分析思路,围绕分析目标和关联性有效展开大数据环境下的数据分析工作。

四、结束语

综上所述,大数据涵盖结构内外的大量数据,在云计算平台实现大规模收集处理和数据库的构建等方案,针对数据的分流采用价值挖掘等方式实现处理分析,促使获取的数据可以完全符合新经济时代的发展需求和现实状况。数据分析思路主要存在于感官、物质享受上的复杂网络关系,并在此基础上构建出符合时代背景的关键分析决策。

作者单位:苑广    北京上品科技发展有限责任公司

参  考  文  献

[1]张俊发.大数据时代个人数据的权利配置[J].华南理工大学学报(社会科学版),2021,23(05):69-77.

[2]杨松会.大数据时代下企业资源优化配置的策略探究[J].现代工业经济和信息化,2021,11(08):191-192+195.

[3]王瑞.大数据时代的数据挖掘技术与应用[J].轻工科技,2021,37(09):72-73.

[4]杜旭阳.大数据背景下的统计学发展方向探究[J].山西青年,2021(16):133-134.

猜你喜欢
大数据时代
大数据时代互联网金融冲击下商业银行发展的SWOT分析
大数据时代档案管理模式的转换与创新
大数据时代宏观经济分析的相关探讨
智慧城市与大数据时代的政府治理
大数据时代互联网金融对传统商业银行的影响研究
大数据时代下计算机信息处理技术的应用
大数据时代背景下高职院校宣传思想工作的思考与实践
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态