大数据在政府治理中的应用研究

2021-01-25 03:39李丹丹
科技创新与应用 2021年5期
关键词:图谱聚类期刊

李丹丹

(华中科技大学 公共管理学院,湖北 武汉 430074)

引言

党的十八届三中全会提出全面深化改革的总目标,实现国家治理体系和治理能力现代化是其中的一个重要目标,随着中国特色社会主义进入新时代,公共事务日益复杂多变,政府治理作为国家治理的基础和核心,各部门过去靠经验、拍脑袋、“头痛医头脚痛医脚”的旧方法已无法满足信息时代政府治理的现实需求,急需新的方法手段来处理公共事务。网络技术的快速发展为政府治理带来了新的机遇和挑战,在这个大数据时代,数据已成为国家重要的基础性战略资源,运用大数据理念和技术推动治理变革,提升政府服务和监管能力正成为趋势。

大数据应用于政府治理中的学术成果逐年增长(见图1),根据采集的2012 至2019 年间CNKI 收录CSSCI的822 个样本数据,相关研究开始于2012 年,之后逐年递增(2019 年为不完整数据)。在此背景下,本文采用文献计量的方法,梳理大数据在我国政府治理应用中的研究热点,对进一步推动大数据在政府治理中的应用具有重要意义。

1 大数据在我国政府治理应用中的研究概况

1.1 数据及分析工具的相关说明

图1 2012-2019 年CSSCI 来源期刊大数据与政府治理研究文献年代分布

本文所研究文献数据来源于CNKI 数据库,为确保文献质量,选取CSSCI 来源期刊,用“大数据+公共或大数据+国家治理或大数据+政府治理”作为主题进行搜索发现,相关研究从2012 年开始。经检索,共获得文献数据852 条,剔除会议、论坛公告和报道、无明确作者等文献,最终得到可供分析的期刊文献共822 篇,数据采集时间:2019 年 11 月 12 日。

知识图谱,也称为科学知识图谱(mapping knowledge),是以知识领域为对象,显示知识的发展进程与结构关系的一种图形,能够显示出知识单元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多复杂的关系。[1]本文通过文献管理软件NoteExpress 和可视化分析软件CiteSpace 对文献数据进行管理和分析,运用NoteExpress软件总结822 篇文献的年份、期刊、作者及机构分布,通过CiteSpace 软件生成关键词聚类图谱(clusters)、时间线图谱(timeline)和关键词突变图,结合图表,分析在我国的政府治理中大数据应用的相关研究现状。

1.2 研究概况

1.2.1 发文量及年代分布

利用NoteExpress 软件统计所选文献发文年份,利用EXCEL 绘制出发文年代分布图(见图1),由图可见2012年大数据在政府治理中开始得到应用,首先实践于交通的治理中,这是源于交通拥堵、交通污染日益严重,交通事故频繁发生,这些都是各大城市亟待解决的问题,已经有实践证明采用大数据管理可以解决这些繁杂的问题。2014 年-2015 年是研究大数据应用的快速增长期,对大数据的相关研究热度急剧攀升,2015 年至今相关研究进入稳定增长期。

2012 年我国发布了《“十二五”国家战略性新兴产业发展规划》,加快新一代信息技术、高端装备制造等产业。2014 年发布《关于促进智慧城市健康发展的指导意见》,指出物联网、云计算、大数据、空间地理信息集成等新一代信息技术将服务于城市规划、建设、管理和服务。[2]2015年,国务院正式印发了《促进大数据发展的行动纲要》,这是我国发展大数据产业的战略性指导文件,之后各部门都较为集中的出台了相关的大数据政策法规(见图2),指导实践中的大数据治理进程。

综上可知,大数据在政府治理中的应用发展与国家的宏观政策有着紧密的联系,在一系列政策法规的引导下,大数据在政府治理领域中的实践获得了持久的成长动力,得以进一步强化与快速发展。

图2 大数据政策年度发文数量统计[3]

1.2.2 高被引文献统计分析

被引频次是由美国科学信息研究所倡导的国际上广泛公认的、以学术论文为载体的研究成果评价体系,[3]被引用意味着论文中的观点、方法等受到了其他研究者的关注,这些高被引论文代表了这个研究领域的研究基础。由表1 可以得出,排名前15 的高被引文献平均被引频次为183,研究的内容包括大数据对政府治理的影响和挑战,也包括具体在教育、图书馆、安全、交通和审计方面的实践,特别是被引频次高达639 次的《从隐私到个人信息:利益再衡量的理论与制度安排》一文,代表了在大数据热的背景之下研究者们对数据安全的冷静思考。

1.2.3 期刊分布统计

通过NoteExpress 统计,822 篇文献来源于251 种期刊。根据布拉德福定律:如果将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成1:n:n2。[4]因此,各区域期刊数量约为822/3=274,排名前12 的期刊累计有276 篇文献,属于核心期刊,排名13 至66 位的期刊累计275 篇文献,属于相关区,排名67 至251 位的期刊累计271 篇文献,属于非相关区,可得出n≈4。由此可见,排名前12 位的期刊属于大数据在政府治理领域研究的核心期刊,尤其是《电子政务》和《中国行政管理》在该领域发文量占所选文献总数的一半(见图3),其所刊登的文献在一定程度上能够代表该领域的研究热点和前沿。

1.2.4 作者及机构分布统计

根据普莱斯定律:在同一项工作中,半数的工作都是由一小部分成员完成的,而这一小部分成员的数量刚好约等于全部成员数量的平方根。所选文献共有1185 名作者,√1185≈34,排名前34 位的作者共发文138 篇,只占总量的16%,由此可见,相关研究的核心作者群尚未形成。

从表2 中可知,发文量排名在前8 位的作者都来自于“985 高校”或“211 高校”,对研究机构进行可视化分析(见图4),可见广州大学公共管理学院和华中科技大学公共管理学院成果较多,但并未与其他机构合作,合作较为紧密的分为三个合作群:一是中国人民大学和国家信息中心信息化研究部、数据工程与知识工程教育部重点实验室;二是清华大学、武汉大学、南开大学、电子科技大学和华南理工大学;三是中国人民大学与武汉大学、国家信息中心、北京师范大学、中山大学、华南理工大学。各个学校的研究主力为公共管理学院、信息管理学院和法学院,说明当前研究集中在大数据实际应用中面临的各种挑战和问题。

1.3 研究热点和发展趋势

1.3.1 政府治理中的大数据应用主题分布

期刊论文中的关键词一般代表了作者所想要论述的关键概念、核心主题或关键内容,聚类图谱中的关键节点、重要链接和结构特征可以呈现当前研究的主要内容、研究主题之间的关联和整体研究状况。运行CiteSpace 建立新项目,以可供分析的822 篇文献为数据来源,节点类型设置为Keyword,时间段为2012-2019 年,时间切片为1,各时间切片的阈值选择为Top50,通过LSI 算从关键词中提取聚类命名,得到大数据与政府治理研究的关键词列表(见表3)和关键词聚类图(见图5)。为衡量图谱的绘制效果,CiteSpace 提供了模块值(Q 值)和平均轮廓值(S值),在[0,1]的区间内,Q 值和 S 值越大,表示聚类效果越好。当Q>0.3 时,表明划分出来的社团结构是显著的;当S 值>0.5 时,聚类一般认为是合理的。[5]所选文献在搜索时以大数据为主题,因此关键词“大数据”频次远高于其他关键词。

表1 样本文献中排名前15 的高被引文献

图3 发文期刊前12 位数量统计

表2 样本文献中发文量排名前8 的作者

图5 可见,Q=0.4049,S=0.6016,说明此次聚类效果较好,共生成 9 个聚类:#0 国家治理、#1 开放数据、#2 政务热线、#3 税收治理、#4 大数据治理、#5 公共大数据、#6教育治理、#7 数字政府、#8 治理。由此可见,这表明目前大数据在政府治理中的应用范围主要在公共服务、电子政务、智慧城市、公共安全和数据开放等方面。

1.3.2 研究主题的演化路径

时间线图更便于看出某个研究主题研究基础的时间跨度,突现词(Burst Terms)是通过考察词频,从大量主题词中探测出某段时间内频次变化率高的词,能够反映正在发展的理论趋势。由于突现词可能成为学科新的增长点,因此它可用于分析学科前沿领域与发展趋势。

关键词时间线图(见图6)反映了我国大数据在政府治理研究中的主题变迁与演化过程。2013 年之前,对大数据的应用研究主要集中在情报分析领域和借鉴国外经验方面,2014 年-2015 年,伴随着电子政务和治理技术的发展成熟,我国管理部门开始将大数据技术应用于电子政务、公共服务和城市治理领域。2015-2017 年,随着大数据技术的快速发展和应用,随之而来的数据安全和共享成为政府治理中不得不重视的问题,因此,数据开放、信息共享、隐私安全问题成为新的研究方向。2017 年至今,基于大数据的预测、挖掘、聚类、可视等方法,更多领域如税收、审计、应急、教育等开始运用大数据技术解决传统的“疑难杂症”,大数据在政府治理中的应用拓展到具体的实践中,政府部门根据“大数据”发展和应用的前景对自身的治理结构、治理能力不断进行自我革新,将危机化为机遇。

图4 机构分布和合作知识图谱

表3 大数据与政府治理研究文献前30 个高频关键词列表

图5 大数据与政府治理关键词聚类图谱

图6 大数据与政府治理关键词时间线图

为了更好地理解相关研究的发展脉络,利用CiteS-pace 软件中突现词探测功能,获得14 个突现词,见图7。由突现词的起始时间,可以明确我国大数据在政府治理中研究方向的转变与发展趋势,精准扶贫在2017 年开始成为新的研究热点,这也侧面展示我国扶贫工作的力度和发展。

图7 大数据与政府治理关键词突现词分析

2 结束语

本文基于文献计量法和知识图谱,对CNKI 数据库收录的822 篇大数据应用于政府治理中的文献进行可视化分析。研究发现,2012 年大数据在政府治理中开始得到应用,在一系列政策法规的引导下,大数据在政府治理领域中的实践获得了持久发展的动力。其次,当前研究集中在大数据实际应用中面临的各种挑战和问题,特别是近年来对隐私问题、数据安全问题的关注度日益提升。政务大数据发展正处于大数据应用发展的良好契机,需要进一步借鉴各行各业已有的丰硕成果,探索大数据促进政府治理变革的新模式,以大数据技术作为实现国家治理体系和治理能力现代化的重要助力。

猜你喜欢
图谱聚类期刊
期刊更名启事
期刊简介
基于图对比注意力网络的知识图谱补全
绘一张成长图谱
面向WSN的聚类头选举与维护协议的研究综述
期刊审稿进度表
图表
改进K均值聚类算法
主动对接你思维的知识图谱
基于Spark平台的K-means聚类算法改进及并行化实现