重庆市科技资源数据标准化建设研究

2019-11-12 02:14勾鑫晔马文卓
网络安全技术与应用 2019年11期
关键词:资源共享标准化标准

◆张 磊 勾鑫晔 马文卓 郭 婷

(重庆生产力促进中心 重庆 401147)

随着计算机、通信和网络等信息技术的发展,社会各行业、各领域数据的采集、处理和传播已经变得越来越便捷和容易,与之相伴的是数据量的急剧增长。一方面,大数据是基于社会各行业、各领域的实际情况获取的,另一方面,不断累积的数据又能推动相关产业的进一步发展。大数据与社会各行业、各领域发展的融合日益明显和重要,大数据产业的发展和建设必将成为促进我国经济转型升级的重要支撑手段之一。

数据资源的极大丰富为数据资源的开发和利用提供了条件,然而如何有效地利用数据资源,消除数据的不一致性,提高数据的质量,建立规范的数据应用标准,实现数据资源的科学管理和应用,仍是一个亟待解决的问题。在大数据背景下,各地政府机关或社会各行业、各领域都在积极开展数据资源的整合工作,消除现有数据资源中存在的标准不统一、结构复杂、数据代码冲突等问题,实现数据资源开发和利用的标准化已成为当务之急。

研究表明,实现科技资源数据的标准化是解决科技资源快速定位的主要途径。各级科研主管部门和科研机构应确立科技资源数据的来源、采集方式、数据内容、数据格式等需遵循的原则,建立统一、规范和科学的科技资源数据标准体系,进而实现全国范围以及跨区域、跨部门之间科技资源数据的交换、共享和对接。

本文主要讨论科技资源数据标准建设的国内外研究现状以及重庆市科技资源数据标准化建设方面的措施,以期为我国科技资源数据平台和相关科技资源数据标准的建设提供参考。

1 科技资源数据的含义

数据是记录客观事物或事件的符号,其目的是反映客观事物或事件的性质、状态以及相互关系等。科技资源数据,顾名思义,是指在人们的科技活动中产生的揭示客观世界特征、变化规律等属性的原始数据,以及对原始数据进行二次加工整理所得的各类数据[1]。科技资源数据不同于一般数据之处在于科技资源数据来源相对规范,数据本身具备更高的专业性、系统性、稳定性和科学价值。

为便于科技资源数据的管理进而发挥科技资源数据更大的价值,我们需掌握科技资源数据的特点,进而设计合理的科技资源数据元数据标准。近年来,随着我国科技事业的快速发展,科技资源数据呈爆发式增长,现有的科技资源数据管理模式已明显滞后。因此,进一步认清我国科技资源数据的特征,进而制定相应的科技资源数据采集、整理、加工、传播等规范标准尤为必要。

2 科技资源数据标准化建设的现状

目前,国内外针对科技资源数据标准化的建设工作主要体现在科技资源数据元数据标准的制定和科技资源数据平台的建设等方面。

相较于国外成熟的科技资源元数据标准,我国在科技资源元数据标准的建立方面起步较晚。2003年,科技部牵头实施了科学数据共享工程,建立了9个学科领域的科技数据平台并制定了相应的元数据标准。随后,国家通过立项的形式开展了大量的科技资源元数据标准的研究工作,到目前为止,我国已建立起了中国科学院科学数据库核心元数据、国土资源信息元数据、生态科学元数据、医药卫生科学元数据、农业科学元数据、海洋科学元数据、地球系统科学元数据等一系列规范的科技数据标准[1]。

在规范科技资源数据的同时,我国也加强了科技资源数据平台的建设工作。2014年,由中国标准化研究院、国家科技基础条件平台中心、北京航空航天大学、中国科学院计算机网络信息中心和国家信息中心等单位联合编写的《科技平台 资源核心元数据》标准开始实施。该标准为国家科技基础交通平台门户提供了统一的元数据标准,为实现基于元数据的跨平台查询检索提供了支撑。

虽然我国在科技资源数据标准化建设方面取得了巨大的成绩,但是还存在很多不可忽视的问题。如文献[2]指出,我国的科技资源数据平台标准化工作大都是依靠参建单位自发地独立建设,各个平台的重复性大、通用性差;标准范围相对过窄,深度不够,适用性不强。急需进一步深化科技资源数据的标准化建设工作。

3 重庆市科技资源数据标准化建设的举措

近年来,重庆市大数据产业发展迅速,为推动重庆市科技管理信息系统的整合和资源共享,加强和规范科技资源数据管理,构建集成统一、开放共享的科技资源共享平台,重庆市科技局拟通过整合重庆市科技人力、物力、财力和成果等资源,运用大数据、云计算等技术,将以前分散、独立的各个科技资源子系统整合在同一个平台之下,实现科技资源“一网打尽”、科技创新创业服务“一键联通”、科技政务“一站式服务”等功能。

构建科技业务“一站式服务”科技资源共享平台需对现有来自不同系统、不同格式、不同性质的各科技子系统的大量数据进行数据名称、类型、标准、接口、编码等格式的规范和统一,进而达到科技资源平台间数据的互联互通与共享。因此,建立重庆科技资源共享平台统一的数据标准是建立科技资源共享平台的基础和前提。

3.1 科技资源数据标准化建设的工作流程

为推动重庆市科技资源数据标准化的建设工作,重庆市科技局成立了由决策层、管理层和执行层三层结构构成的组织架构。其中,决策层主要负责数据标准化的管理工作;管理层主要负责数据标准化的统筹规划和协调;执行层则主要负责数据标准化的具体实施。在数据标准的建设过程中,标准将遵循“科学性、系统性、协调性和开放性”原则,以重庆市现有的以“信息孤岛”方式存在的近十个科技管理系统与科技资源共享平台的数据为基础,积极参照相应的国际标准、国家标准以及各地方科技平台的建设成果,依据《科技平台标准化工作指南》中科技平台标准制定的流程开展[3],数据标准化的建设主要包括数据标准的编制、数据标准的审查和数据标准的发布三个环节,其流程如图1所示。

图1 数据标准建设流程图

3.2 科技资源数据标准化建设的数据分类

重庆科技资源共享平台整合了重庆市的科研机构、科技人才、科技产业、科技资源和科技服务等各方面的数据。科技平台资源数据具有复杂性、巨量性和分散性等特征,难以构建一个满足平台所有数据的元数据标准。为此,根据平台各种数据的特征,我们将平台的数据分为机构信息数据、资源信息数据、个人信息数据和服务信息数据四部分,据此构建每一类数据的数据标准。

机构信息数据以科技资源管理业务相关机构信息为基础,按照机构是否从事经营活动,主要分为企业数据和非企业机构数据。一般而言,企业主要是为满足社会需求,从事生产、服务等经济活动的一种盈利性的经济组织,主要包括国有企业、全民所有制企业、集体所有制企业、股份制企业、有限责任企业、合资企业、独资企业、私营企业等。非企业机构主要是从事非营利性社会服务活动的社会组织,一般主要包括高等院校、研究院所、政府机构、事业单位、社会团体和其他公益性机构。企业数据核心元数据主要描述了企业名称、登记注册类型、企业所属区县、法定代表人、企业简介等情况;非企业机构主要指高等院校、科研院所等机构,其核心元数据主要描述了非企业组织机构名称、注册信息、所在地等情况。

资源信息数据是指科技资源管理业务相关的资源数据,主要包括仪器设备数据、科技成果数据、研发基地数据、科普基地数据、科普视频数据、科普图书数据和众创空间数据等资源。

个人信息数据是指科技资源数据采集中作为主体采集对象的个人的信息。个人信息数据按层级关系分为个人基础信息数据、科技人才数据、科技专家数据和科技特派员数据,其中,个人基础信息数据是个人作为采集与处理对象需采集与处理的基础信息数据。科技人才数据是科技人才在个人基础信息数据之上需采集与处理的特色信息数据。科技专家数据是科技专家在科技人才信息数据之上需采集与处理的特色信息数据。

服务信息数据是指以科技资源共享平台为载体提供的科技服务数据。科技服务信息数据主要包括科技店铺服务数据、科技项目服务数据、科技平台服务数据、科技型企业服务数据、科技信用服务数据、科技金融服务数据、科技奖励服务数据等数据。

3.3 科技资源数据标准化建设的总体框架

重庆科技资源共享平台整合了重庆市各个科技子系统的数据,根据数据的特征,我们将平台的数据分为机构信息数据、资源信息数据、个人信息数据和服务信息数据,这是对平台信息数据的一种横向划分。为了便于对数据的管理,宜需对平台的数据从采集、处理、应用、管理等纵向生命周期过程进行规范。

为此,重庆科技资源共享平台采用树形结构,通过层级展开的方式建立了一个重庆市科技资源数据标准体系框架。该框架主要包括两层,在第一层,我们首先确定的是科技资源数据的通用标准体系。它主要包括数据的基础类标准、技术类标准、安全类标准、工具类标准、应用类标准和管理类标准。第二层是在第一层的基础上,对第一层的进一步细化。比如基础类标准为整个标准体系提供包括总则、术语、参考架构、元数据、元素集、语义分析、分类分级等通用的基础性标准;技术类标准主要是对大数据相关的技术进行标准化规范,包括:数据质量标准、数据处理与分析关键技术标准、数据评估技术标准等;安全类标准主要是针对通用的安全和大数据环境下隐私数据的保护;工具类标准主要是从数据使用过程中的过程性工具和终端应用类工具进行规范,主要包括系统类工具和应用类工具。系统类工具标准又可细分为平台基础设施、预处理工具、存储类工具、分布式计算工具、数据库、平台管理类工具等,应用类工具包括应用分析工具、可视化工具等;应用类标准从发挥数据价值的角度出发,将应用分为数据访问、开放、共享、交易及行业应用等环节;管理类标准是大数据标准的重要支撑,贯穿于数据生命周期的各个阶段,该部分主要是包括数据运维和数据治理,其中数据运维包括数据库维护、运行维护、运行安全及大数据系统及相关工具等方面的运维及服务等方面的标准,数据治理包括数据资产管理、大数据解决方案设计、数据管理能力成熟度评价等。

4 总结

科技资源数据的互联互通和共享是挖掘科技资源潜力、提升科技服务水平的关键,科技资源数据的标准化是实现科技资源共享的保障。因此,加强科技资源数据的标准化工作对推动我国科技事业的发展具有重要的基础性作用。本文简要介绍了国内外在科技资源数据标准化建设方面的一些现状,并就重庆科技资源共享平台数据标准化建设的具体内容做了分析。后续,我们将对重庆科技资源共享平台在使用过程中用户的体验做统计分析,进一步完善平台的数据标准化工作。

猜你喜欢
资源共享标准化标准
2022 年3 月实施的工程建设标准
交通运输数据资源共享交换体系探究与实现
标准化简述
集团公司人力资源共享中心模式探索
谁“捆住”基层的手脚?——泛滥的规范化和标准化
人力资源共享服务模式研究
针对大数据背景下工程造价信息的资源共享
党支部基本组织制度标准化“三字诀”工作法
忠诚的标准
美还是丑?