支撑科技战略情报的资源保障体系建设研究

2021-11-03 07:45刘静羽黄金霞王昉
数字图书馆论坛 2021年9期
关键词:保障体系科技资源

刘静羽 黄金霞 王昉

(中国科学院文献情报中心,北京 100190)

随着科技发展和科技竞争的加剧,科技情报和信息资源为科技发展提供保障与支撑作用的战略价值日益凸显[1]。当前,国内外形势的变化,对战略情报事业发展的要求不断提高,开放信息环境的变化和愈加激烈的国际竞争态势给战略情报事业带来更大挑战[2]。战略情报事业的发展离不开高质量的资源保障体系的支持,从世界高端智库的建设实践看,专业的数据中心能够为情报分析提供强有力的信息支撑,因此信息化和数据资源将是未来智库的重要特色之一,也符合当前大数据驱动创新服务的时代要求。图书馆因其收藏有丰富的信息资源,是为智库提供决策信息支持的重要保障机构之一。

我国科技战略情报事业发展态势迅猛,有效地支撑了科技创新和政府决策,但因起步较晚,仍面临数据获取和利用等一些关键问题,包括缺乏统一的智库相关数据的系统和获取平台、数据仍以文献为主且呈现类型单一、数据管理工作不规范且缺乏共享、数据融合与研发能力不足、缺乏数据分析工具资源等。但是,关联数据、情报计量与可视化技术、数字资源长期保存技术等为新型智库提供科学、系统的技术支持,更多类型的资源和工具的涌现也为智库发展提供了数据基础。

事实证明,只有建立高效、安全、高质量的资源保障体系才能提升国家战略情报工作实力。国家科技图书文献中心在其“十四五”规划中明确提出,要加强立体化的数字资源保障建设,增加智库报告、年鉴、进展、综述、述评等三次文献的采集[3]。作为国家科技战略情报信息的重要保障力量,图书馆应从国际形势、国家对战略情报的需要、战略情报事业的发展、国内外同行的竞争、开放学术交流体系发展对战略情报的需求等方面考虑,尽快构建支撑战略情报的数字资源保障体系,增加科技战略与政策类、科技管理类、科研投入与产出类、科学领域前沿类、决策咨询建议类等新型智库支撑资源,并通过与其他科技资源、文献资源的关联组织和分析挖掘,实现各类数字资源的关联揭示、情景敏感和一站式服务,尝试提供适应决策流程的资源组织揭示,从国家层面提升资源建设水平和服务能力。

1 国外科技战略情报资源保障体系建设情况

化柏林等[4]对数据环境下的科技情况资源保障体系进行研究,回顾了目前世界主要国家的科技文献资源建设情况,包括美国国防技术信息中心(DTIC)、全俄科学技术信息研究所(VINITI)、英国国防科技研究院知识服务部(DSIL)、法国武器文献中心(CEDOCAR)、德国卡尔斯鲁厄科学技术专业信息中心(FIZ)、日本科技振兴机构(JST)、加拿大科技信息研究所(CISTI)、印度国家科学交流与信息资源研究所(NISCAIR)等机构,并将其主要建设特点归纳为以下4个方面:①数字资源比重逐年增加、深加工资源获取受到更大重视、力求以多种方式支撑信息获取能力;②资源种类包括政府部门指令、预算信息、专利和专利应用、研究和研究会议论文集、技术报告、会议资料、公共资料、征求意见报告、权威数据库、引进和加工电子型信息资源;③资源获取方式以购买为主;④资源组织方面,重视加工整理自产信息、开发科研科技数据库、细化组织加工粒度、挖掘深层次信息、建立数字仓储等。总体来看,各个机构都非常注重加强多类型资源的保障,以及对于情报信息的精加工分析。

共建共享是科技情报资源保障体系的一个重要方面。21世纪初,为了不断盘活现有资源价值,美国政府将不同情报机构的信息数据整合成共建共享的数据库,如恐怖分子筛选数据库(Terrorist Screening Database)以及国家情报图书馆(Library of National Intelligence)的信息共享环境(ISE)项目。ISE项目的目标是实现国防、情报、国土安全、外交和执法五大领域反恐信息的共享,从技术平台、政策规范、程序、纲领、信息系统、架构标信等方面整合和协同已有的信息资源[5]。

建立专题数据库是当前战略科技情报资源保障体系的重要内容。在欧洲,德国国际政治与安全事务研究所(Stiftung Wissenschaft und Politik,SWP)按国家和地区划分研究领域,形成覆盖欧盟及其成员国领域、美洲领域、亚洲领域等专题数据库。欧洲最大的国际关系研究资源库“世界事务在线”(World Affairs Online,WAO),包含公共文献工具、参考书目、新闻报道、学术报告等多种类型资源,并建立事实资料库管理系统,长期维护[6]。

黄晓斌等[7]详细调研了全球领先智库兰德公司的战略情报资源保障体系情况,笔者认为上述研究中提到的兰德公司战略情报资源保障体系所具备的特点,值得我国参考。

(1)支撑战略决策的数据信息体系中的各要素有机统一。支撑战略情报的数据信息体系,一般包括数据信息需求、外源数据、自主开发专题数据信息库、科学智能的数据信息搜集支撑方法和工具、数据加工分析人才队伍。只有实现上述各要素的有机统一和良性互动,才能更好地支撑战略决策。

(2)拥有“宽领域”“双向综合”“项目导向”的领域数据体系。兰德公司针对不同的领域建立了较为完备的决策数据体系,能够较好地响应和支持不同项目的数据信息资源需求。

“宽领域”指的是兰德公司的决策数据来源全面、类型丰富。兰德公司通过直接获取与间接获取相结合的方式获取数据,直接获取指开发多方式调查能力系统(MMIC)、组合分析工具(PAT)直接针对需求采集和积累数据,间接获取指通过其他渠道获取数据。其数据类型主要包括3类:①数据资源类,主要包括内外部数据资源,如自建数据资源、商业数据资源等;②项目资源类,主要包括调研数据、一次数据、二次数据等;③产品数据类,兰德公司所开展的项目,其产生的各类数据产品也随之转化为战略决策支撑体系的重要数据来源之一。

“双向综合”指的是以用户需求为重点,同时利用媒体平台和数据共享平台,以开放的方式完善数据体系。另外,与多方合作建设信息资源,包括与经济信息中心、专业调查机构、学术研究机构等合作共建数据库,或者购买数据资源,保证数据流通和变现。

“项目导向”指的是兰德公司根据不同研究主题内设10多个研究机构,每个研究机构下根据学科特色细分为不同的研究项目,针对项目需求建设具有自身特色的信息资源。如兰德公司为美国国家安全调查部开发的恐怖事件数据库(RDWTI),已对4万多起恐怖事件进行了编码和详细说明,并提供了与反恐相关的系统信息。

2 支撑科技战略情报的资源保障体系建设思路

2.1 建设目标

支撑科技战略情报的资源保障体系,其建设目标主要是服务于国家层面的科技决策。该体系应以“知识体系”为核心,充分涵盖高质量的科技文献,包括论文与专利数据、科研规划与基金项目数据、科技管理与科研投入产出数据、科学领域前沿趋势数据、重要人才发现基础数据、科研机构数据、科研装备与设施数据、领域关键技术数据、科技舆情监测数据、重要社会经济发展数据等科技大数据资源。同时,在资源保障的基础上,综合应用深度学习、知识图谱等技术,实现人才、文献、关键技术清单等多元数据的高度关联和融合,完成文献内容中“作者与科学家”的贯通、关键技术问题与关键科学问题的贯通、关键问题与关键机构及人才的贯通、前沿技术与创新产业的贯通,以实现基于数据的快速抽取、实时分析,以辅助战略决策。

2.2 建设内容

参考国内外做法,本研究构建了支撑科技战略情报的资源保障体系(见图1)。资源保障体系主要包括3个层次的内容。

图1 科技战略情报资源保障体系

(1)数据需求层。科技战略情报资源保障体系应充分重视并注意及时收集科技战略决策用户主动提出的数据需求;同时,情报分析人员也应通过多种渠道调研、发现尽可能多的数据需求,以补充用户需求和需要,并进行资源的遴选。在遴选基础上,资源保障体系则通过数据采集、数据购买的方式获取相关数据。

(2)数据内容层。数据内容层是科技战略情报资源保障体系的核心模块。结合当前国内图书情报机构实际,科技战略情报资源体系内容的构建要充分整合已有资源和符合新需求的资源。在资源整合的基础上,重点围绕科技情报事业发展现状和需要,从数据层面按类别进行梳理,将原有的各类信息打散重组成能够支撑科技战略情报分析的不同数据集,形成情报分析工作所需的高质量“原材料”,包括高质量论文、专利数据、人才数据、项目数据、科研管理数据等。

(3)工具机制层。该模块为数据内容层的建设提供工具和机制的支持,包括提供数据信息搜集分析的工具,以及打通数据获取的合作、购买渠道等,从而保障整个科技战略情报保障体系的运行。

建设科技战略情报资源保障体系,则需要从4个方面着手,即加强“双向综合”的数据需求获取与分析机制建设、“宽领域”的基础来源数据体系建设、科学智能与综合多元的工具机制建设,以及多元化的数据资源获取渠道建设。

2.2.1 “双向综合”的数据需求获取与分析机制建设

一方面,根据不同的决策目标和领域,设立需求获取与分析的不同的项目组,配备相应的人员,直接获取决策层的数据需求。另一方面,开发多种科技战略决策需求调查与分析工具,定期收集分析国家和机构科技发展规划、重大项目任务等,推进关于数据体系的研究。数据需求分析和研究成果,由项目组上报至决策层。综合以上双向互动内容,明确并不断更新决策数据体系目标。

2.2.2 “宽领域”的基础来源数据体系建设

支撑科技战略情报资源保障体系应以实现各类决策场景为目标,遴选、获取、整合、利用机构已有基础数据和外部数据资源,并结合开发专题数据信息库形式,建立全面丰富、权威可靠的基础来源数据体系。重点建设9类数据,主要内容与建设方法如下。

(1)高质量论文与专利数据。研究型论文与专利在目前依然是科研成果发布和交流的主要途径,提供高质量、可信赖的内容是国际学术交流平台建设的一个永恒主题[8]。同时,专利数据对于分析和预警专利侵权风险、识别“卡脖子”技术[9],以及促进我国知识产权信息服务发展[10]等方面至关重要。因此,加强对于高质量论文内容和专利信息的获取与保障,对于推动国家科技创新有着十分重要的意义。

这部分数据的主要来源包括全球知名引文数据库(如Web of Science、CSCD)、汤森路透(THOMSON REUTERS)及全球其他专利数据库,全球主要的机构知识库、标准数据库、知名预印本平台(如arXiv、bioRxiv、SSRN、ChemRxiv)、重要基金资助机构的成果共享库(如NSF-PARPubMed Central、NPArC、EPMC、J-STAGE、J-STAGE DATA、KAKEN、NSFCOR、CAS IR GRID、中国国家自然科学基金委基础研究知识库)等。

上述数据源一部分为商业资源,一部分是开放资源。对于商业资源,建议在持续订购、更新维护已有重要数据资源的基础上,扩大使用权益,开展更多类型高质量资源的本地化或数据合作,对数据内容进行提取分析,形成各类围绕战略决策需求的信息库。例如:从综述论文中选择各领域的重要的评论期刊和重要论文,形成核心领域评论数据库;从全文中抽取科学问题,形成问题-文章数据;从重要会议中提取会议征集资源和会议议题资源等。

(2)科研规划与基金项目数据。科研规划与基金项目数据被认为包含大量可供分析的知识[11]。而实体清单关系到科技前沿、国家安全等重要方面的内容,体现出一个国家对于科技战略发展的布局,美国近年来强化“实体清单”阻碍我国科技创新[12]。

该领域值得关注的重要数据资源包括:欧美主要发达国家科技规划,如美国海军研究署的《海军科技战略》、美国联邦运输部的《科技战略规划纲要》和《智能交通系统战略规划2020—2025》等专题战略规划文本,欧盟的《战略能源技术规划》《欧盟疫苗战略》《欧洲处理器和半导体科技计划联合声明》,德国《高技术战略2025》。另外,美国商务部的出口管制实体清单、《欧盟两用品出口管制条例》等是需要关注的重点。

目前大部分科技政策、战略规划、指南、基金项目数据,以及全球科技布局与政策等能借助公开渠道获取,可通过网络爬虫方式采集到本地。但在资源的使用过程中应注意资源来源平台对于数据采集的限制、资源版权规定和使用授权。在编制专题数据库、引用和使用相关数据时,应在授权范围内使用。如未获得相应授权,应以购买或合作的方式争取相应授权,以便于对上述资源进行更好的分析和利用。

(3)科技管理与科研投入产出数据。科技管理与科研投入产出数据,对于科技战略情报决策同样至关重要。科技管理数据来源广泛、类型丰富,主要包括科技项目数据、科研人员数据、科研机构数据、科研投入产出数据、管理过程数据等。利用科技管理数据开展分析挖掘,并服务于管理与决策活动,是新时期科技资源高效利用的重要途径[13]。科研投入产出数据是科技管理数据中的一个重要组成部分,也是衡量一个国家综合国力和科技创新水平的重要指标。

在建设支撑战略情报的资源保障体系中,应充分重视科技管理数据资源的积累,积极获取并整合国家和机构层面包括财务、人员、项目,以及经费、预算、国际合作等各类管理信息。同时,加大对全球重要国家和地区、科研机构的各项科技统计数据,包括科研经费投入、重要机构年报、技术交易额、项目获奖、专利申请授权、高新技术企业等资源的采集,如美国科学基金会国家科学与工程统计中心的数据、世界投入产出数据(WIOT)和我国《全国科技经费投入统计公报》等权威数据。

(4)科学领域前沿趋势数据。科学领域前沿趋势数据是直接揭示和评价最新科技成果的重要数据资源,主要包括各类科技情报产品快报、简报、研究报告、评估报告、清单、全球知名智库报告、科技趋势预测、科技创新与社会经济发展指数、科研成果和机构排名榜单、国内外高等教育学科体系。

此类数据资源涵盖范围广,部分内容可以公开获取到相关信息,如Nature Index(自然指数)年度榜单、Gartner重要战略技术趋势、国际组织发布的报告(如世界知识产权组织发布的全球创新指数)等,但部分资源需要通过商业订购才能获取,如《麻省理工科技评论》(MIT Technology Review)、IEEE年度技术预测等,以及一些重要学协会或出版社有关科学突破、科学发现、年度技术预测期刊(如Science Online、ACM Advances in Artificial Intelligence、Annual Reviews、IEE Review、Trends in Chemistry、Nature Reviews等)。

对于需要公开采集的资源,图书情报机构应随时跟踪,掌握资源的更新动态,做到及时获取;对于需要采购的资源,需要在充分评估后考虑纳入资源采购清单,积极发挥国家或机构联盟的采购优势,获得资源的使用授权。同时,还需要对已订购数据库中的资源进行分析,提炼出于科技领域前沿趋势相关的数据,在节约采购成本的同时,充分发挥已有资源的利用价值。

(5)重要人才数据。人才数据对于人才流动预警与监测、人才发现与推荐、国际科研合作等方面都具有重要价值。因此,支撑科技战略情报决策资源保障体系应主要考虑加强对以下数据内容的建设,包括全球重大科技奖项(如诺贝尔奖、美国国家科学奖、MIT全球创新者榜单、菲尔兹奖、图灵奖、中国国家科学技术奖等)获奖人员、国际重要学术会议(如SPIE Fellow、IEEE Fellow)人员信息、两院院士名录、其他主要国家院士名单、国家级科研机构统计名单、重要学术机构在职人员清单、重要科技企业榜单(如福布斯2020全球企业2000强榜、全球创新企业100强名单)、德科集团《全球人才竞争力指数》等。

在数据获取的基础上,还应面向具体需求构建人才信息专题库。方法包括遴选分析来自重要机构名录、全球重大科技奖项、国内外重要学术会议中的人才信息,如姓名、性别、年龄、教育背景、现任职机构、学科领域等,构建海量数据的人才基础数据库,为科技情报决策提供更好支撑。

(6)科研装备设施数据。科研装备设施数据是推动科技创新中所需要的数据资源,特别是在开放科学的环境下,仪器设备成为开放科学基础设施中的重要组成部分。目前欧美等发达国家已经建成了各具特色的科研基础设施和大型仪器等科研基础条件资源体系,在科研基础设施与科研仪器开放共享实践方面积累了较为丰富的建设与运营经验。同时,为提升大型科研仪器设备开放共享的使用效率,国外非常注重开放共享平台的建设[14]。我国为加快推进科研仪器开放共享,进一步提高科技资源利用效率,自2014年起国家、部委层面从整体布局到逐层推进,制定了众多政策文件与实施规范,有效避免了仪器的重复购置,提高了仪器设备的使用率[15]。

在上述背景下,图书情报机构应充分整合、采集国内外大科学设施、大型科学仪器设备信息,服务于我国科研需要。重要数据源包括:国家层面的有科技资源共享服务平台、中国科技资源共享网(escience.org.cn)、国家科技图书文献中心(NSTL)、中国科学院科技大数据知识发现平台;省级平台如首都科技条件平台、上海研发公共服务平台、广东省科技资源共享网平台等;国外知名实验室及大科学装置(研究机构)名单,如美国劳伦斯伯克利国家实验室、麻省理工学院林肯实验室等。

(7)领域关键技术数据。战略情报决策离不开领域关键技术数据的支持,为做好科技战略决策,需要针对不同学科领域获取和集成关键技术数据,如化合物、材料数据、设备、仪器、电子元器件、产品等。

领域关键技术数据具备综合性强、类型分散等特点,获取和分析难度较大。以能源领域战略情报所需的资源为例,重要数据源包括但不限于:BP报告(英国石油公司发布数据报告)、IEA数据库(含二氧化碳排放、煤炭、电力、石油等数据)、美国能源部(DOE)专利数据库Enerdata(含数据嵌入报告,包括世界能源消耗、原油产量、天然气产量、成品油生产、煤炭和褐煤生产、世界用电量、可再生能源风能和太阳能、世界二氧化碳排放等数据)。

上述数据资源,既包括商业订购资源,也包括互联网开放资源。如何根据情报分析需求,对资源进行精准、低成本地订购、采集、整合、分析是该类数据资源建设的难点。建议参考兰德公司的模式,建立面向领域的专题信息库,并在一定的范围内进行数据共享,以支持战略决策分析。

(8)科技舆情监测数据。当前,随着社交媒体的发展,关于科技类的舆情信息在数量和更新频率上都呈持续增长态势[16]。及时、优质的情报是应急决策成功的核心要素,如果不对舆情信息加以快速有效地收集和分析,大量滋生的谣言将会降低情报分析质量,影响科技战略决策。因此,图书情报机构应重视对于科技舆情监测数据的收集和分析能力。

当前重要的科技舆情主要来自一些权威的监测源,包括传统媒体如《纽约时报》《华尔街日报》《华盛顿邮报》《人民日报》《朝日新闻》,还包括一些新媒体,如人民网、央视网栏目新闻频道、喜马拉雅音频新闻、爱奇艺新闻视频、新浪科技新闻、新浪微博等。

目前我国图书情报机构在科技舆情信息监测方面还缺乏系统和成熟的方法,仍需要进一步加强研究与实践的探索。如有学者提出将人工智能的方式引入网络舆情服务工作中,从而更好地解放生产力,提高网络舆情的监测与分析效能和质量,但实际效果还有待进一步检验[17]。

(9)重要的社会经济发展数据。科技创新的目标之一是推动社会进步和经济发展,在开展科技活动的过程中需要大量的社会经济发展数据作为支撑,以明确科技发展方向,提升科技成果的转化率。因此,要充分重视为科研工作者提供权威、丰富的社会经济发展数据。

从目前各类科研机构的需求看,重要的商业经济、法律经济类数据库是需求的重点。具体内容包括全球主要经济发展指标、经济发展规划、碳排放指标、金融市场动态、科技企业发展指标等。数据来源主要包括OECD经合组织数据库,以及国内的中国经济与社会发展统计数据库、国民经济和社会发展统计公报、政府工作报告、全球证券市场金融指数等。其中有一部分数据来源为商业数据库,如MIS全球新兴市场商业资讯数据库、Business Market Research Collection商业市场研究数据库。

此外,图书情报机构还应加强对于各类政策信息资源的利用与挖掘。一方面,各国国家科技信息政策能充分反映本国的重大政策建议、重要前沿研究及重点活动,对科技战略决策分析有着重要意义[18];另一方面,根据我国《著作权法》第五条规定,著作权法不适用于法律、法规,国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文,这就给了相应政策信息更大的利用空间,便于资源的收集和分析。例如,中国科学院文献情报中心推出“科技政策汇”平台,对科技政策进行深度加工、标引、分析和服务。

2.2.3 科学智能与综合多元的工具机制建设

在科学智能的工具建设方面,应建设智能化的数据信息搜集和数据分析工具,从而实现目标信息源的实时监测跟踪和知识内容的快速更新。同时,还需要综合应用深度学习、知识图谱等技术,实现基于数据的快速抽取、实时分析,从而辅助战略决策。

2.2.4 多元化的数据资源获取渠道建设

在综合多元的机制建设方面,应构建多元化的数据资源获取渠道,针对数据资源的具体情况,制定包括采购、采集、数据交换、本地镜像、资源共建共享等在内的多元数据获取渠道。此外,要更加重视数据合作,与国内外政府机构、科研机构及其他智库数据平台开展协同合作,拓展数据资源类型和获取途径。

3 支撑科技战略情报的资源保障体系建设实施方案思考

面向未来,情报工作的战略选择应该重视发展基于数据的情报研究,进而建立以智能情报为核心的决策支持系统,充分发挥情报研究的决策咨询作用[19]。为进一步推动上述设计方案落实,本研究认为应从以下3个方面做好工作。

(1)加强对全球范围内高质量战略情报资源的掌握。在建设科技战略情报的资源保障体系过程中,应重视并持续调研国外高端智库的数据中心,分析其数字资源特点和发展现状,以用于部署我国对于科技战略情报资源的获取与利用。同时,调研国内外智库报告、科技政策文件、市场报告、市场行业数据、年鉴、统计手册、工具平台等数字资源,形成支撑我国智库发展的资源内容体系建设方案,提出资源清单,并研究适应决策流程的智库资源组织方法与利用方式。

(2)提高战略情报资源的获取和服务能力。可从目前广泛关注的智库资源建设入手,试点开展智库资源建设:获取部分智库报告及其相关文档(文献、专利、数据等),采集一定年份的国家科技政策资源,采购一定数量的行业统计报告、年鉴、分析工具等;初步建设智库数字资源发现及服务平台“智库数字资源中心”,实现智库报告、科技政策与文献资源中年鉴、统计报告、专利等资源的关联发现和分析统计。同时,在充分调研科技战略情报资源需求的基础上,加快构建我国科技智库数字资源保障与服务平台,提升智库资源的揭示和服务能力。

(3)加强战略情报资源的权益保障研究。研究现有数字资源权益保障模式与战略情报工作相融合的方式。加强从信息采集、存储、组织、利用各个环节的权益管理规范研究[20]。一方面规避我国对于相关信息资源使用可能涉及的侵权风险;另一方面从对数字资源享有何种使用权益入手[21],促进相关资源发挥更大的社会价值和经济价值。

猜你喜欢
保障体系科技资源
基础教育资源展示
一样的资源,不一样的收获
我国生态安全保障体系的研究
勇立改革开放潮头 创新粮食保障体系
资源回收
ETC关键设备准入标准及运行保障体系构建
关于构建战区联合作战后勤聚合保障体系的思考
科技助我来看云
科技在线
资源再生 欢迎订阅