大数据环境下档案信息资源共享平台的优化路径

2020-12-07 05:56程瑶罗吉鹏
兰台世界 2020年11期
关键词:档案信息资源共享平台优化

程瑶 罗吉鹏

摘 要 在大数据环境下,档案信息资源激增,共享平台面临资源支持不足、管理机构不统一、安全管理存在威胁、共享模式单一等问题。为适应档案信息资源的共享需求,打破信息壁垒,将从资源、管理机构、安全、模式等路径来优化档案信息资源共享平台,以期进一步推动档案事业发展。

关键词 大数据 档案信息资源 共享平台 优化

中图分类号 G270.7 文献标识码 A 收稿日期 2020-04-10

★作者简介:程瑶,浙江中医药大学档案馆助理馆员,硕士研究生,研究方向为档案管理;罗吉鹏,安徽省经济信息中心科员,硕士研究生,研究方向为档案管理。

Abstract Under the environment of big data, archival information resources proliferate, and sharing platform faces many problems, such as insufficient resource support, disunified management agency, security management threat and single sharing mode. In order to meet the sharing demand of archival information resources, break the barrier of information, the archival information resources sharing platform will be optimized from resources, management organization, security and modes aspects, looking forward to further promoting the development of archives undertaking.

Keyword big data; archival information resources; sharing platform; optimization

习近平总书记在十九届中共中央政治局第二次集体学习会上强调推进数据资源整合和开放共享[1],把促进大数据发展上升到国家战略的高度,利用大数据思维和技术去推动数据的共享已成为社会发展的趋势。党的十八届五中全会明确提出“创新、协调、绿色、开放、共享”五大发展理念[2]67-70,其中共享是社会主义的本质要求,新形势下的共享同样涉及档案,将各地海量的档案资源以共享的方式提供给社会使用,是缩小地区、城乡及人与人之间信息不平衡的重要措施,而档案信息资源共享平台的搭建则为社会各主体利用档案信息资源提供保障。

一、大数据与档案信息资源共享平台

1.大数据。移动互联网使得数据量呈指数增长,通过对数据生成规律和内在关联的挖掘,发现其潜在价值,便逐渐形成大数据的概念。“大数据引发观念、社会、商业模式和公共管理等变革,人们将更为重视运用大数据的方法和意识处理面临的新问题”[3]1-4,大数据的价值不在于拥有多少数据,而在于挖掘数据之间的联系以发现社会规律和数据隐性价值。档案事业顺应大数据浪潮,在《全国档案事业发展“十三五”规划纲要》中,写明“‘四个全面战略布局、国家大数据发展战略和‘互联网+行动计划的推进,深刻影响档案工作的理念、技术、方法及模式”[4]14-17,因此大数据环境下更强调运用大數据的思维和技术去释放档案信息资源潜能和激活档案信息资源的潜在价值。

2.档案信息资源共享平台。《全国档案事业发展“十二五”规划纲要》提出“实施开放档案信息资源共享服务工程项目,打造一站式档案信息资源共享和服务平台,为社会提供全方位的档案信息服务”[5]94-97的目标。为此,全国各级档案部门都开始加速档案信息资源共享平台的建设,如“中国开放档案共享平台”开启了历史档案资源共享的新局面。档案信息资源共享平台“是一种基于互联网技术,整合了采集、审核、存储、发布、共享利用功能的软硬件集合”[6]117-121,以丰富的档案信息资源为基础、先进的技术为手段,顺应大数据时代的发展,利用数据规模性效应,满足社会各主体对档案信息资源检索和利用便捷性的要求。

3.大数据环境下档案信息资源共享平台优化的意义。首先,有助于把分散的档案信息资源集中起来,构成完整的档案信息资源体系。受我国“条块分割”的档案管理体制影响,现有的各省、市档案信息资源共享平台呈现出相互割裂的特点,缺乏统一的平台来满足各档案主体跨区域的需求。大数据环境下,利用“云”共享模式则可以集成全国的档案信息资源,优化资源配置,使档案利用者通过“一站式”的平台就能满足自身多元化的需求,在提高利用效率的同时,降低了成本。其次,有助于增强平台的服务能力。服务性是共享平台的根本属性,而大数据的动态性不仅在于数据产生和收集的及时性,更在于通过对利用者利用行为和潜在利用需求的分析,重新对已有数据进行挖掘,并以可视化、量化的结果反馈给利用者,克服当前档案服务存在的不足。

同样有助于实现数据之间知识级的融合。“通过知识抽取获得隐藏在信息资源中的知识因子及其关联关系,进而在语义层次上组合、推理、创造出新知识。”[7]14-20针对部分特殊档案信息资源的共享,是在一定范围内、一定层级上的共享,如涉及高精尖的科研档案,通过对这部分资源的挖掘,重新发现资源之间的逻辑关系,为国家和社会发展的重大决策提供智力支持。

二、大数据环境下档案信息资源共享平台存在的问题

我国现有的档案信息资源共享平台大多是以档案网站的形式进行运作,融入大数据的思维和技术有限。

1.平台缺少足够的资源支持。档案信息资源共享平台所需要的资源可分为共享型资源和支持型资源,共享型资源即已经开放的可为社会所共享的档案信息资源,支持型资源指为了保证档案信息资源的充分共享所需要的资金、人才、设备投入等。

受我国条块分割的档案管理体制影响,各地区的档案信息资源相互隔离、各自封闭,共享也局限在一定范围内,难以实现全国各地档案信息资源的互联、互通、互享。同时,由于共享水平和档案资源开放程度有关,而长期以来,我国各级各地档案部门对保密期限已到档案的开放工作重视不够。上述因素造成共享型资源匮乏,使得共享平台在提供多元化的档案信息资源上受到限制。

在支持型资源上,各级各地档案部门的经费都是由各级财政进行拨款的,因各地经济发展不同,必然造成档案经费的不平衡,如北京市2017年档案经费预算总收入为14367.91万元[8],而海南省仅为2079.93万元[9],如此悬殊的经费支持阻碍了全国档案信息资源共享平台建设的进度。可以说,“成本成为档案信息资源社会共享的关键,如果处理不当,将会成为档案信息资源共享的阻碍因素”[10]59-61。此外,人才的引进和设备的投入也同样制约着档案信息资源共享平台的建设。

2.平台缺少统一的管理机构。档案信息资源共享平台的构建目的在于促进档案信息资源的全社会共享,而这一目标必须在强有力的管理机构的领导下才能又好又快地实现。但现状却是我国档案领域缺少一个统一的大数据档案管理机构来领导各级各地档案信息资源共享平台的建设,各地方建立的资源共享平台均由本级档案部门管理,各自为政,制度标准的缺失使其难以适应大数据环境快速多变的發展。

管理机构的缺失会产生以下影响。首先是“顶层设计”的缺失。制度建设的不健全和组织结构的不合理,使档案信息资源共享平台失去目标清晰的战略框架,各自发展就会形成相互隔绝的信息孤岛,共享始终受到限制。其次是标准化建设落后。“标准化是对档案信息资源各方面建设具有总揽性的前提与基础,也是最亟待解决的实际问题,除此档案信息资源共建共享就无法实现。”[11]92大数据发展已成为国家战略,因此大数据环境下档案信息资源共享平台的建设与优化就一定要有国家标准,否则将制约平台优化。最后是协调机制不健全,包括对内协调各档案部门的利益和对外协调与其他机构间的关系。各级档案部门在开放共享的过程中代表的利益不同,利益冲突难免产生,同时在共享的过程中,档案部门也存在与政府部门、图书馆、博物馆等机构协调的缺失。

3.平台安全管理有待提高。大数据对信息资源共享平台的安全性提出新挑战,“其风险链、风险域和风险度都有了诸多新变化,呈现出隐蔽的关联性、集群的风险性、泛在的模糊性、跨域的渗透性以及交叉的复杂性等特点”[12]。伴随移动互联网技术的发展,移动设备成为信息检索的新方式,这就对档案信息资源共享平台的安全性提出新要求,在保证档案实体和档案信息内容安全的基础上,还要保证档案利用主体的个人隐私安全。

大数据环境下,档案信息资源共享平台更容易暴露在高危的网络系统中,数据共享的风险性大大提升。档案信息资源不同于一般的信息资源,具有极高的保密性和利用价值,但目前档案部门在硬件投入、软件开发、传输网络等方面与其他部门并无太大差别,再加上档案部门自身安全意识仍不够强,使共享平台的安全风险不断上升。共享平台对档案信息资源数据化的挖掘离不开数字化的发展,而在纸质档案数字化的过程中,大部分档案馆选择将数字化业务进行外包,外包也存在威胁档案实体和档案信息内容安全的风险。数字化过程中涉及档案的拆卷、订卷等环节,如有不慎易发生破坏档案的操作,对于历史档案来说,这种破坏是致命的。同时,外包公司的数字化加工人员对涉密档案内容的泄露也将严重影响共享平台的安全性。

4.平台共享模式单一。档案信息资源共享平台所遵循的共享模式关系到档案部门能否通过对馆藏档案资源的整理、加工、分析来满足档案用户多元化和个性化的需求。多元化是我国社会发展现阶段的主要特征之一,全国各级档案部门为满足用户多元化和个性化的利用需求,在加快自身馆藏资源建设的基础上,努力实现馆藏结构的多元化,包括民生档案、名人档案、地方特色档案等纷纷进馆。但多元的馆藏资源却始终满足不了用户多元化的利用需求,症结在于平台单一的共享模式。现有的平台共享模式表现出高度的分散性、封闭性和单一性,缺乏行业内部和行业外部之间的合作,不能有效地把各地区共享平台的档案信息资源串联起来形成整体,同时出现重复建设、资源浪费。

三、大数据环境下档案信息资源共享平台的优化路径

1.资源优化。大数据伴随“大档案观”,档案信息资源呈井喷式增长,包括结构化、半结构化和非结构化数据,利用大数据技术对分散的档案信息资源进行集成,再进行分析处理挖掘,最后再提供利用,是资源优化的主要思路。面对分散且相互隔绝的档案信息资源,构建“档案信息资源共享云平台”,利用云计算技术优化资源,“是一种通过大量的分布式计算机上或远程服务器中,按照互联网运作模式将资源能够切换到所需要的应用上,并根据需求访问计算机和存储系统的网络资源共享模式”[13]。先利用“资源层”对分散且可以共享的档案信息资源进行集中,按照不同的类别自动筛选,存储在统一的服务器中,利用“管理层”对资源进行降噪处理,提高资源的质量,结合数据挖掘技术对资源进行分析,实现知识级的优化组合,最后通过“服务层”提供档案信息资源的查询、检索、咨询等功能。同时要加速对已过保密期的档案开放,开放性是大数据时代的重要思维,档案保管部门不能再将档案视为部门之物,只有走社会化共享的道路,档案的价值才会实现。

2015年颁布的《促进大数据发展行动纲要》明确表明要“强化中央财政资金引导”,档案经费主要来源于各级财政支持,档案信息资源共享平台是大数据环境下促进资源共享的主要媒介,发展却受困于资金限制。因此,各级财政可拨付专项资金用于应对大数据时代档案信息资源共享平台的优化需求,同时人才的引进、设备的投入也会产生连锁的优化效应。

2.管理机构优化。为适应我国“统一领导,分级管理”的档案管理原则和大数据在逻辑上高度集中、物理分布上相对分散的特点,对现有的管理机构进行优化,可在国家档案局下成立档案大数据管理部门,负责包括档案信息资源共享平台优化在内的所有与档案大数据相关的工作。

大数据环境下,档案大数据管理部门首先要加快“顶层设计”。大数据与档案的结合发展涉及的一系列问题需要完善的法律法规体系来约束。档案信息资源共享的过程涉及多方利益,只有捋顺权责关系并以法律条文的形式确定下来,档案大数据部门的权威才能确定,档案信息资源共享平台的优化才能持续开展。同时,对《档案法》修订也应把与大数据相关的内容补充进去,完善《档案法》,发挥《档案法》与时俱进的效力。其次,关注标准化建设。大数据时代,数据的来源、属性、格式不同,用于数据处理的技术设备与标准也存在差异,标准化的建设就显得格外重要。如,浙江省的档案信息共享平台和广东省的档案信息共享平台在标准化上就有诸多不同。故档案大数据部门要结合国家大数据发展标准,制定出适应本行业的统一标准,各级档案部门据此优化档案信息资源共享平台,推进各地档案信息资源融合共享的速度。最后,可通过下设档案大数据协调与指导委员会,对档案信息资源共享平台中涉及的多主体进行利益协调,加强与政府部门、图书馆、博物馆等拥有信息资源的机构的沟通,争取跨界的资源共享,为平台的优化提供建议。

3.安全优化。档案信息资源共享平台的安全优化既关系到档案信息资源的实体安全和信息内容安全,也关系到共享平台在高风险的网络系统中能否可持续运行。

首先是安全意识优化。档案主管部门要树立档案信息资源区别于其他信息资源的意识,加强对档案部门使用的硬件设施和软件设备的投入,利用新技术应用于网络传输系统的安全,如量子通信技术在重要档案信息资源传输中的应用,强化工作人员的安全意识和责任心,定期培训考核。其次是用户隐私数据的安全优化。档案信息资源共享平台不仅涉及档案数据、业务活动数据,还包括用户隐私数据,用户隐私数据在传输的过程中应进行技术加密,提高传输过程中的安全性。档案信息资源共享平台可使用GUID(Globally Unique Identifier)为密钥对用户数据进行加密,“在每个用户的账户通过审核后,会为其自动分配一个GUID,用户在后继的数据请求中,模型会自动将用户的GUID作为密钥进行信息传输”[14]25-28,确保用户隐私不被随意获取。最后是档案数字化的安全优化。纸质档案在数字化过程中要遵守《纸质档案数字化技术规范》,严格按照规范中的标准对纸质档案进行扫描,避免对案卷实体造成破坏。对已完成数字化的档案,必须经过安全检测,包括质量抽查、数据检测、数据利用检测,为日后的数据化利用打下基础,保证每卷档案都是安全可用的。

4.模式优化。针对全国档案信息资源共享平台发展不平衡的局面,一方面可采取“统—分—合”模式。“统”即由国家档案局统一规划,自上而下遵守统一的制度和标准,包括大數据环境下档案资源共享平台的政策法规、技术标准、软硬件设备、数据格式、元数据标准等,统一的制度和标准是共享平台优化的前提。“分”即根据省、市、自治区档案信息资源共享平台发展进度的不同,允许错落发展,但在优化的过程中要遵守“统”的原则,先进的地区要帮助落后的地区,也体现共享的本质。“合”即各区域档案信息资源共享平台的优化都达到国家标准之后,在“统”和“分”的基础上再高度整合,使全国档案信息资源共享平台形成互联互通、高度统一的格局。

同时为了使得全国档案资源价值最大化,可进一步构建档案联盟模式。在国家档案局的领导下,由全国范围内各级档案管理部门、档案学会、各类档案馆、档案高等教育机构、档案外包公司等组成联盟,以档案信息资源共享平台为媒介,旨在促进档案信息资源共享。大数据环境下的档案信息资源体量大、种类多、速度快、分散,单靠各级档案部门难以在短时间内达到资源共享的目的。档案联盟一方面是各省、市、自治区等档案行政管理部门实现的纵向联盟,另一方面是档案行政管理部门、档案学会、档案高等教育机构、档案外包公司、各类档案馆等实现的横向联盟。成员多元化、专业化、技术化,可发挥自身的优势来促进资源共享。具体而言就是,档案行政管理部门发挥领导作用,有制度颁布、标准制定、政策导向的作用;档案学会有号召宣传的作用;档案高等教育机构为共享平台的优化提供智力支持;档案外包公司提供大数据技术支撑。由此可见,档案联盟模式对打破区域间、部门间、馆际间的资源隔阂,消除信息孤岛、优化档案信息资源共享平台具有积极意义。

参考文献

[1]习近平.实施国家大数据战略加快建设数字中国.http://www.81.cn/dblj/2017-12/09/content_7861128.htm.

[2]韩振峰.五大发展理念是中国共产党发展理论的重大升华[J].思想理论教育导刊,2016(1).

[3]张维明,唐九阳.大数据思维[J].指挥信息系统与技术,2015,6(2).

[4]国家档案局.全国档案事业发展“十三五”规划纲要[J].中国档案,2016(5).

[5]闫琪,张晓华,李海峰.档案信息资源共享平台与数字档案馆(室)建设现状及相互关系研究[J].档案学研究,2017(2).

[6]王烁.大数据时代档案信息资源共享平台建设研究[J].图书情报导刊,2016,1(12).

[7]周耀林,常大伟.国家重点档案信息资源融合及其实现策略研究[J].档案学研究,2018(2).

[8]北京市档案局2017年预算情况说明.http://www.bjma.gov.cn/bjma/300478/301148/301211/320837/index.html.

[9]2017年海南省档案局部门预算.http://archives.hainan.gov.cn/web/default/default_article.jsp?menuId=M2Q5OThkZDItNjc2Ni00YmFiLWJhYTUtODhjNmNkYzY4YzI2&articleId=ZjVkZGVhNTAtNWUwYS00YjQwLTliMDQtZWM5ZjVlOGUzNjgy&org=sdaj.

[10]张静华.我国档案信息资源从“独享”到“共享”转型的路径探析[J].山西档案,2017(2).

[11]刘玉波.档案信息资源共建共享机制建设问题刍议[J].黑龙江档案,2015(1).

[12]王世伟.大数据与云环境下的信息安全[N].文汇报,2013-10-28.

[13]中国云计算网.什么是云计算[OL][2009-7-21].http://www.cloudcomputing-china.cn/Article/jh/200805/1.html.

[14]卞咸杰.基于WCF技术的档案信息共享平台数据传输模型设计与实现[J].档案管理,2016(2).

猜你喜欢
档案信息资源共享平台优化
营商环境五方面持续优化
优化英语课堂教学策略的探索
促进学生认识发展 优化初中化学复习
档案信息服务创新的内驱力研究
档案信息资源开发主体多元化理论探析
中企搭乘“共享平台”好出海
科学数据共享平台的建设与服务探讨
高校大型仪器设备共享平台构建与运行管理探讨