区块链视域下档案信息资源的整合路径研究

2022-07-28 05:54贾文溪张军堂马晓洁
石家庄学院学报 2022年4期
关键词:加密区块节点

贾文溪,张军堂,马晓洁

(1.石家庄学院 a.党政办公室;b.信息中心,河北 石家庄 050035;2.石家庄市中医院 人事处,河北 石家庄 050000)

一、区块链技术及档案信息资源整合

(一)区块链技术的内涵

区块链的概念方兴未艾,目前已步入区块链3.0时代,即可编程社会,所有可记录的档案信息都可以上网、上云、上链,随着技术的创新和发展,在社会生活各方面都产生了较为广泛而深远的影响。

狭义上讲,它可称为一种分布式账本,一种链式的数据结构:即链上的每个数据区块(单元)按照时间顺序依次相连,它的不可伪造和不可篡改性以密码学的方式保护,并且区块链可以同时存储在多个节点上。从广义上讲,它是一种先进技术的代表,是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。[1]“区块链”可以从技术角度(数字时间戳、共识机制、非对称加密)、载体方式(存储方式)、数据库、运行过程等不同角度理解,具有开放性、去中心化、可追溯、不可篡改及匿名性的特征。本文采用的是区块链的广义概念,着眼于区块链多种技术组合在档案信息资源中的实际应用。

(二)档案信息资源整合的必要性

档案是社会组织或个人在以往的社会实践活动中直接形成的具有清晰、确定的原始记录作用的固化信息。档案的本质属性是原始记录性,因而档案可以还原历史的真实状况,具有较高的参考价值与法律效力。档案信息来源广泛、形式多样、结构复杂、数量膨胀、价值多元、深度共享,是国家重要的战略性信息资源,蕴藏着巨大的潜能价值,在塑造政府形象、治理国家现代化、整合社会资源、提升公共服务、优化发展政策等各个领域中发挥着基础信息支撑作用。

基于区块链的档案信息资源整合不仅是一种观念上的变革,更是一种全新的数据整合模式,能够促进档案管理部门结构的扁平化,有力推动档案部门的职能转变和角色转换,提高档案信息的透明度和开放度,同时有效保护档案信息的数据安全和用户的隐私安全,提升信息共享效率,推动信息价值的深挖互联,关乎社会的进步和人类文明的传承。

二、区块链适用于档案信息资源整合的可行性

目前档案信息资源面临着数据收集困难、中心化存储及整合率低、安全性差、信任度低、隐私保护难等问题,而区块链技术的开放性、去中心化、可追溯、不可篡改及匿名性与实现档案信息整合有浑然天成的契合点,可以有效弥合这些不足,推进档案信息资源的整合利用。(见表1)

表1 区块链技术适用于档案信息整合的对比

(一)多点收集,去中心化存储

多点收集、去中心化是区块链最重要的特征之一。首先,在多点收集、去中心化的过程中意味着点对点平等、多主体治理、多中心参与、信息对称、档案数据自治等功能的逐渐实现,改变了档案部门在档案信息整合中的主体中心地位。而且很好地重视了档案的第一价值,即通过元数据多点捕获对形成者的价值有了较为全面的记录和保存。其次,可以根据用户的具体需求实现在链上的访问、检索、查询等功能,逐步实现多主体多中心参与,有利于促进档案信息资源的共建共享。最后,通过点对点的方式对档案信息整合中各主体和节点的权责划分,并非所有主体权责均等,而是一方面要发挥档案部门的“元治”角色,另一方面要不断吸纳社会力量,保证档案信息整合的有序进行。

值得注意的是,这个阶段的信息与服务对象、保存场所、管理形式之间交错穿插,因此,档案的集中化管理、保密特性及业务的职业本能与区块链技术的“去中心化”“相对信任”之间的“矛盾”更为突出。再者,环境及技术的复杂不仅会使传统的档案业务发生颠覆性的改变,如传统档案中的“鉴定”“销毁”环节在不断弱化,综合性、系统性更强的档案利用、个性化智能服务在不断增强,并且由于文件的价值形态、存储结构方式、管理主体等方面的变化,使得区块链环境下档案信息资源整合的范围和内容都在不断扩大,工作环境愈加复杂,因此对档案管理部门和相关人员也提出了更高的要求。

(二)加戳加密,共识机制

安全是档案信息整合的前提和生命线。目前,档案信息面临着信息泄露、滥用数据、病毒侵染、隐私侵犯、黑客攻击、缺乏安全共享渠道等风险。区块链的时间戳可以用于标识某一时刻的时间,具有相对唯一性。时间戳不仅在档案信息整合中增加了一个时间维度,同时也增强了档案数据的可读性,保证了档案信息的真实性、可靠性,从而成为一种存在性的证明。共识机制则是为了防止数据伪造和篡改,利用共识算法保证上链数据的不可篡改。通过保障各分布式节点数据在充分信任的状态下进行,实现档案信息的自信任和集体信任,从而进一步加快档案信息整合的进程。

借助加戳加密、共识机制、非对称加密等技术,有助于实现档案部门、民众和社会机构之间良好的合作秩序和基于区块链形成的信任体系,并通过深度对话、有效沟通,降低隐私安全担忧,提升安全防护能力,从根本上夯实档案信息整合的信任基石。

(三)类型多样,数据挖掘

区块链的类型可以按照开放程度的不同分为私有链、公有链和联盟链,根据对接类型则可分为为单链、侧链以及互联链。多种类型的选择和多链的配合有助于提高系统的可靠性、改善系统扩展性,有效缓解档案信息整合中存在的数据分散、信息孤岛、数据流通难等问题,从而提高档案信息整合的的共享程度。

多链配合、大数据挖掘给档案信息的整合及开发利用带来了诸多便利,但是目前我国相关制度与法规、相关标准规范尚未健全,对区块链驱动档案信息资源整合的探索较为分散,各地相关机构对区块链的研究常常“各自为政”,容易造成资源的浪费和重复建设;另外,由于我国档案管理的模式长期以来都是中心化的方式,第三方中介机构介入较少,缺乏监管经验,在区块链分布式账本突破地理界限、强调用户个人信息、利用信息保护的同时,对于密级较高和特殊种类的档案来说,一旦利用者和档案管理部门产生法律纠纷,监管和责任认定存在一定的困难。

三、区块链视域下档案信息资源整合的路径

文件生命周期理论是在20 世纪文件数量急剧增长的专业背景下提出的。文件生命周期理论的基本内容主要可概括为三点:第一,文件从其形成到销毁或永久保存,是一个完整的运动过程;第二,文件的整体运动过程由于价值形态的变化可划分为若干阶段;第三,不同阶段的文件与服务对象、保存场所、管理形式之间存在内在的对应关系。[2]这个理论在电子文件时代,对于区块链视域下的档案信息资源整合仍具有参考性和适用性。通过结合文件生命周期理论,区块链视域下的档案信息资源整合路径如下:

(一)信息形成阶段——元数据捕获、私有链记录

在信息形成阶段,主要是捕获真实完整的元数据,并以私有链的方式记录。首先根据相关的标准规范和智能合约,将不同种类的元数据信息收集到智能合约中,并进行初步鉴定;其次,对于有一定保存价值的信息由产生部门获得的公钥对其加密,同时提出存储请求;最后通过共识机制把信息封装成新的区块,存储在区块链中,并以各个部门为节点组成一条私有链。各部门之间的档案信息往来均发生在区块链上,且每次处理的行为轨迹均被区块链所记录。存储信息的区块可分为区块头和区块体,封装的区块头包括:前一区块地址、当前版本号、时间戳、当前区块的目标哈希值等;区块体则包括元数据信息及相关描述信息。(见图1)由此捕获并存储的信息可追溯、不可更改、可验证,因而很好保障了档案信息收集过程及捕获内容的真实完整。

图1 信息捕获存储流程图

在信息形成阶段,尤其是信息形成前,强化顶层设计、达成共识理念尤为重要。目前区块链的核心技术逐渐成熟,但在安全性能、大数据冗余、隐私保护、技术升级等方面也面临着诸多挑战。如何运用技术对档案信息资源整合并进行顶层设计是首先要面临的问题,它的实现必须依靠强有力的执行、规范的操作、充沛的资金等方面的保障。虽然共享系统链上的主体权限不同、功能需求不同,但应达成共识理念,捋顺职责功能。学界不仅要积极探索新技术应用的可能性、可行性及必要性,还要摸清区块链技术发展的规律,并指导理论应用;档案部门要不断探索区块链技术与档案信息整合的契合点和结合方法,在实践中完善,顺势而为,顺势有为。

(二)信息流转阶段——加戳加密,跨链共识

区块链涉及到的安全技术主要包括数字摘要算法、数字签名以及加密算法。在信息流转阶段,通过物理归档或逻辑归档的档案信息,需要通过区块链技术加戳加密,确保私有链中元数据信息的真实、完整、有效。随后,通过跨链技术将私有链中需要移交的元数据信息向联盟链移交,它的具体过程是:首先在联盟链的智能合约中约定好所需要存储的元数据类型,其次当通过跨链技术、共识机制触发智能合约启动时,随机的密钥会对档案对象进行加密,然后将整合的档案存储对象(包括哈希值、指纹等其他属性)加密后存入集群,同时对档案馆身份、档号、档案对象的哈希值、档案指纹等信息进行签名,通过调用合约从签名中恢复公钥信息并进行对比,根据智能合约判定信息是否在保存范围内,不属于保存范围的元数据,会被驳回存储请求;属于保存范围内的元数据,会通过存储请求,自动公钥加密并将这些信息存储在联盟链中,添加档号与摘要等信息的映射,从而实现信息的流转。

在这个阶段,信息流转频繁。企事业单位及其他部门通过私有链结合到一起,联盟链和私有链的结合点为档案部门,各个档案部门又通过联盟链与档案馆结合在一起。(见图2)为了确保流转过程中的数据安全,共识机制、数字时间戳及加密技术尤为重要。共识机制是在信任的状态下进行各分布式节点间的数据共享,实现对存储数据所有节点的共同维护。而时间戳形成的时间链不仅仅是一种存在性证明,增强了信息的可读性,更重要的是时间维度的存在可以保证存储在区块链中的档案信息具有很高的可追溯与可验证性,任何异动的发生都会产生相应的时间记录,有效避免了某些人为因素导致的信息泄露与盗取风险;加密技术主要指的是基于哈希算法的非对称加密算法,以对应的公开密钥和私有密钥组成加密方法分析档案信息的数据特征,对相关涉密信息和隐私信息进行加密,从而确保档案信息的数据安全,降低流转过程中存在的隐私安全。

图2 联盟链和私有链结合图

在信息流转阶段,无论是私有链还是联盟链,角色管理与权限控制都是非常重要的环节,关系着档案信息在各个服务对象之间的流转顺利。它的内容主要是基于角色的权限控制,根据信息价值形态的变化、服务对象的需求、保管场所的差异一般可分为系统管理员、档案管理员、一般用户、黑名单用户。系统管理员可以对系统进行相关设置,同时对用户开展管理;档案管理员具有相对完整的管理权限,能够实现对档案信息的录入、检索、调用等,同时还可以审核普通用户的注册申请和借阅传递申请。一般用户可以通过注册查询和查看档案,同时可以通过提出借阅和验证申请来获取档案信息。

信息流转阶段,各个节点相互交错,技术应用繁杂,各种关系复杂,因此必须依靠法治建设,形成长效机制。档案部门要紧跟相关国际、国家标准,不断加强区块链技术应用于档案信息整合的标准体系建设,包括基础标准、方法过程标准、应用标准、安全标准、技术标准、操作标准等,验证标准适用性,规范标准流程性,完善档案信息数据的治理。同时,还要形成长效机制,在私有链中建立收集、存储、管理的多主体整合融通、协同互动机制,在联盟链中建立平等协商、信息共享、准入退出、利益平衡等长效机制,在公有链中建立共同协商、监督维护的共识机制等。

(三)信息开发利用阶段——多链配合、大数据挖掘

档案信息共享利用一般是在联盟链内部或联盟与外部用户之间通过智能合约、IPFS 及混合加密机制实现的。联盟链中的节点包含节点上的信息及节点外的信息。对于节点上的操作过程、利用痕迹都会被直接存储在联盟链上,留痕且可追溯、匿名且不可篡改。节点之外一般为普通用户,普通用户的操作流程为:首先用户根据需求提出申请,随后通过身份验证,链下为用户提供档案信息(版本号、档号、时间、操作管理员、附件等)并记录相关利用的利用者、利用时间、利用内容等信息,随后在智能合约中将这些需要存储到联盟链中的信息类型记录,通过执行链上的智能合约,对利用的相关信息经过档案馆公钥加密,并通过共识机制记录到区块链中。通过私有链和联盟链的连接,链上与链下的配合,联盟链与联盟链的对接,实现对档案信息的处置、保管、利用,对有价值的信息进行有效整合。(见图3)

图3 区块链信息流转流程图

区块链的去中心化功能可以让用户根据自身需求在区块链上访问、查询、获取档案信息,从而改变档案部门在档案信息开发利用中的绝对中心地位,实现在开发利用档案信息过程中信息对称、点对点平等、多主体治理、多中心协同参与,提高档案数据利用效率和共享效能,重建多元共治、多元共享的良性格局,重塑档案管理部门、社会、民众之间的良性互动关系。值得注意的是,信息领域的变革在文档工作的发展过程中具有原发作用,科技的进步与社会的发展离不开人才的培养,要想在未来的信息时代掌握主动权,技术人才是关键,管理人才是核心,复合人才显光芒。无论是管理上的统筹谋划、顶层设计、战略规划,学术上的宏观指导与理论突破,还是技术上的攻坚克难、持续创新,都必须加大人才的培养力度。

这是一个人类传播媒介手段日趋丰富的时代,也是人体的信息功能日益外扩、体外化信息系统逐渐获得相对独立性的过程。在档案用户需求多元、多样、迫切的大数据时代,要立足社会信息资源共建共治共享理念,打破数据壁垒,推动档案信息的开放共享、深挖互联、跨界流动和价值发挥。推动区块链技术应用于档案信息资源整合的落地生根,优化档案信息共享环境,实现档案信息的个性化、社会化、智能化发展。

猜你喜欢
加密区块节点
CM节点控制在船舶上的应用
一种新型离散忆阻混沌系统及其图像加密应用
基于AutoCAD的门窗节点图快速构建
区块链:一个改变未来的幽灵
概念格的一种并行构造算法
区块链:主要角色和衍生应用
一种基于熵的混沌加密小波变换水印算法
区块链+媒体业的N种可能
读懂区块链
加密与解密