电子档案转换与迁移活动的内涵与实施

2019-12-16 20:12毛海帆江西省档案馆中国人民大学电子文件管理研究中心
浙江档案 2019年1期
关键词:可用性完整性术语

毛海帆/江西省档案馆、中国人民大学电子文件管理研究中心

转换和迁移活动贯穿于电子档案管理全过程,成功与否关系到电子档案的长久保存,也是电子档案真实性、可靠性、完整性和可用性的重要保障。近年来,我国档案界对电子档案迁移与格式转换作了相关研究,形成了一系列成果;出台的相关重要标准也对转换和迁移术语也进行了界定,并对两大活动提出了基本要求。但是,由于标准适用范围不同等客观原因导致术语定义存在着差异,电子档案转换和迁移的实际操作程序与要求还有待进一步明确和细化。为此,本文以国内和国际上重要的标准为基础,通过对相关定义、基本要求进行解析,结合电子档案管理实际情况加以归纳和总结,以便为电子档案管理过程中的转换与迁移实践提供可操作的参照。

1 重要标准及适用范围

2001年以来,国内外相继发布和实施了多个涉及电子档案转换和迁移的重要标准,定义了转换与迁移术语,并对转换和迁移活动的实施给出了原则性要求,主要包括5项国家和行业标准、3项国际标准。国内5项标准分别是《电子文件归档与电子档案管理规范》(GB/T18894-2016)、《电子档案管理基本术语》(DA/T58-2014)、《信息与文献 电子办公环境中文件管理原则与功能要求》(GB/T 34840)下包含的三个具体标准(包括概述和原则、数字文件管理系统指南与功能要求、业务系统中文件管理指南与功能要求)。国际标准化组织的3项标准包括《数字档案转换和迁移过程》(ISO 13008/FDIS:2012(E))、《信息与文献 文件管理体系:基础与术语》(ISO 30300:2011)、《信息与文献 文件管理 第1部分:概念与原则》(ISO 15489-1:2016)等。

根据标准适用范围的不同,定义的转换、迁移术语涵盖面有大小之分,转换与迁移活动应遵循的原则或实施前提有所不同。GB/T18894-2016是针对电子档案进行转换、迁移的术语定义,明确原则与要求,具有针对性,且同时适用于机关和综合档案馆的电子档案转换与迁移活动。13008/FDIS:2012(E)是关于电子档案转换和迁移的专门标准,明确说明不适用于模拟格式向数字格式的转换。ISO30300:2011、ISO15489-2016等标准是文件管理宏观层面的重要标准,其关于转换、迁移术语的定义,将纸质等传统载体和计算机存储载体、模拟格式和数字格式纳入其中,这决定了术语含义和实施原则所规范的对象更为宽泛,如果不加区分完全按其要求开展电子档案转换、迁移活动,恐有不严谨之处。

2 电子档案转换、迁移的对象与原则

2.1 电子档案转换与迁移对象

当管理、存储电子档案的数字档案馆(室)应用系统、存储系统等要停用或更新换代时,或者出现要将两个或以上应用系统的电子档案、元数据整合在一个系统中的需求时,都要从源系统将电子档案及其元数据读出再写入目标系统中,这便是电子档案的迁移。上述各项标准在迁移术语中均将电子档案定义为迁移对象,不同的是,根据电子档案真实性、可靠性、完整性和可用性保障要求,GB/T18894-2016、ISO 13008/FDIS:2012(E)两个标准将电子档案元数据也列为迁移和转换对象。

根据长期保存要求将电子档案由当前格式(即计算机文件格式)转换为长期保存格式,比如将电子档案由WPS格式转换为PDF/A格式、XML格式等,是维护电子档案可用性的重要措施,前述各项标准的转换术语中均包括了格式转换。通过ISO30300:2011等标准的术语可看出,其定义的转换对象仅有格式一种。GB/T18894-2016、GB/T 34840.3-2017、DA/T58-2014等三项标准的转换术语还将载体(存储载体)定义为转换对象。

各项标准转换术语定义了既相同又不同的转换对象,源自标准各自的适用范围。在电子档案保存期间,至少备份活动存在载体转换需求,比如将备份设备由物理带库变更为蓝光光盘库或者反之,将已达到三级预警线的光盘中的电子档案及其元数据转存到另一种离线备份介质之中,而且转换成功完成后,源备份系统或源离线备份介质需要予以销毁。这是GB/T18894-2016等标准将载体定义为转换对象的缘故。ISO30300:2011等标准适用于纸质等传统载体档案,在其管理过程中不可能把档案原件的纸张转换为其他载体,通过数字化生成纸质档案数字副本后,也不可能将纸质档案原件予以销毁,故不可能把记录载体纳入其转换术语之中。

综上所述,根据电子档案管理实际和标准的定义,电子档案转换对象包括存储载体、格式和元数据等三种,电子档案迁移的对象则包括电子档案及其元数据等两种。

2.2 电子档案转换与迁移原则

GB/T18894-2016、ISO 13008/FDIS:2012(E)等两项标准均明确实施电子档案转换与迁移必须以维护电子档案的真实性、可靠性、完整性和可用性为前提或目的,这即是电子档案转换与迁移的原则。实施电子档案转换或迁移的动因是某类软硬件系统生命周期完结,或做技术更新换代,或者当前格式不符合长期保存要求,即将失去技术维护、面临淘汰的危险等,转换或迁移活动结束后,依据授权要将存储于源系统、源存储介质或源格式中的电子档案及元数据彻底清除。此时,已经存储在目标系统或计算机文件格式中的电子档案如果不具备真实性、可靠性、完整性和可用性,可以直接判定转换或迁移活动不成功。

DA/T58-2014、ISO15489-1:2016、ISO30300:2011等标准在定义转换、迁移术语时,明确的前提是档案原有信息不变或不改变电子档案的格式,这一要求只能满足电子档案管理的部分需求。如果以它为指导,则转换和迁移过程是否可靠、电子档案存储使用的新格式是否符合长期保存要求、电子档案及其元数据是否一一对应和是否记录了转换过程等,都存在不确定性。此外,笔者对迁移活动不得改变文件格式的前提存疑。比如数据库类电子文件,不同厂商或品牌的数据库文件格式从后缀名到内部存储结构等都存在不同程度的差异。ISO30300:2011在迁移定义中给出的将数据库文件从Oracle数据库管理系统转移到SQL Server数据库管理系统的示例,其结果已经改变了文件格式,前者的文件格式后缀名为.DBF或.ORA,后者的文件格式后缀名为.MDF。如果将数据库文件从关系型数据库迁移到NoSql数据库(即非关系型数据库)中,二者存储电子档案的编码标准、格式名称等具有更大的异构性。所以,对于采用数据库文件格式存储的电子档案,仅要求转换、迁移后保持其原有内容信息或格式不变是不能满足电子档案管理需要的,必须以保障电子档案的真实性、可靠性、完整性和可用性作为转换和迁移活动的原则。

3 电子档案转换与迁移的“四性”保障与程序

3.1 转换与迁移全程的“四性”保障

GB/T18894-2016第10章第2节、第9章第5节主要用于规范电子档案转换和迁移活动,再次明确了在转换或迁移全程维护电子档案真实性、可靠性、完整性和可用性的原则,列举了实施转换和迁移的主要动因,对转换和迁移程序(八个步骤)、源电子档案及其元数据的处置、台账登记和管理过程元数据采集等提出了基本要求,并向标准使用者推荐可参照的国际标准——ISO/FDIS13008:2012(E)。鉴于标准处于上位和篇幅控制等原因,GB/T18894-2016没有对程序的每一个步骤给出进一步要求,ISO/FDIS13008:2012(E)提出的各项管理要求是可以参考和借鉴的,该标准重点强调要根据组织机构及其业务框架确定转换和迁移的实施要求,要编制转换或迁移规划(业务需求、行政管理需求和技术需求等),要建立转换或迁移程序,控制风险,记录过程元数据,在转换或迁移前、后应分别进行测试、验证,并进行全程跟踪等。

结合GB/T18894-2016等标准明确的要求和具体实践,在转换和迁移活动中保障电子档案真实性、可靠性、完整性和可用性,要融合管理和技术等方面的要求予以实施,主要包括四方面措施:

第一,建立并落实管理制度。要明确职责与分工、实施程序、安全保障、档案管理、保障措施等,涉及技术、业务、财务、采购、纪检、保密、后勤等职能部门。

第二,明确并有效执行规定的程序。GB/T18894-2016所述程序包括八个步骤,即确认转换或迁移需求、评估转换或迁移风险、制定转换或迁移方案、审批转换或迁移方案、转换或迁移测试、实施转换或迁移、评估转换或迁移结果、报告转换或迁移结果。

第三,全程监控与检查。转换或迁移项目实施主要责任部门要依据制度、实施方案等,对转换或迁移测试、实施转换或迁移、评估转换或迁移结果等步骤进行全过程监控、督查,及时处理出现的问题,保证项目顺利实施。

第四,整理并归档保存过程记录台账。规范转换或迁移台账管理,目的是为经过转换或迁移的电子档案的真实性、可靠性、完整性和可用性提供证据,使过程可回溯、可查核。每个步骤的主要情况、结果、责任信息、时间等都应记录,转换或迁移活动完成后要整理、归档。GB/T18894-2016附录A提供了可参照使用的电子档案离线存储介质管理、格式转换与迁移登记表样式。对于格式转换,应通过管理过程元数据,以全自动在实施转换的应用系统中予以记录。

3.2 转换与迁移程序

根据项目的实际情况,完成转换、迁移程序有时耗时较长,各步骤的执行不一定紧密相连,应根据实际予以掌控。依据存储载体转换项目的规模和复杂程度,对八个步骤可以作适当取舍,一旦确定必须认真执行。比如,需转换的电子档案及其元数据离线存储介质数量不多时,可以根据实际情况考虑免去制定转换或迁移方案、审批转换或迁移方案等两个步骤,由主要责任部门,即信息化部门直接确定计划并执行即可。

第一步,确认转换或迁移需求。转换和迁移动因出现后,对源系统及其技术架构、设计文档、格式、电子档案及元数据数量等,从标准化程度、技术支持及开放度、转换或迁移对象的范围与规模等作进一步调研、检测和论证。确需实施,则提出拟用技术、软硬件设备和测试环境、安全保障、采购、经费等需求。对于重要的格式转换、在线存储系统转型、近线备份系统转型、应用软件及基础软件更新升级等项目,程序的启动可以提前到设计、论证阶段,同步跟进调研转换或迁移的经费、技术、基础设施等的需求。

第二步,评估转换或迁移风险。主要从三个方面进行安全风险评估,包括:拟采用技术的标准化程度及可靠性、兼容性和安全性等;转换或迁移环境的安全与可用,包括网络、场地、供电、计算机病毒防范、人员管理等;转换或迁移保障条件,包括职责落实、专业技术人员配备、经费等。

第三步,制定转换或迁移方案。结合前两个步骤工作成果,编制转换或迁移方案,明确动因、源系统及转换或迁移对象情况、目标、技术路线与架构、安全风险管控、采购与经费需求等。对于重大的转换或迁移项目,应组织相关专家对转换或迁移方案进行论证。

第四步,审批转换或迁移方案。将转换或迁移方案提交单位领导审批,通过审批后即可开展采购、系统建设、人员培训等一系列工作中。

第五步,转换或迁移测试。在正式开始转换或迁移前,在目标系统中或按照预定的方法,采用不同数量级的电子档案及元数据进行操作、验证,直到确认可行性。

第六步,实施转换或迁移。通过测试后,正式实施电子档案、元数据的转换或迁移,并紧密监控。

第七步,评估转换或迁移结果。转换或迁移过程完成后,可对结果进行评估,形成评估报告,如有必要可进行第三方检测与评估。应依据方案、采购需求等,对目标系统中的电子档案及元数据进行评估,包括:电子档案及元数据数量,电子档案及元数据内容信息真实性与完整性,计算机文件格式,正确呈现与检索、利用,电子档案内在的历史联系,电子档案与元数据的一一对应,管理过程元数据采集,计算机病毒,信息泄漏等。

第八步,报告转换或迁移结果。向单位和相关方面报告转换或迁移项目实施的评估结果。完成了电子档案及元数据转换或迁移程序后,应经过一段时间(半年、一年或更长时间)实际应用的验证,未发现存储在目标系统、载体或格式中的电子档案的真实性、可靠性、完整性和可用性存在问题,方能提出对源系统、载体或格式中的电子档案等的销毁、彻底删除等处置意见,经单位审批并获得授权后方能执行。

当前,档案信息化建设进入了新的发展阶段,应用系统规模、新技术应用、档案数字资源数量等已经发生有了较大变化和提升,随着信息技术升级换代、设备生命周期完结等情况的出现,电子档案及元数据转换、迁移需求会周期性出现,所需面对的电子档案及其元数据存储、备份的技术环境也越来越复杂。档案部门需要从小项目开始实践,按照规范要求进行实际操练,锻炼队伍、积累经验,建立电子档案及元数据转换、迁移的工作机制,为电子档案的真实性、完整性和可用性提供保障。

猜你喜欢
可用性完整性术语
核电站DCS可用性测试应用研究
面向移动应用的软件可用性研究综述
关于防火门耐火完整性在国标、英标、欧标和美标中的比对分析
机构知识库网站可用性评价指标的计量学分析
ELM及IS/OS完整性对年龄相关性黄斑变性预后视力的影响
更正说明
贸易术语修改适用问题探讨
关于数字图书馆网站的可用性框架研究
翻译适应选择论下中医术语翻译探讨
谈书法作品的完整性与用字的准确性