《纸质档案数字化规范》解读

2019-05-07 06:07文/杨
陕西档案 2019年2期
关键词:原貌纸质成果

文/杨 艺

《纸质档案数字化规范》在组织与管理、数字化前处理、技术指标要求、数字化验收成果以及数字化流程等方面对纸质档案数字化工作进行了重新修订,在计算机信息技术高速发展环境下,纸质档案数字化工作得以顺利规范进行

2005年国家档案局发布并实施了档案行业标准《纸质档案数字化技术规范》DA/T 31-2005,首次从规范标准的角度来要求纸质档案数字化工作,对档案信息化的数据资源建设提供了有力的标准规范支持。十几年过去,由于计算机信息科技高速发展,DA/T 31-2005在实践应用过程中已无法有效规范和处理纸质档案数字化工作中遇到的所有问题,纸质档案数字化工作的管理模式已经由起初单纯的技术性工作向系统化管理性工作转变,因此,国家档案局及时地对本标准进行了修订,调整相关要求,以适应纸质档案数字化发展现状,形成了《纸质档案数字化规 范》DA/T31-2017,替代DA/T 31-2005。

修订主要内容有以下几个方面:

一、增强组织与管理部分的内容,完善数字化工作中管理相关要求

DA/T 31-2017增加第5部分充分详细地对组织与管理提出了规范性要求。目前,对馆藏纸质档案进行数字化已不仅仅是一项单纯的技术性工作,档案数字化工作组织形式由原先的单一化变得多元化,更多表现为服务外包项目形式,这种科学有效地组织和管理对纸质档案数字化工作的有序进行以及安全保障尤为重要。故规范名称将原规范标题中的“技术”两字去掉,修订为《纸质档案数字化规范》。

DA/T 31-2017对组织与管理方面的具体要求全面、系统、科学、准确。内容详细介绍了机构组成及人员要求、基础设施安全保障、工作方案的科学合理及审批归档、管理制度的规范全面、工作流程的有效控制、文件管理的完整标准以及档案数字化外包的监督指导等多个方面,涵盖了纸质档案数字化工作的全部流程,为纸质档案数字化的管理工作提供了切实可行的理论依据,有效保障了数字化工作的有序进行,有章可依。

二、增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求

DA/T 31-2017对数字化工作前的准备工作从原先的档案整理更名为数字化前处理,分为5个部分对此进行要求。

新规范主要从三个方面进行了修订:一是对档案整理顺序进行了调整。DA/T 31-2005中要求先进行目录数据准备、拆除装订、确定扫描页、页面修整、整理登记,最后是装订;而DA/T 31-2017则是确定扫描页、编制页号、目录准备、拆除装订以及技术修复。顺序调整之后更符合实际工作流程。需要注意的是,修订后的数字化前处理中去掉了档案装订的环节,介于档案扫描时可能需要再次对档案进行拆装工作,以只拆一次为原则,为保护档案实体,把档案装订工序去掉并挪至数字化工作最后完成。二是对档案扫描页的确定提出了新要求。新规范要求原则上应将确定为数字化对象的纸质档案全部扫描,不宜挑扫。这样对纸质档案数字化成果提供了数据完整性保证。三是对拆除装订的工作修订了具体要求。DA/T 31-2005提出不拆除装订会影响扫描工作进行的档案应拆除装订物。而新规范中以保护档案实体为基础,要求在拆除装订时应注意保护档案不受损害,比如装订不规范的应更换装订方式;对特殊装订的档案拆除装订应恢复其档案原貌,比如采取拍照的方式记录档案原貌以便恢复。

三、增加数字化过程中元数据采集的要求

DA/T 31-2017第4部分总则中提出,纸质档案数字化过程中,应保存数字化项目信息、技术环境、数字化各类技术参数等方面的元数据。电子档案元数据分两部分:一是档案实体元数据,其中包括档案的档号、题名、保管期限、责任者等;二是档案背景元数据,包括档案标识符、信息背景描述、来源环境等。

随着各地综合数字档案馆的建设实施,为了保障电子档案真实性、完整性、可用性和安全性,对纸质档案数字化成果要求也不断提升。在纸质档案数字化过程中,档案的背景元数据是最容易被忽略采集的,而由于目前纸质档案数字化工作基本为外包服务项目完成,档案背景信息的采集不仅能够提供数字化成果的完整性,而且对数字化成果的安全责任具有很强的可追溯性。建议在纸质档案数字化工作方案中将元数据采集的具体要求和指标都能明确提出,元数据采集以计算机自动捕获为主,将档案数字化过程留痕、背景描述充分保留作为保证档案数字化工作完整性的重要内容。

四、修改了档案扫描部分参数要求,修改了图像处理部分内容,更加强调保持档案原貌

DA/T 31-2017不仅在数字化工作的组织管理方面提出全面的标准和要求,而且在技术部分也做出了细化和调整。

1.由于计算机硬件技术的提升,对某些计算机专业图像术语的依赖性降低,术语和定义中只保留了数字化、数字图像、纸质档案数字化和分辨率,对黑白二值图像、连续色调静态图像、失真度、可懂度以及图像压缩等术语没有再多作解释。

2.对扫描图像彩色模式方面的要求进行了修订。为最大限度地保留纸质档案原件信息,首先建议全部采用彩色模式进行扫描;只要扫描页中带有任何彩色标记的,都应采用彩色模式扫描,如红头、印章、插图、照片等;页面中仅为黑白两色,字迹清晰、不带插图的,彩色模式扫描与黑白二值模式、灰度模式扫描成果基本无明显区别,也可采取其他两种模式扫描。目前,计算机图像运算速度的大幅提升,计算机存储空间成本降低,对扫描图像的质量和大小都有很大程度影响,档案图像扫描工作不再受硬件技术的制约,更多关注于如何更好地显示档案原貌。

3.对分辨率要求的调整体现在保证扫描后图像的清晰、完整的前提下,还需综合考虑数字图像后期利用方式等因素。分辨率是单位长度内图像包含的点数或像素数,也就是说,点数越多,分辨率越大,图像显示效果越细腻清晰,存储所需空间也就越大。而对于馆藏大量A4幅面的文书档案,特别是80年代以后高质量的打印文件档案来说,分辨率过高并不会对显示效果有很明显的提升,反倒会需要更大的存储空间,显示速度也会降低,这时就需要选择适当的分辨率。规范中要求分辨率应不小于200dpi,如文字偏小、密集、清晰度差时,建议不小于300dpi,目前大部分综合档案馆室图像数字化扫描分辨率均为300dpi,如有高精度仿真复制等特殊用途时,建议不少于600dpi。

4.以保持档案原貌为前提,对图像处理中,修订了去污和裁边两个方面的要求。一是对扫描图像进行裁边处理的时候,应在距页边最外延留下至少2-3mm,从而避免将档案边缘的细节信息裁掉,损害档案信息的完整性。二是要求在去污过程中仅去除在数字化过程中产生的污点、污线及黑边等影响图像质量的杂质,不得去除档案原始页面信息,包括纸张褪变的斑点、水渍、污点及装订孔等,客观显示档案原貌。

五、细化了数字化成果验收的内容

新规范中对数字化成果验收提出了细化、全面的要求,从验收方式、验收内容、验收指标、验收结论及移交等五个方面系统地规范了数字化验收工作。

从验收内容来讲,DA/T 31-2005仅仅只是对数据做出了验收的标准描述,而新规范中则对目录数据、元数据、数字图像、数据挂接工作、数字化工作文件以及数字化成果存储载体等六个方面内容进行了验收工作的描述,达到了纸质档案数字化工作全过程验收的效果。

从验收指标上说,由于客观条件制约,原规范中并未提及使用计算机自动检验,随着计算机软件技术的不断革新,新规范中推荐采用计算机自动检验方式来对数据进行100%校验,检验合格率应为100%。实际工作中,由于计算机软件OCR识别准确率有限,目前大部分综合数字档案馆室更多采用计算机自动检验和人工抽检相结合的方式,人工抽检率不低于5%,而需要保证抽检准确率100%。

六、删除原标准数据备份和数字化成果管理相关内容

为了保证纸质档案数字化工作流程的完整性,DA/T 31-2017中加入了档案出库和归还入库步骤。当数字化成果验收合格并移交之后,需要对纸质档案原件进行档案装订,保持档案原貌,清点登记办理入库手续,至此,纸质档案数字化全过程做到了闭环管理。新规范删除了原标准中对数据备份和数字化成果管理的描述,使整个纸质档案数字化过程更加严谨,准确规范。

值得一提的是,DA/T 31-2017中“保持档案原貌”的字样总共出现了五次,不管是尽可能少的拆装档案,或者是以只扫描一次为原则,都是新修订的规范对档案原件保护的新要求。纸质档案数字化成果的有效利用,合理开发,更是为了封存原始档案做基础。在新出台包括修订的档案业务规范中,不只是在纸质档案数字化工作中提出保护档案实体的要求,更多的是对档案工作者在日常各项档案业务工作中都应提高对档案原件安全及质量的保护。

猜你喜欢
原貌纸质成果
以《进步日报》看中央音乐学院初创历史原貌
验收成果
四川省图书馆发布2019年阅读报告
布达拉宫纸质文物修复——以佛经公文为例
数说中国—东盟经贸合作成果
2018数博会4大成果
一张图看懂“论坛成果清单”
《官场现形记》官特征研究探析
独立书店浪漫的纸质生活