数字信息长期保存的风险及策略研究

2020-08-20 12:54辛晓海
全国流通经济 2020年15期
关键词:存储

摘要:长期数字保存与数字对象的维护是为了确保对重要信息不断访问的实现。近年来,随着科学技术的不断进步,数字对象的长期保存与维护是一个非常重要的问题。现实生活中,不是所有存在于组织中的信息都是长期保存的。对于大多数组织来说,当认识到信息可能遭受危险,需要采取保护行动,尽量避免损失时,技术专家需要做更多的工作,以确保所有可用的措施都到位。本文探讨了长期数字保存及其意义,分析其在组织下的模式并给出合理化建议。

关键词:长期数字保存;数字信息资源;数字对象维护;存储

中图分类号:G250.73文献识别码:A文章编号:2096-3157(2020)15-0131-02

一、引言

随着科学技术的进步,数字信息资源的长期保存成为组织和企业经常使用的工具。数字信息资源是指所有以数字形式把文字、图像、声音、动画等多种形式的信息存储在光盘、磁带等非纸介质的载体中,通过网络通信、计算机或终端再现出来的信息。据估计,98%的组织需要确保能够长期保存数字记录。这是为了更好地处理法律辩护、遵守、公司的持久支持和诉讼等诸多问题。现实情况下,每一个组织都需要确保他们平常能够对在服务器上备份的不同文件进行区分,甚至是在外部硬盘驱动器上。数字存档被称为只包含真正需要保存的不同文件,这些文件是正在进行的并且可以随时访问的有效文件。但从管理时间来看数字的长期保存,数字信息资源面临着更大的消失和不可获得的风险。这是因为数字信息与纸本资源相比,它对存储介质的依赖性更强,其存储的截止稳定性却不强,容易遭受破坏,若是其载体一旦损坏,需要的数字信息可能就会無法获取、利用。因此,本文将基于组织管理下的长期数字保存模式,分析其风险并针对风险及模式提出可操作性建议。

二、企业组织设置下的长期数字保存

现实生活中,企业的大多数组织都必须维持一个一个详细的、有组织的记录,用来记录他们在一段时间所参与的不同的项目。本文以主营建筑类型的公司企业为例,对于处理建筑问题的大多数组织来说,需要记录一些包括建造过程的工程的蓝图等信息。当大多数组织在写这些记录时,他们期望它们能够持续整个建筑工程完成,甚至是到大约三四十年后仍然可以获取利用。这是因为对于一个建造工程来说,在工程完成以后,如果有一些维修问题需要组织去完成,或者更夸张的情况,例如与其他企业出现系列业务纠纷、法律案件,这些都需要获取之前的整个过程的记录,这都需要长期数字保存的运用。

基于数字类型的多样化,数字存储的形式也是十分多元化的。常见的数字资源多以文档、图片、音频、视频等形式存在,同时存在于不同格式当中,表中罗列了常见的数字类型的保存形式,企业管理者针对不同的数字保存类型进行分类,并按照不同的对策进行长期保存。

基于本文的调查,各个组织机构、企业都需要存储大量信息以备未来工作的进行。根据数字信息资源长期保存的政策与法规,各企业机构在长期保存过程中也应对诸如知识产权、用户隐私及保护等问题作出规范。由美国空间数据系统咨询委员会(CCSDS)提出并被国际标准化组织(ISO)采纳为国际标准——ISO 14721的开放档案信息系统参考模型,是世界范围内数字信息资源长期保存系统所普遍遵从的核心标准。目前常见的技术大体分为以下几种:拷贝、仿真、迁移、数字图形输入板、建立计算机档案馆、封装技术、标准化技术、通用虚拟计算机技术(UVC)、基于风干的保存策略和数据再造技术,每种技术都有其优点及不足。结合上文提到的不同类型的数据信息,目前还没有一种技术能够全面满足不同类型数字资源的保存需求。因此对企业来说在具体的工作与实践当中,应当综合考虑所处环境、保存目标、数据类型等因素,根据实际的保存需要,选择其中多种合适的技术与策略综合利用,进而完成数字信息资源的长期保存工作。随着时间的推移,大多数公司正在慢慢地转移到对云服务的利用,这其中就包括亚马逊网络服务、Dropbox、谷歌盒子和Office 365等著名互联网企业。该存储方法对于存储企业中起决定性和十分重要的数据来说是十分便宜的,也是组织能够利用的最有效的短期解决方案。然而,它在组织的长期运行与维护过程中却构成了一个非常真实的威胁。对于任何企业来说,都必须认识到对于承载信息的硬件和软件过时问题是一个恒不变的挑战,企业必须有一个持久的解决方案来更好地抵制风险,解决面临的困难。

从实际情况上分析,任何存储超过10年的信息或内容都有很大的风险会使存储其的机构、组织无法再进行读取利用。这是因为我们目前所使用的操作系统、硬件、文件格式或者程序都以非常快的速度持续不断的发展,因此由于时间的推移和技术的发展,最终所交付用户的操作经验是一个非常困难和复杂的问题,换句话说,大多数个人和组织无法考虑或理解当时这个信息的价值或利用方式。随着越来越多的公司正努力寻找最好的方式以确保他们可以更好地存储重要信息,当涉及到组织如何运作的法律法规时,就会发生不同的变化。因此,企业需要研究伴随着长期数字保存的模式而面临的风险以及可能遇到的威胁,并针对其作出合理化措施,最终找到持久的解决方案。

三、数字资源长期保存与管理的风险

本文基于对长期数字保存的介绍和分析,由于现在科技的发展,硬件、软件更新换代的速度不可想象,再加上长期保存的信息时间久远,对于企业来说,难免会在数字资源长期保存与维护时遇到系列困难与风险,只有正确识别数字长期保存过程中存在的风险,并系统地进行风险因素分析,科学地对风险因素分类和风险等级划分,才能构建完善的应对策略,控制并预防数字档案长期保存过程中遇到的风险,实现对数字档案的长期、有效、安全保存。本文接下来将对数字资源长期保存的风险进行介绍并评估,以帮助企业提供建议。

1.存储载体的风险。随着科技的发展,工程中所需要的信息都是通过计算机生成、记录并保存的,这就说明数字长期保存是无法离开承载其存储的载体的而独立存在的,其存储的载体一般是计算机内部的硬件或软件。这就说明了信息的依赖性,一定程度上可以理解为信息是“寄生”于计算机之上而存在的。而现实生活中,我们的计算机难免会遇到死机、瘫痪、被黑客攻击或者遭到病毒攻击的情况,这就会导致企业所需要的数字信息因为计算机软件或硬件的易被攻击的特性,造成信息缺失甚至被删除、修改,无法再次读取的情况。

2.数字信息的真实性风险。数字信息的真实性主要包括三个方面:数字信息来源正确,在存储进载体的过程中数字信息未发生变化;数字信息存储形式没有发生改变,无论是内容方面还是外观格式等方面;若在长期保存过程中进行了修改,所进行修改的步骤是要被记录的。数字信息和我们传统的印刷保存是不同的,基于计算机的可操作性,数字信息也是可以被修改的。若是在数字信息的保存及管理过程中,被恶意修改或者病毒入侵,数字信息都会被改变而失去价值。

3.数据的脆弱性。基于上文中提到的各种数字信息往往以不同的形式存在于载体当中,数据是数字信息的代码,是数字信息存在的前提,若是没有了数据,数字信息的保存就变得不可实现。但是数据是脆弱的,容易遭到黑客、病毒的攻击,一旦破坏将永久消失。同时,承载其存储的载体一旦发生故障,如卡机等现象,也会对存储的数据造成影响,而数据一旦被侵犯,容易发生数据缺失甚至永久破坏,无法再次读取的问题。

四、数字信息长期保存与维护的建议

结合实际情况,并非所有的企业、组织都需要用计算机硬盘进行数字信息的保存。然而,一旦需要归档的不同材料已经被识别并明确分类,企业就需要考虑合适的数字信息存储载体来进行不同的保存活动。基于国家数字管理联盟(National Digital Stewardship Alliance)列出的关于数字保存的建议,结合数字保存的风险,在下文进行罗列。

1.企业、组织必须确保他们能够在一个非常可靠的存储系统中存档需要的信息。可以使用例如稳定的服务器,或者利用云服务的技术进行存储。随着时代的发展,云服务是一个比较先进的存储技术,其不依赖于例如像USB闪存驱动器这样的可移动介质。因为在可移动存储系统中所存储的数据可能会随着时间的推移而难以访问,甚至完全不可访问。

2.将数字信息存储在不同的地理位置,避免因自然灾害导致的数据完全丢失。同时,组织应将重要文件都以“有风险的”格式迁移,并将其存储于更开放和稳定的格式中。这在文件数量受到限制时是非常有用的。对于组织来说,应在数字信息保存之前对其进行审查记录,判断其记录的类型并对所有内容不同类型的数据制定不同存储文件的保存策略。

3.加强修复技术。在科学技术不断变化的时代,数字资源可能会因技术平台的变化而造成无法读取识别。同时,对于因为设备死机等不可抗因素,都可能会造成数据的缺失。对于我国来说,建立数字信息恢复中心来承担数字资源长期保存过程中的技术问题是非常有必要的。目前我国已经拥有上百家数字恢复中心,通过恢复中心针对由于硬件、软件故障或其他灾祸带来的数据损失来进行数据信息的修复,进而找回缺失的信息,帮助数字信息长期保存。

4.加强对数字信息的檢测。对于组织、企业来说,确定数字的真实性是非常困难的。组织、企业可以利用一些工具、技术来判断相应的独特标识符。这些工具可以基于文件序列的二进制代码来对文件进行判断是否被修改或者被损坏。当发现信息的固定属性已经发生改变时,就应该及时地做出举措,检查核实并修改需要长期保存的数字文件。

五、总结

数字信息的长期保存是一个任何企业和组织都必须直面的挑战。鉴于数字信息资源长期保存工作复杂性高、实践性强的特点,想在短时间内让这类问题得到解决还是比较困难的,但企业和组织应该及时针对其风险进行对策研究。一旦其内部的重要信息发生丢失,组织会面临更高的风险。对于管理者来说,应及时发现其面临的风险,转变管理理念、科学合理地构建完善的风险应对策略、提升风险应对能力,才能更好并安全地实现数字信息的长期保存。

参考文献:

[1]王霞.数字档案长期保存的风险应对策略[J].中国勘察设计,2019,(09):87~90.

[2]臧国全,崔燚,李哲.数字保存的真实性风险检测[J].情报理论与实践,2018,41(06):28~33+38.

[3]陈月.图书馆数字信息资源长期保存与维护的风险及策略研究[J].中外企业家,2019,(25):105~105.

[4]高凡,吴振新,付鸿鹄等.数字资源长期保存:研究进展回顾与展望——iPRES 2019国际会议综述[J].信息资源管理学报,2020,10(02):118~127.

[5]陆泉,韩雪,韩阳等.我国数字信息资源长期保存研究综述[J].图书馆学研究,2015,(04):2~8.

[6]Corr,E.M.,& Sandy,H.M.(2017).Digital preservation for libraries,archives,and museums.

[注]基金项目:受2019年大学生创新创业项目 “Make It Mine”量肤定制护肤平台(编号:2019200204)

山东师范大学本科生科研训练计划、本科生科研基金项目扶持

作者简介:

辛晓海,山东师范大学商学院学生。

猜你喜欢
存储
档案管理中电子文件的存储探究
云计算与虚拟化
某医院数据中心虚拟化的设计与实现
烟台新型自动气象站数据本地存储的设计及实现
关于SQL语言及存储过程
基于Hadoop的业务过程模型管理方法研究
存储对桌面云的影响分析