互联网信息保存刻不容缓

2014-12-05 04:19
北京观察 2014年8期
关键词:国家图书馆机构国家

文 陈 力

作者系民盟中央文化委员会副主任,国家图书馆副馆长

根据权威机构统计,互联网信息的平均寿命仅为 44至75 天,灭失原因主要有: 网页内容更新、网站内容重组、网站主办者消失等等。作为一种“原生性”的信息,互联网信息除了数字形式之外,基本上没有其他形式,如果不对互联网信息进行及时保存,许多具有研究利用价值的信息将会消失,我们将失去未来研究的重要资料,其损失是无法估量和无法弥补的。

当全球进入数字时代以后,互联网已经成为政府信息发布、教学科研、文化娱乐、人际交流等各个方面最重要的信息交流渠道,互联网信息已经成为记录当代历史最重要的载体,同时也是最重要的国家战略资源之一。

据中国互联网信息中心(CNNIC)统计,截止到2013年12月底,我国网站总数320万个,较去年同期增长52万个,增长率19.4%,网页数量为1500亿个,比去年同期增长22.2%,我国互联网信息总量已经超过了5PB的规模,年增量不小于10%。同时,互联网信息又具有易灭失性。根据权威机构统计,互联网信息的平均寿命仅为 44至75 天,灭失原因主要有: 网页内容更新、网站内容重组、网站主办者消失等等。作为一种“原生性”的信息,互联网信息除了数字形式之外,基本上没有其他形式,如果不对互联网信息进行及时保存,许多具有研究利用价值的信息将会消失,我们将失去未来研究的重要资料,其损失是无法估量和无法弥补的。因此,对这些反映我国社会发展状况和记录文化遗产信息的互联网信息进行存档保存,是一项刻不容缓的工作。

互联网信息存档工作在国际上很早就受到了重视。早在1996年,Internet Archive(简称IA)在美国成立。该机构是一个非营利机构,该机构宣称其目标是实现全世界互联网信息的收集、保存和永久获取,为国际性存档开发技术工具制定标准,鼓励和支持图书馆、档案馆、文化遗产机构实现互联网信息的收集和保存。其他一些国家如澳大利亚、新西兰、英国、法国、德国、瑞典、日本、韩国等也以各自的国家图书馆牵头,开始了对本国互联网信息的存档工作。2003年6月,由来自12个国家机构组成的国际互联网保存联盟(IIPC,International Internet Preservation Consortium)正式成立。目前,IIPC成员已经发展为45个。可以看出,世界各国都已经将互联网信息的长期保存工作提升到了国家战略的高度。

目前,我国的互联网信息存档工作有两个项目在持续性进行试验与研究,分别是国家图书馆的WICP项目和北京大学天网实验室的Web InfoMall项目。其中国家图书馆的WICP项目采用了完整保存网站的存档方式,覆盖了50000个政府网站约10万站次的存档,以及围绕大事件进行了80个主题保存,总数据量约30TB;天网采用了只保存文字的存档方式,保存了容量约30TB,总数约80亿张网页。这两个项目虽然已经积累了一些人员和技术经验,但其工作仅仅是试验性的,覆盖面也只涉及中文互联网信息的很少一部分,而对于中国乃至全世界的整个互联网信息来说仅仅是九牛一毛。同时,在互联网信息的长期保存方面,还存在着法律、机构、人员、资金等多方面的问题,需要从国家战略决策层面加以解决。

2013年本人曾向全国政协提交了“关于重视和加强互联网信息长期保存工作的建议”,在有关部门的答复中,只是提到了要在今后的科技发展规划中考虑此事。我认为,鉴于目前我国网络发展迅速,网络信息与国家安全、民众生活息息相关,事关重大,刻不容缓。最近,由习近平同志担任组长的中央网络安全和信息化领导小组成立,我希望互联网信息长期保存的问题能够尽快列入国家有关方面的议事日程。为此建议:

第一,将互联网信息长期保存工作提高到国家信息发展战略的高度来加以重视,在政策、法律的层面加以规范和保证。在互联网信息的采集与保存过程中,会涉及许多与现有著作权法相冲突的问题。为了解决互联网信息的保存问题,许多国家都以立法的形式将互联网信息纳入“文献缴送”范围,例如法国、丹麦、日本等国都先后制定了法律或法案,允许国家图书馆对本国的互联网信息进行主动采集存档。为了确保国家层面的互联网信息的永久保存,我国应建立和完善互联网信息缴送制度,通过修订或新设法律法规,把互联网信息纳入法定缴送范围,授权国家图书馆等特定机构使用特定方法对互联网信息进行采集和保存,并在法定范围内向社会提供服务。

第二、尽快建立国家级的互联网信息保存中心。互联网信息保存有着规模大、投入大、复杂度高、持久性强等特点,必须要有一个国家级的机构专门、长期从事此项工作。目前,我国的互联网信息保存还处于起步阶段,还没有明确专门的机构对整个中文互联网信息承担保存负责,势必导致一些互联网信息重复采集,造成人力、财力的浪费;同时,大量的互联网信息因得不到及时采集,造成重要文化遗产的流失。因此,建议尽快建立中国互联网信息保存中心,制定互联网信息保存的国家战略,协调各互联网信息保存的组织与机构,构建国家互联网信息的保存协作体系。

猜你喜欢
国家图书馆机构国家
能过两次新年的国家
把国家“租”出去
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
奥运会起源于哪个国家?
图书馆中文图书借阅排行榜
一周机构净减仓股前20名
图书馆中文图书借阅排行榜(2016年3月)
国家图书馆农业部分馆成立