清水江文书数字化建设探究

2021-06-25 15:13杨存林
文教资料 2021年5期
关键词:保护整理数字化

杨存林

摘   要: 清水江文书是明清以来黔东南地区苗族、侗族人民生产生活产生的历史文献,不但记录少数民族地区人民的经济生活形态,而且记录明朝以来少数民族地区政治形态,是苗族、侗族人民的文献“宝库”,如何保护好、利用好这一重要的文献“宝库”是摆在人们面前的重要课题。本文从清水江文书数字化的角度对这一课题进行了探究,期待引起大家的共鸣,进一步推进清水江文书的数字化建设工作。

关键词: 清水江文书   整理   保护   数字化

清水江文书是黔东南地区苗族、侗族人民生产生活的真实记录,是苗族、侗族人民在漫长岁月中形成的历史档案,也是学界研究苗族和侗族人文、经济和社会发展的第一手资料。从二十世纪六十年代中期第一次进入学界视野以来,几经消沉后再次跃入学者视线,并得到了学术界的高度评价。清水江文书学不但成为黔籍旅台作家姜穆先生所期冀的“黔学的一门显学”[1](269),而且被北京大学赵世瑜教授等认为对“重建中国历史叙述”起到重要作用[2]。可见清水江文书对苗族、侗族人民的重要性。

1.清水江文书保护模式现状

长期以来众多学者都在探索清水江文书的保护模式,到目前为止有两种模式得到学界的认可。

1.1集中保护模式

自2001年贵州省锦屏县率先开展大规模收集清水江文书工作以来,截至2016年上半年,黔东南州各县收集到档案馆的清水江文书共21.98万份(件)[3]。之后各县征集的文书量有所减少,但还是有一定数量的增加。这部分文书进入档案馆后由所在档案馆开展修复、数字化、入藏等工作。虽然由于专业技术人员与资金缺乏,导致这些保护措施都进行得略为粗略,但至少这部分清水江文书能集中到档案馆里从而避免火灾。

1.2分散就地保护模式

有学者提出了“分散就地保护”模式。这一模式是以村为单位,组织人员将农户手中的清水江文书“登记造册”,对每户契约文书建立份级目录,然后将清水江文书原件退回农户手中,并将目录复制一式三份,农户手中一份,村集体一份,县档案馆一份。国家配置能防火、防潮的存储设备给农户保存清水江文书,培训农户保护清水江文书的技能技法,既能保护清水江文书,又能保留清水江文书的“活态性”(作为调解集体山林纠纷的凭证)。

笔者认为,这一模式是“集中保护”模式遇到了瓶颈,无法继续开展之后的无奈之举,可操作性。理由有三,一是防火、防潮的保险柜一定要具有绝热功能,与飞机黑匣子或太空返回舱一样,在高温的环境里能保护里面的物品完好无损,否则发生火灾时保险柜里面的清水江文书也会被高温碳化。可是具备这种防护功能的保险柜价格必定高昂,无法达到文书持有者每户一柜的要求。二是清水江文书虽然具有一定的“活态性”,但这样的“活态性”相对有限,一旦发生火灾,人们必定不会首先抢救清水江文书,而是抢救一些生活必需品。如此,遗留在民间的清水江文书将逐渐消亡,留下的目录册子也失去了实际意义。三是散藏于民间的清水江文书造成了时间与空间的阻隔,不利于开发与利用。

2.清水江文书数字化建设的必要性

2.1清水江文书永久性保存的必然要求

黔东南遗存清水江文书之处,是盛产林木之地,人们就地取材,所建房屋多为木质结构。加之苗族、侗族属于聚居性民族,房屋一栋挨着一栋建造,一旦发生火灾,木质房屋就会成片焚毁,存于屋内的清水江文书会与房屋一同消亡,这种火灾在黔东南地区时有发生。如:1980年文斗下寨的寨火,因发生在中午,人们大多在山上干农活,导致大多数人家的契约文书被焚毁;1996年10月发生在锦屏县偶里乡八腊村一组的火灾,在短短一个小时内三十多栋木质楼房全部烧尽,一同烧毁的还有长期积累的清水江文书;2005年7月17日,发生锦屏河口乡文斗上寨村一场山林火灾,当时就烧毁了几十户人家,被一同烧毁的还有3000份至4000份清水江文书;2016年5月30日午夜,发生在锦屏县平秋镇石引村的火灾烧毁了仁海滨等四户人家的房屋与仁海滨家族遗留下来的清水江文书400余份。在“集中保护”模式遇到瓶颈,探索的“分散就地保护”模式又不能完全解决清水江文书安全性的情况下,只能探索“清水江文书数字化建设”,利用现代计算机技术,将清水江文书数字化后多处备份,多地保存。即使清水江文书发生不可挽回的损毁,也不会危及数字化文书的存在,因此清水江文书数字化建设是清水江文书永久保存的必然选择。

2.2有效解决清水江文书“藏与用”的矛盾

清水江文书藏于农户家中的木匣子中、布包里,如非必要,或许几十年都没有人去翻动。学者要研究,还要走村串寨、挨家挨户地查访,有甚者还不轻易示人。再者查阅人次增多,也會给文书带入汗渍、霉菌等加速文书的损毁的不安全因素,磨损文书,缩短文书的存世寿命。这些都不符合清水江文书的保护原则,势必会造成“重藏轻用”的现象。要彻底解决这一问题,就要将文书数字化,学者在不翻动文书原件的情况下通过网络查阅到相关文书信息,既保护了清水江文书,又满足了学者的信息需求,能够有效解决清水江文书藏与用的矛盾。

2.3突破清水江文书征集的瓶颈

清水江文书是土地可以自由买卖流转时期的产物。新中国成立后,土地收归集体所有并把使用权重新分配给人民。这种私有制下起到调解产权纠纷的契约文书在同一集体里面就失去了调解的作用。但在不同集体、村寨之间发生山林纠纷时人们还能翻出尘封的老契作为凭据,起到调解民间纠纷的作用。经历十多年的大规模征集,虽然取得丰硕的成果,但据专家估计,清水江文书总量应在50万件—60万件,除去目前征集到的21.98万件,还有30万件—40万件散藏于民间,这些文书该怎么办呢?过去之所以能征集到如此大量的清水江文书,主要是因为新中国成立之后,土地所有制的改变,使农户认为遗存在手中的清水江文书已经没有用了的基础上得以征集。随着时间的推移,农户不情愿将手中的清水江文书上交。主要原因有三:其一,清水江文书是祖传遗存,晚辈应该流传下去不能轻易交出;其二,清水江文书在调解集体山林土地归属时还能起到凭证作用;其三,清水江文书是黔东南地区苗族、侗族人民所独有的一大特色,在发展旅游业上也是一大亮点。基于以上原因,农户不愿再上缴手中的清水江文书。再者,清水江文书既是文物,又是农户祖传文书,按照《中华人民共和国物权法》的有关规定,群众所收藏的祖传文书属于私有财产,他们享有处置权,任何组织和个人都无权强行让他们上交。因此,征集清水江文书就遇到了瓶颈,工作的开展步履维艰。

2.4扩大清水江文书的影响、引入更多学者研究

清水江文书是黔东南境内清水江流域独有的历史文献,一些国内外学者即使有研究的期望,也受到时间和空间的限制,未能参与到清水江文书的研究中,对扩大《清水江学》的影响是不利的。数字化的清水江文书能有效打破时间和空间的限制,让国内外学者可以通过网络零距离接触到清水江文书,挖掘这座“宝库”的学术价值与历史价值。

3.清水江文书数字化建设的原则

3.1古籍整理原则

清水江文书数字化不仅仅是文书形式的转换,还属于少数民族古籍整理的范畴。对此,有学者做了明确阐述:“古籍数字化是对古籍的深度开发,是古籍整理的一部分,不仅涉及诸如标点、校勘、注解、今译、辑佚等古籍整理的知识和技能,还涵盖网络技术、信息技术等现代技术,代表未来古籍整理的发展方向”[4](6)。因此,我们要将古籍整理的各个环节融入清水江文书数字化过程中。

3.2版权保护原则

清水江文书数字化版权主要涉及两个方面。首先,清水江文书数字化是基于古籍整理原则的,期间涉及对清水江文书的标点、校勘、注解、今译、辑佚等,凝聚了大量整理者的心血。依据我国《著作权法》第12条规定(改编、翻译、注释、整理已有作品而产生的作品,著作权由改编、翻译、注释、整理人享有,但行使著作权时不得侵犯原作品的著作权),如果整理的新作品具有独创性,就应该纳入著作权法保护范畴。因此清水江文书数字化成果应给予版权保护。其次,清水江文书持有人的权利问题。按理说清水江文书持有人不再享有任何权利,但清水江文书在过去是物权的象征,是祖辈相传的文书,至今还起到调解民间纠纷的作用。按照《中华人民共和国物权法》规定“祖传文书属于私有财产”,从《物权法》角度来说,文书持有人还是具有权利的。清水江文书数字化前,应该与文书持有人签署文书图片使用协议,取得持有人的授权。

4.清水江文书数字化的构想

4.1清水江文书数字化层次

针对古籍文献数字化的建设层次,学者们有不同的观点,王立清认为古籍数字化可以分为四个层次,即古籍书目的数字化、古籍载体的数字化、古籍图文的数字化、古籍知识及关联的数字化[5](25)。徐清等人认为古籍数字化的深度开发具体包括以下三方面内容:提供超文本的阅读环境、建立强大的智能化检索系统、提供精准的数据和信息[6](95-97)。马创新等人基于深度差异将古籍数字化分为“表层数字化”与“深层数字化”[7](104-106)。笔者认为清水江文书数字化分两个层次,即多途径网络检索服务与全文阅读。

4.2清水江文书数字化的具体措施

2001年锦屏县率先征集保护清水江文书以来,清水江文书的保护工作进展缓慢,各县各自为政,没有形成统一的领导与技术标准。期间学者提出了“集中保护”与“分散就地保护”两种保护模式,但不管哪种保护模式都存在不小的缺陷,解决文书保护问题。也有学者提出“清水江文书数字化”,但只是书面文字,没有具体的操作与标准。2012年笔者有幸参与国家社会科学基金重大项目招标课题“清水江文书整理与研究”子课题“清水江文书全文数据库”建设,此后进行了几年的田野调查和数字化工作,不仅收集了一定数量的清水江文书,还积累了一些数字化建设的实践经验。

清水江文书数字化工作应该在政府统一领导下成立“清水江文书数字化项目”,采取高校加地方的模式开展数字化建设。

首先,清水江文书的扫描数字化。对于入馆集中保护部分,高校与档案馆合作,在高校古籍整理人员的指导下由档案馆将清水江文书扫描转换为JPG图片格式;散藏于农户手中的清水江文书,应以乡(镇)为单位,培训专门人员接待文书持有人、造册并扫描清水江文书,清水江文书原件扫描后退回持有人手中实施“分散就地保存”。给予持有人一定图片使用费后签订文书图片使用协议,取得文书图片的使用授权,并且持有人往返乡村的食宿车程等相关费用。这一措施起到避免权益纠纷与激励持有人提供文书扫描的作用,持有人在不丧失清水江文书原件的基础上还能得到一定的经济回报,笔者认为这不失为一种有效的激励办法。

其次,数字化清水江文书时必须遵循的标准和程序。数字化清水江文书必须做到统一的标准与要求。为保障文书的清晰度,图片分辨率必须达到300DPI以上;为了后续的《清水江文书全文数据库》建设,在数字化清水江文书的同时必须收集每份文书的基本信息,每份清水江文书图片名称必须标明文书的尺寸(长×宽)CM与载体材质(毛边纸、皮纸、草纸等),每户对应一个文件夹存放,文件夹采用“县+乡(镇)+村+户”进行命名。

最后,将收集到的文书图片统一上缴“清水江文书数字化项目”组,由项目组建立《清水江文书全文数据库》(网络版)。因《清水江文书全文数据库》的独特性,数据库应具备多种检索途径(题名、关键词、文书产生年代、归户性导航检索等)、多种检索结果排序方式、文书的载体形态、文书的来源地、文书的收藏地及文书的点校摘录等项目;版权保护方面,数据库里每一张文书图片数据必须加载水印(不干扰到文书文字),监控或限制数据下载等措施。

5.面临的问题与对策

5.1清水江文书数字化人才匮乏

清水江文书数字化是一项宏大的工程,涉及的人员比较多,不仅需要具备历史古籍文献鉴别与保护的专业人才,还需要古籍点校专家、文献著录、计算机数字化与计算机网络等相关人员的参与。苗族、侗族是只有语言没有文字的民族,所有清水江文书都是通过“汉字”书写的,产生大量的“俗字”“套语”“生僻词”等語言文字,且书写不规范,错字、别字较多,导致清水江文书的点校与著录花费大量的人力、时间。针对这一问题,我们可以发挥高校的人才优势,招募“汉语言文学”与“历史学”专业的学生进行初步点校与著录,由清水江文书数字化项目组人员审查、复核,通过审核无误的数据才能发布供国内外学者研究,扩大《清水江文书》的研究队伍,拓宽《清水江文书》的研究视野。“清水江文书数字化项目”通过学生加入加快了建设进度,解决了人才匮乏的问题,学生通过加入项目建设得到了实践锻炼的机会,促进了研学的成长。

5.2经费短缺

经费短缺是限制“清水江文书数字化”工作的主要原因。据专家估计,清水江文书存世量近60万份,以每份10元的图片使用费来计算就需要600万元的图片使用费,还不包括扫描、后续点校、著录等数据库建设等相关费用。为了解决这个问题,可以通过政府拨款资助、企业捐款、社会众筹与国家项目申报等多种途径加以解决。

清水江文书因特殊的地域性、归户性,在“集中保护”与“分散就地保存”模式都无法尽善尽美的前提下,数字化建设势在必行。

注释:

①清水江文书(又称锦屏文书),2010年2月被列入《中国档案文献遗产名录》.

参考文献:

[1]王宗勋.清水江历史文化探微[M].昆明:云南美术出版社,2013.

[2]赵世瑜.清水江文书在重建中国历史叙述上的意义[J].原生态民族文化学刊,2015(4).

[3]王宗勋.清水江文书收集整理研究问题的思考[J].原生态民族文化学刊,2017(1).

[4]毛建军.古籍数字化理论与实践[M].北京:航空工业出版社,2009.

[5]王立清.中文古籍数字化研究[M].北京:国家图书馆出版社,2011.

[6]徐清,石向实,王唯.古籍数字化资源的深度开发[J].图书情报工作,2007(3).

[7]马创新,曲唯光,陈小荷.中文古籍数字化的开发层次和发展趋势[J].图书馆,2014(2).

猜你喜欢
保护整理数字化
家纺业亟待数字化赋能
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数字化制胜
刍议增强林业生态环境保护的有效途
浅谈遗址公园的保护
高一零碎知识整理
整理归纳中渐次坚实
整理房间