荷兰华人社群网页存档项目的实践新动向

2019-12-17 05:14上海大学图书情报档案系
浙江档案 2019年10期
关键词:网络资源社群网页

丁 然/上海大学图书情报档案系

网络资源长期保存(Web Archive, 下简称WA)指将采集到的网络资源归档,之后将这些已归档Web资源用于存取和使用[1]。自20世纪90年代初,以美英加澳为首的欧美国家就开始了网络资源信息的采集研究工作,并开展不同的WA实践项目。早在1993年,加拿大国家图书馆就开始探讨和研究如何建立网页归档项目,并建立了电子出版物试点项目[2]。1996年,澳大利亚国家图书馆发起了网络资源存档项目PANDORA项目,并于2001年建立了网络资源归档系统PANDAS[3]。2010年,美国国会图书馆(Library of Congress,下简称LC)启动Twitter存档项目The Twitter Archive,Twitter承诺将成立以来的所有公开推文捐赠给LC,LC也表示会对所有的Twitter档案进行有效的开发利用[4]。2003年,英国国家档案馆启动了政府网页存档项目,至今已保存包括5000多个网站和政府社交媒体账户中的推文、视频,截至2018年保存的档案数据量超过120TB[5]。

我国对网络资源存档工作有初步的探索与实践。如2001年,北京大学发起中国Web信息博物馆项目,项目旨在采集我国绝大多数的静态网页,并提供在线查询的功能;2003年,中国国家图书馆启动网络信息资源采集与保存项目,项目旨在发现网页资源采集过程中的问题并提出相应的解决方案,但目前该项目已经停滞[6]。相较于欧美国家,我国的网络资源存档工作依然存在差距。笔者介绍了荷兰皇家图书馆开展的荷兰华人社群网页存档项目,突出项目在内容建设、功能导向和价值展现方面的特点,以期对推进我国网络资源存档项目有所裨益。

1 荷兰华人社群网页存档项目的概述

1.1 项目背景

2007年开始,荷兰皇家图书馆(KoninklijkeBibliotheek-National Library of the Netherlands,下简称KB-NL)选择性地采集全国的网页启动了WA项目,并建立特色专题网络资源馆藏,截至2019年6月KB-NL共收录15400个网站,包含36TB数据[7]。

到20世纪初,华人移民荷兰已有100多年的历史,但荷兰主流社会对华人社群的文化了解依然十分有限,华人群体在荷兰的社会中处于被忽视的状态。在荷兰“多元文化社会”的公共话语体系中,年轻华人几乎没有话语权,他们被隐藏于占据主导地位的少数族群之下[8]。这种不可见性导致华人隐没在荷兰社会多元性中,失去了其形象的独立性与其文化的独特性。KB-NL在反思这一问题之后意识到,荷兰对在荷华人的认知缺陷是因为缺失荷兰华人的记录和档案,无法从相关资源中形塑表明华人身份的文化进程,更无法得知华人在荷兰社会中是如何被理解的。为此,KB-NL在WA项目下建立荷兰华人社群网页专题特色资源馆藏,通过一名在荷中国留学生Kitty Lin的帮助来识别出有效的荷兰华人网页,借助多媒体与文化的手段活化这些网络资源,并描绘出荷兰华人在荷兰网络上的社会行为,让其更容易被荷兰社会所了解与接纳,同时为将来的研究人员提供有价值的数据信息。

1.2 存档范围

首先,网页选取需满足两个条件之一:发布者是荷兰华人社群成员之一,发布内容与荷兰华人相关[9]。由于荷兰华人个体存在差异性,因此网页选取的覆盖面将涉及每一位社群成员。又由于网页不限语言,不少荷兰华人使用中文或在中文网站上发言,因此中文网站的选取是必不可少的。其次,社交媒体资源不在存档范围之中。根据KB-NL的遴选政策,所选择的网站必须是对公众开放且无需登录的,所以虽然Facebook、Twitter、微信等都是荷兰华人常用的社交媒体平台,但这些平台均需要用户登录授权才能审阅,因此目前无法通过社交媒体上的活动轨迹来建构对荷兰华人的认知。

1.3 项目意义

荷兰华人社群网络资源集合展现了荷兰华人文化的进程。荷兰华人社群由不同生存地域、不同职业背景的华人组成,每个华人的行为都是一种文化的表现,个体行为的多样性不断丰富着荷兰的华人文化。存档项目在实质上是汉语叙事在荷兰传统话语中的书写和重构,荷兰华人社群网络资源集合是荷兰人了解中华文化的一种工具,能不断加强华人文化在荷兰地域的影响力,并提升荷兰华人文化在荷兰话语体系中的话语权。

1.4 法律与技术问题

荷兰暂无相关法律条文支持网页存档项目,因此KB-NL在抓取任一网页前都要取得权利人某种形式的同意。大部分的网页都有联系地址,查找联系地址最常见和直接的方法是通过网页的联系链接[10]。网页的联系链接以两种方式呈现,即电子邮件或发送邮件的联系表单,电子邮件是首选的联系方式。还有一些网站没有联系链接,但有社交媒体页面或账户,因此在Facebook或Twitter上寻找联系地址也是较为主流的方式。由于微信是中国最为主流的社交媒体和移动应用程序之一,通过微信公众号订阅也能获取相关的联系地址。为了防止网页存档项目的开展陷入困境,KB-NL采用了一种灵活的方式来处理版权问题,即选择退出方法,这种方法假定了对网络存档的隐式许可,即在采集网页前的4个星期内联系授权获取,若4个星期内无任何回应,则默认授权成功[11]。

1.5 项目展望

荷兰华人社群网页存档项目是一个延展性极强的项目,可以从其本身出发做深入研究,也可以使用馆藏中的内容进行各种课题研究。荷兰华人社群网络资源集合包含有17个类目,因此研究主题可以从既有集合中的类别出发,也可以与KB-NL馆藏中的其他网络集合相关联。若研究主题是关于荷兰华人的在线行为活动,延伸研究可以是借助相关技术比较现有的在线活动与过去的在线活动,以此展现荷兰华人近几十年来的线上活动变化,这将有助于研究荷兰华人在线活动的趋势。若研究主题有关宗教、新闻、健康,其他网络资源集合参与研究的契合性就大大增加。

除了对现有主题展开深入研究外,还可通过荷兰华人社群网络资源集合中的现有链接进行滚雪球式的拓展分析。但由于网络资源集合中的链接通常仅是网页快照,要进行拓展分析必须找到网页快照所对应的源链接,因此赋予研究人员尽可能多的权限来获取荷兰华人社群网络资源集合中的元数据,有助于推进各类研究工作的开展。

2 荷兰华人社群网页存档项目的特点

2.1 内容建设:突出叙事记忆,唤醒族群认同

荷兰华人社群档案是荷兰社会了解、研究荷兰华人的关键,同时也是留存荷兰华人社会记忆、唤醒族群认同的载体。荷兰华人社群网络资源是荷兰华人社群通过自发性的行为形成的,是基于自我身份认知的一种表现形式。将荷兰华人社群网页存档,有助于从档案的角度叙述真实的历史事件与人物,并同时留存公众记忆,这里的公众记忆不同于在中国境内留存的公众记忆。第一代荷兰华人跨越国界并在新的土地上扎根后,首先将原生民族的社会记忆与认同带到了新的生活环境中,这一阶段的社会认同源于中国传统文化。第二代的荷兰华人已经适应荷兰的生活环境,但在第一代人的影响下,社会认同一半来源于中国传统文化,一半植根于荷兰社会。第三代及之后的荷兰华人植根于荷兰社会,即将完全失去对中国传统文化、祖辈族群的认同感,认同感的丢失正是源于叙事记忆的丢失。在荷华人的总数不及荷兰总人口1%,如此小的社群其文化在代际相传中极其容易被同化。因此荷兰华人社群存档项目致力于对荷兰华人网络行为、内容进行跟踪,以梳理出荷兰华人社会行为的历史脉络,通过真实存在的历史脉络唤起全体荷兰华人的族群认同。

2.2 功能引导:关注少数族群,消解社群壁垒

荷兰社会是一个多元文化、多种族群共存的社会。当公众的物质生活水平发展到一定程度的时候,就会产生精神文化层面的更高追求[12]。荷兰华人社群网页存档项目就是荷兰群众追求更高精神文化的产物。长久以来,年轻华人在荷兰社会处于被边缘化的状态,缺少话语权的他们很难融入当地文化,也难以对当地发展作出更多贡献。荷兰社会开始关注被主流叙事系统遗忘的少数族群的生活背景与活动轨迹,开始关注社会构成主体的多样性。在这个项目中,对荷兰华人社群成员的网络行为脉络进行跟踪,以期通过了解荷兰华人社群的行为动机,帮助他们融入多元文化碰撞的社会生活,提升他们在多元叙事系统中的话语权,消解社群之间沟通的壁垒,最终实现荷兰社会的和谐与包容。

2.3 价值展现:注重虚拟资源,丰富既有遗产

荷兰华人社群网页存档项目既留存了荷兰华人的社会记忆,又拓宽了荷兰数字遗产的范畴。该项目的收录对象均为虚拟网络资源,分类条目繁多。这些虚拟网络资源是荷兰华人的精神活动产物,是个人数字遗产的重要组成。荷兰华人的特殊身份使得这些数字遗产既隶属于个人,又能以一种“反哺”的方式丰富荷兰既有的数字遗产。同时荷兰华人社群网页存档项目是对数字遗产有组织有规律的收集整合,有助于数字遗产的长期保存与提供利用,进而提升数字遗产的价值内涵。

3 荷兰华人社群网页存档项目的推进方向

3.1 加强政策引导,明确归档责权

首先,应加强相关法律颁布,赋予KB-NL抓取网络资源的自主性。由于缺乏相关法律的支撑,KB-NL在抓取网页时需要提前4个星期与网站所有者联系并获得授权,然而网页是动态变化的,“转瞬即变”,太长的抓取周期容易导致网页信息失效。如能获得法律支持,收录荷兰华人社群网络资源工作的效率会大大增加。其次,网站所有者有权拒绝KB-NL的网站抓取请求,但一旦拒绝收录的比例占多数,数字文化遗产的保护、学术研究的开展以及公共利益之间的平衡将被打破,并陷入僵局。在法律的调和下,网络信息多为公开信息,有义务作为国家数字遗产而进入数字遗产保护内容之中。再者,只有在政策的引导之下,相关的资金、技术才会加大投入,那么社交媒体的归档将不再因为网页复杂的归档要求而被KB-NL拒之门外。

3.2 扩大存档类型,完善活动轨迹

荷兰华人社群网页存档范围有较大的局限性,不利于对荷兰华人的网络行为展开精细化的研究工作。KB-NL应该将由荷兰华人发布的社交媒体及其相关内容作为馆藏的收录对象,在网络交流日益频繁的时代,社交媒体显然拥有不可替代的地位,美英加澳早已将Facebook、Twitter等社交媒体作为网络资源存档的对象。社交媒体的发布是即时且随性的,基于一定体量的社交媒体内容能够完整刻画出发布人的行为特征与活动轨迹,是不可或缺的研究材料。

3.3 注重社区联动,鼓励社会参与

在荷兰WA项目开展初期,KB-NL是以独立团队形式推动项目进程的,且荷兰华人网络资源集合的建立仅仅依靠一名在校的中国实习生[13]。该实习生是荷兰华人社区成员,对遗产和记忆的相关内容有一定的研究基础,但与荷兰华人社区群体相比,KB-NL目前的团队力量是保守且微不足道的。在未来的工作推进中,KB-NL应当适时改变工作理念,打破封闭内向的工作姿态,加强联合荷兰华人社群的力量,鼓励荷兰华人主动参与到荷兰华人社群网页存档项目中去,提高社会参与的积极性,发挥他们的主观能动性,保证WA项目与荷兰华人社群网页专题特色资源馆藏的可持续性。

3.4 规范存档内容,传播正统文化

虽然存档内容是经过选择的,但KB-NL发布的网页归档链接中依然存在一些非正统的中华文化,KB-NL应对存档内容的正当性与规范性引起足够重视,致力于传播正统中华文化并引导正确主流的价值观。

猜你喜欢
网络资源社群网页
知识组织理论下图书馆网络资源发现服务体系优化研究
Algoblu发布NEV网络资源虚拟化平台
基于HTML5与CSS3的网页设计技术研究
浅谈初中历史课程网络资源的运用研究
社群新玩法:分层和快闪
社群新玩法:分层和快闪
营销的最短路径
社群短命七宗罪
基于HTML5静态网页设计
搜索引擎怎样对网页排序