面向网络空间的计算档案学建设:进展与展望

2023-07-06 14:31周文泓文利君陈淑涵
档案与建设 2023年4期
关键词:网络空间

周文泓 文利君 陈淑涵

摘 要:调查梳理面向网络空间的计算档案学研究成果,旨在明確计算档案学的发展场景与方向。文章对计算档案学代表性研究成果进行梳理分析,发现目前面向网络空间的计算档案学研究在面向网络空间的档案馆拓展、基于网络技术的电子文件管理变革、融合于网络空间的档案理论与方法重构三方面取得较大进展。随之,结合网络空间及其在中国的发展实际,文章提出计算档案学要围绕四个方面进行拓展:网络空间可解析为怎样的档案管理场景、计算档案学面向网络空间的扩展建设方向及其内容是什么、面向网络空间的计算档案学如何应用于实践活动、立足中国本土的计算档案学建设路径。

关键词:计算档案学;网络空间;档案化;网络档案

分类号:G270

the Development of cyberspace-oriented computational Archival science: Progress and Prospects

Zhou Wenhong1, Wen Lijun1, Chen Shuhan2

( 1. School of Information Resource Management, Renmin University of China, Beijing 100872; 2. School of Public Administration, Sichuan University, Chengdu, Sichuan 610064 )

Abstract: Investigating into the studies of cyberspace-oriented computational archival science aims to clarify the development situation of cyberspace-oriented computational archival science and further prospects. The research results presented in the IEEE Computational Archives Working Group are sorted out, and it is clarified that the current progress of computational archival science oriented to cyberspace is manifested as: the expansion of archives oriented to cyberspace, the change of the management of digital records based on network technology, the reconstruction of archives theory and methodology in cyberspace. Then it puts forward the prospects of the future development of cyberspaceoriented computational archival science from the aspects of the analysis of cyberspace, the direction and content of the development of cyberspace-oriented computational archival science, the development of computational archival science based on China and so on.

Keywords: Computational Archival Science; Cyberspace; Archivalization; Web Archives

计算档案学被界定为一个跨学科的研究领域,在我国被视作新文科背景下档案学发展的新方向,用以引导建立更系统的数字文件与档案理论、方法、实践体系。在内容体系建设上,计算档案学正从数字化的历史档案资源拓展向原生数据,尤其是日益在人类世界中扮演重要作用的网络空间中所形成的数据。网络空间是以信息通信设施及其使用者为基础,以数字化信息创造、存储、修改和流动为内容的互联互动空间[1],在智慧社会、数字孪生、元宇宙等未来导向的战略之下更将是建构与应用计算档案学的重要场景。因之,面向网络空间这一综合社会、文化、技术、管理等复杂要素集成的情境,计算档案学有着诸多尚待有效理解的可为之处与可拓展空间。

在研究层面,学界先是对计算档案学进行总体探讨为立足网络空间的探索奠定认识基础。一方面从理论层面对计算档案学的内涵进行探索,明确计算档案学是计算科学和档案学的双向融合;[2]另一方面依托关于各类实践项目的实证分析对计算档案学应有的内容进行探讨,包括从策略层明确计算档案学框架下档案实践的基本原则与方法、从更具体的方案层展现面向档案管理需求应用数字方法与技术的实践等。[3-4]随着计算档案学研究的不断推进,网络空间在计算档案学的探索进程中逐步显现。在数字转型大背景下,建设计算档案学的必要性与价值得到确认[5],网络空间及其相关技术的应用要求立足新的档案对象变革档案思维与方法。与之相应,计算档案学的基本内涵与内容体系同网络空间产生一定关联,探讨议题涉及把网络作为工具来对接从而将档案问题转化为计算方案的设计[6]、立足网络空间如区块链的具体情境创新管理模式[7]、将计算思维与方法应用到网络存档数据的开发利用中并由此拓展计算档案学的内容体系[8-9]。研究可见,当前计算档案学更关注档案馆或相关记忆机构中的历史档案资源,只有小部分包含网络空间中所形成的原生数据,且多聚焦于档案管理中有关数字化、数据化的场景。因而,网络空间所构筑出的数据情境以及相应数据对象、数据现象的特质没有得到充分关注。在各领域如计算社会科学、计算法学、计算传播学已经意识到网络空间的重要性与特殊性并积极投入研究力量的情况下[10],计算档案学尚有较大的跟进空间。由此,本文立足数字转型背景,明确计算档案学立足网络空间的关联要点、相关探索进程,解析与发现未来的建构方向与内容。

1 网络空间凸显为计算档案学重要发展场景

1.1 网络空间为计算档案学扩充建构背景

计算档案学的提出直接关联数字转型背景,其中网络空间的角色日益凸显。

一方面,计算档案学需要充分融入网络空间。当前,以智慧社会、数字治理、元宇宙等为核心的数字战略,无一不需要优化网络空间,计算档案学要识别与深度内化数字转型的要义,就需要积极对接网络空间,这也有助于计算档案学充分拓展与数据科学、计算科学的交集。进一步来说,网络空间的建设与运行是社会、技术、文化、管理、信息方法与实践综合作用的结果,可为计算档案学提供充分的探索场景。

另一方面,网络空间可持续发展驱动计算档案学发展。计算档案学作为超学科的提出也在于档案与信息学科积极贡献于人类世界的数字转型发展。当前,网络空间的有序治理已在全球得到倡导,数据维度如数据治理、数据安全、数据主权逐步显现,计算档案学均与此相关。因而,计算档案学面向网络空间的建构同样受网络空间长效运行需求所推动。

1.2 网络空间为计算档案学提供多维的数据情境

对计算档案学而言,其与网络空间的根本关联在于后者被称为流动的档案馆,数据与数据活动是网络空间的构建载体,是极有价值也应重点关注的对象。

一是从数据对象来看。网络空间的数据多具有原生性,由社会活动依托网络平台开展所形成,无论是数量还是特性,都将是档案在未来的主要范畴。计算社会科学及其引领下的计算法学、计算传播学、计算语言学、计算教育学等均指出,网络空间提供的原生大数据从价值、特征、数量等方面均有别于以往可获取的数据,也是各领域提出“计算+”的基础支撑。[11]于计算档案学也是如此,数据对象多是经过数字转换的历史档案资源,这些数字化的历史档案资源,同网络空间中的原生数据有着不同的背景、形式、内容,其体量、价值、复杂性等亦不相同。例如,网络空间中档案的多来源、依赖于第三方平台、权属难辨、需兼顾多方价值取向、场景复杂多样等特质显著,也就影响着对档案与档案属性的界定及相应的档案管理方法。计算档案学在这其中有诸多深挖之处。

二是从数据活动来看。网络空间的可持续运行依靠的是数据连续生成、累积与利用以及相应数据全生命周期的各项细节活动。因此,对计算档案学而言,网络空间可提供全面的数据管理行为,进而探讨文件的管理工作能否从当前主要立足后端延展至前中端等问题。同时,网络空间的数据活动同样显示网络空间特质,如非线性的特征和强化即时开发利用的要求,可为计算档案学强调以增值利用为目标再造档案管理全流程提供参照。

三是从数据场景来看。网络空间呈现的是源于实体世界但鉴于其虚拟性而有所变化的数据与数据活动背景。对计算档案学而言,网络空间有助于深化理解数字情境、数字情境对档案而言是怎样的背景、相应的数据与档案形成机制等问题。这对重新认识与构建档案理论与方法有重要参考意义。

1.3 网络空间为计算档案学显示顶层的认知与方法参考

网络空间在本质上全方面显示了人类世界的走向,对计算档案学意义的理解具有重要引导意义。

在认知层面,网络空间的建构与运行显示的是数字转型背景下的理念与认识,这是计算档案学建立整体框架的基础。网络空间的时空概念、认知要点、组织方式等,均显示出新特征,如去中心化、弱化时空界限的非线性、自组织显著等。于计算档案学而言,这样的认知基础同样要充分厘清并有效融合,以用于认知该环境下的档案以及档案活动。

在方法层面,网络空间“如何做”的思路亦是明确档案方法的前提。网络空间依托技术、管理的实践机制,适合于计算档案学探索以问题为导向的技术应用策略。同时,网络空间的重要支持是数字技术和管理机制的融合,是计算档案学基于计算思维形成方法论的基础。

2 面向网络空间的计算档案学探索进程

计算档案学开始于2016年在IEEE下设的计算档案学工作组的年度研讨会,逐渐形成关注领域聚焦且颇具规模的研究力量,其研究方向与成果逐渐显示出同网络空间的有效关联。[12-13]通过梳理Ieee计算档案学工作组的研究,面向網络空间的计算档案学研究成果主要体现在三个方面。

2.1 面向网络空间的档案馆拓展

对照网络的特质与功能实现档案空间的创新构建是计算档案学承接档案工作数字转型的重要议题,其探讨方向包括:

一是档案馆融入网络空间的数字复制。一方面,匹配网络空间要求的数字档案资源建设,凸显的是便于线上高效利用的可互理解互操作的档案数字化工作。另一方面,依托网络空间的数字档案资源服务优化,主要体现为需求和问题导向的档案线上服务平台与功能性工具开发,具体表现在以网络为工具,探讨包括网络档案在内的资源化相关功能设计、技术开发等。[14]例如,为满足研究人员对网络档案的研究需求,德国L3研究中心Helge所在的研究团队开发了多元网络利用平台,建立网络档案动态语料库,向用户提供按研究目的进行网络档案数据提取的工具,并进一步开发出对网络档案数据进行远读的功能。[15]再如,在技术开发方面,为增加对网络档案的描述,UCLA的Gilliland教授带领跨学科的研究团队运用自然语言处理技术和人工智能,开发社交媒体相似性算法(TSMS)和数据驱动的迭代式档案描述算法(DCAP),实现对大量且不断生成的社交媒体档案的深度描述,并识别其中的特殊言论进行标识,以促进后续对社交媒体档案资源的深度利用。[16]

二是探索如何将计算思维与方法应用于网络数据的档案化管理,由此拓展计算档案学的内容体系。目前研究要点为:(1)明确网络档案是重要资源,探讨计算档案学可应用并实现拓展的场景,推动高质量档案资源的形成。(2)网络存档的基本要求,如网络档案整合应充分融合来源以便于用户确认资源的适用性和局限以及对海量网络数据集的处理,从而用于验证计算流程的有效性和数据的充分度。(3)应借助数字技术为网络档案全流程管理开发工具。例如为提升网络存档数据处理效率而提出的面向分布式网络存档数据技术框架ArchiveSpark、对互联网档案馆所保存的近两万网页的存档数据而开发的相关工具[17]、针对电子邮件开发使用自然语言处理的以背景为基础的检索工具[18]、以Twitter的350万条信息为基础来探讨网络存档数据的文本挖掘[19]。

2.2 基于网络技术的电子文件管理变革

针对机构应用网络技术办理业务所形成的电子文件,计算档案学视角下的探索主要关注三个方面:

一是讨论网络空间及其不同工具应用的基本特征,从技术背景视角确认对电子文件及其管理的影响。例如有研究人员对关于区块链所形成的电子文件的基本认知、作用与缺陷以及相应的工作变化进行了探讨。[20]

二是明确网络空间的文化内涵,讨论对电子文件及其管理理念与方法的影响。例如,由社交网络的后真相传播延伸至对关于档案在网络空间中可信性、信任等相关核心概念的再界定。为应对网络环境中大量虚假视频的传播,由UBC信息学院Hoda领衔的研究团队运用古文书学理论,将可信档案方法与计算思维融合,从来源、真实性、可靠性、完整性等特征出发对网络视频的真假进行判断,进而基于机器学习,提出依据背景、元数据等信息对网络视频进行自动判别的方法。[21]

三是面向多元的网络技术应用,开发相应的电子文件管理工具。例如,立足区块链讨论电子文件与档案管理的模式并对后续的存取提出展望、使用拜占庭共识算法来管理网络分布式的文件档案等。[22-23]为促进对长期保存、销毁等鉴定结果的高效落实,UBC信息学院的Danielle开发了智能合约的方法,对电子文件所处的现行、半现行、非现行的生命周期阶段进行标识和元数据著录,在档案工作人员鉴定后,运用智能合约将文件变化传输至文件处置工具,由处置工具执行文件进行从临时存储库移动到永久存储库、从永久存储库中进行销毁等处置行动。[24]

2.3 融合于网络空间的档案理论与方法重构

网络空间推进了信息情境的全面建构,对与之相适应的档案理论与方法重构提出了一定要求。

一是计算档案学在确认数字档案理论与方法的建构中表现显著。计算档案学对历史档案的数据化开发已有较丰富探索,并扩展向对网络存档数据的管理与开发。例如,有学者认为可将网络档案视为大数据进行深度利用,借助网络档案的元数据和大数据特性开发相应工具,促进不同学科的学者跨学科进行网络档案的分享,并深入到数据层级的再利用。[25]

二是将档案化的管理方法拓展至更广阔的网络对象中。计算档案学将档案思维与计算方法和思维融合,并依托这样的融合实现对更丰富的网络对象进行档案化管理的可能,如将档案思维融入对NFT(数字藏品)等数字资产管理当中。以UBC副教授Victoria展开的项目为例,针对NFT的保存和交易中存在保障真实性的巨大挑战,其使用区块链技术和分布式账本技术融合来源管理、元数据管理、nFt之间的关联提出对NFT真实性保障的方法。[26]

三是面向网络空间对档案管理的理念和方法进行适应性重构的探索。例如区块链技术在为保证文件真實性提供有益方法之余,也为档案实践带来了新的可能。有学者研究指出,目前区块链应用于文件管理实践可分为镜像型、数字记录型、代币型。镜像型实践中的区块链仅充当文件哈希值的存储库,可被单纯视为促进档案实践发展的工具。数字记录型实践的区块链不再只是哈希值的存储库,文件会通过智能合约技术在区块链上自动创建,但目前的数字保存依赖于集中的可信数字仓储库,这就对传统的数字保存模式提出挑战。而代币型的实践中,文件不仅会在区块链上创建,而且地产、黄金等物质实体将会以加密货币的形式在区块链上存储,这意味着在这类型的区块链实践中每个实体都有可能成为文件,这样的特性将会对档案实践带来全新的挑战,如何保存管理这类文件将会是未来档案管理理念和方法亟须思考的问题。[27]

3 立足网络空间的计算档案学发展展望

总体来看,已有探索确认了计算档案学面向网络空间展开扩展建设的必要性、应有的基本内容与方向。随着我国继续强化网络战略,在建设人类命运共同体的愿景下,面向网络空间的计算档案学在我国具有强大的生命力,也有助于档案学自主知识体系的构建并引领全球话语。同时,现有探索在全球均处于初步阶段,尚须从基本点、重要方向等扩充为更系统的内容体系,产出基础理论与方法的创新成果:一是现有的计算档案学主要从历史档案资源的数字化、数据化建设的实践场景探讨理论与方法,对已成为重要的社会活动场景的数字空间及其所形成的数字原生信息涉及较少,未充分置于计算社会科学、计算法学、计算传播学等计算系跨学科建设所明确的网络空间之中。二是计算档案学同样要立足中国本土确认建设的路径与策略。目前我国的全球参与和本土探索均有限,且已有的数字转型相关理论研究成果也亟待转变为更上层的理论与方法。

在这样的建设导向下,计算档案学于网络空间的发展在内容层面有如下展望:

第一,网络空间可解析为怎样的档案管理场景。网络空间的构筑与运行依赖数字基础设施、技术、及其应用,直接的载体则是各类数据与信息。计算档案学面向网络空间的建构首先需要认识与理解网络空间提供的档案情境。具体内容涉及:网络空间有着怎样的司法、技术、文化、社会背景及其规则;网络空间由谁形成哪些数据,数据的内容、形式、特征、价值如何;网络空间从数据角度来看有哪些利益相关者,有怎样的生成、采集、支配、收益、利用、管理权责;网络空间对数据与档案的认识、规则以及功能是怎样的;网络空间现有哪些具有档案管理功能的机构或实体,都发挥怎样的作用,性质如何;根据上述内容,网络空间中的档案与档案管理应用怎样界定,有哪些突破已有认知与方法的地方。

第二,计算档案学面向网络空间的扩展建设方向及其内容是什么?立足计算档案学已有探索与成果,面向网络空间呈现的档案管理场景包括:依循历史档案数据化利用与现行数据档案化管理的两大主线,网络空间可为计算档案学提供哪些建构起认知、方法、内容体系的场景;网络空间在档案情境上具备怎样的特质,计算档案学现有成果可基于此有怎样的拓展;立足网络空间,计算档案学还有哪些可扩充或创新的方向值得探索;中国的网络空间中,计算档案学可深入探索的重点场景有哪些,预期的认知与方法成果是什么;面向网络空间,计算档案学的核心概念、基本档案理论与方法是什么,应呈现怎样的基本框架,又会显示出哪些具有中国特质的理论与方法?

第三,面向网络空间的计算档案学如何应用于实践活动。计算档案学的一大特质就是同实践的密切关联,面向数字孪生、元宇宙、智慧社会等前瞻战略日益凸显的全面网络化的人类世界,计算档案学立足网络空间的构建旨在从档案视角推进上述设想的可持续落实。相应探索内容体现为:网络空间的档案化管理需求是什么,有哪些值得重点关注的场景;网络空间档案化管理需要计算档案学提供认知与方法支持的重要方面是什么;通用的计算档案框架是怎样的,面向不同场景又有哪些代表性的应用路径;通过实践验证,计算档案学又有哪些可扩充完善之处?

第四,立足中国本土的计算档案学建设路径。充分挖掘数字转型背景之下我国的整体发展环境、学科建设要求、计算档案学自身的学科特性,确认计算档案学的本土化建设需求、方法与策略。具体内容为:我国数字转型框架下计算档案学的建设需求是什么;新文科与档案学学科发展背景下的计算档案学建设定位是什么;以网络空间为基础的面向科研教学融合、产学研一体化为背景的计算档案学建设方法与策略是怎样的?

4 结 语

本文对网络空间与计算档案学的关联展开深入分析,在此框架下梳理计算档案学面向网络空间的建设进展。在此基础上,提出档案学面向未来须及时跟进人类世界数字转型进程,面向网络空间的计算档案学系统建设是重要方向,并对建设的相关内容予以基本说明。同时,本文更多是以问题的方式呈现面向网络空间的计算档案学建设可涉及的内容,还需要深入每一方面建构出具体成果,也要对如何建设出系统的成果的策略进行探讨,这些都需要后续研究的深入探索。

*本文系国家社科基金青年项目“计算档案学视角下的网络档案信息资源建设研究”(项目编号:22CTQ042)阶段性研究成果。

注释与参考文献

[1]张新宝,许可.网络空间主权的治理模式及其制度构建[J].中国社会科学,2016(8):139-158,207-208.

[2]UNDERWOOD W. Computational Thinking in Archival Science Research and Education[EB/OL].[2022-12-15].https://ai-collaboratory.net/wp-content/uploads/2021/03/ Underwood.pdf.

[3]KIRáLY P. Measuring completeness as metadata quality metric in Europeana[EB/OL].[2022-12-15].https://aicollaboratory.net/wp-content/uploads/2020/03/7.Kiraly.pdf.

[4]UNDERWOOD W. Automatic Extraction of Dublin Core Metadata from Presidential E-records[EB/OL].[2022-12-15].https://ai-collaboratory.net/wp-content/ uploads/2020/11/Underwood.pdf.

[5]刘越男,杨建梁,何思源,等.计算档案学:档案学科的新发展[J].图书情报知识,2021(3):4-13.

[6][24]BATISTA D A, WEINGAERTNER T. ArchContract: using smart contracts for disposition[C]//2019 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2019:3060-3065.

[7][22][27]LEMIEUX V L. A typology of blockchain recordkeeping solutions and some reflections on their implications for the future of archival preservation[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2017:2271-2278.

[8][15][25]HOLZMANN H, GOEL V, ANAND A. ArchiveSpark: Efficient Web archive access, extraction and derivation[C]//2016 IEEE/ACM Joint Conference on Digital Libraries (JCDL). Newark: IEEE, 2016: 83-92.

[9]HOLZMANN H, GOEL V, GUSTAINIS E. N. Universal distant reading through metadata proxies with archivespark[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2017:459-464.

[10]申卫星,刘云.法学研究新范式:计算法学的内涵、范畴与方法[J].法学研究,2020(5):3-23.

[11]張小劲,孟天广.论计算社会科学的缘起、发展与创新范式[J].理论探索,2017(6):33-38.

[12]UNDERWOOD W, MARCIANO R. Computational Thinking in Archival Science Research and Education[C]//2019 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2019:3146-3152.

[13]AMBACHER B, CONRAD M. Computational Archival Science is a Two-Way Street[C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2021:2192-2199.

[14]ANDERSON B G, et al. The cybernetics thought collective project: Using computational methods to reveal intellectual context in archival material[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2017:2213-2218.

[16][19]YIN Z, et al. Using a Three-step Social Media Similarity (TSMS) Mapping Method to Analyze Controversial Speech Relating to COVID-19 in Twitter Collections[C]//2020 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2020:1949-1953.

[17]JAYAWARDANA Y, et al. Modeling Updates of Scholarly Webpages Using Archived Data[C]//2020 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2020:1868-1877.

[18]VENKATA S K, et al. EMCODIST: A Context-based Search Tool for Email Archives[C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2021:2281-2290.

[20]SMITH T D. The blockchain litmus test[C]//2017 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE, 2017: 2299-2308.

[21]HAMOUDA H, et al. Extending the Scope of Computational Archival Science: A Case Study on Leveraging Archival and Engineering Approaches to Develop a Framework to Detect and Prevent “Fake Video”[C]//2019 IEEE International Conference on Big Data(Big Data). Piscataway:IEEE,2019:3087-3097.

[23]KATUU S. Managing Records in Enterprise Resource Planning Systems[C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway:IEEE, 2021:2240-2245.

[26]ROSS D, CRETU E, LEMIEUX V. NFTs:Tulip Mania or Digital Renaissance [C]//2021 IEEE International Conference on Big Data (Big Data). Piscataway: IEEE,2021:2262-2272.

猜你喜欢
网络空间
共建诚实守信网络空间
网络空间教唆自杀行为的法教义学分析
网络空间安全人才培养专题概要
多元化多层次网络空间安全人才培养创新与实践
以科学的网络安全观加快网络空间安全学科建设与人才培养
网络空间并非“乌托邦”
军地联动共治涉军舆情 打造清朗网络空间
我国网络空间安全立法之名与实
网络空间安全人才培养探讨
网络空间安全学科人才培养探索与思考