基于数据策管的博物馆数字服务设计
——以故宫博物院一站式线上数字平台建设为例

2023-10-16 02:42康晓璐
自然科学博物馆研究 2023年4期
关键词:数字内容用户

康晓璐

一、 “数据策管”的概念与必要性

在互联网迅速发展的社会环境下,大量数据促进着数字内容的生产,成为人们获取信息的重要渠道。然而,有以下几个主要数据特征导致数字内容利用效率难以提高:1.数量庞大、增长迅速,缺少统一管理;2.更新迭代导致数据流失;3.数字技术退化导致数据不可用[1-2]。如何对数字内容进行及时且正确的策管并加强其利用率,成为很多机构难以应对的问题。

美国国家科学基金会(National Science Foundation,United States,简称NSF)、美国学术团体协会(American Council of Learned Societies,ACLS)均认为,为应对数字信息流失的危险,须建立或加强系统且有效的管理措施,并将这一解决方案着重放在“Data Curation”工作中[3-4]。2001年,数字保存联盟与英国国家空间中心在伦敦联合举办的国际研讨会中首次提出“Data Curation”概念,其引入生命周期的概念对数据进行全面管理,保证数据的长期保存和增值活动[5-8]。英国数据策管中心(Digital Curation Centre,DCC)是自“Data Curation”概念提出后成立的全球第一个国家级数据策管中心,该中心2008年制定并发布了其数据策管生命周期模型[9],该模型用图形高度概述了成功进行数据策管和保存数据的活动内容、实施步骤和行动路线。本文中所讨论的数据策管是基于DCC的定义,指为满足当前和未来的利用需要,对一系列可信赖的数据进行管理保存,并对其增值的过程[10]。

这一新术语的出现表示既要对数字资源持续进行保存和管理,也要对数据进行增值管理,达到知识增长目的[1],以此弥补传统数据相关工作的链路缺失。目前大部分博物馆正在开展数据管理、数据保管、数据监管等工作,包含数据开发、收集、存储、实施、应用和监督等过程。但这些传统模式各有侧重,主要关注整个数据流程中的某一环节——可使用、可访问、可统计分析。业务被条块分割或缺少从业务的整体角度来审视这些数据,难以对数据的全生命周期进行管理,提升数据价值。例如各大博物馆在初期建设票务系统时,数据层面的主要工作在于数据的生产、保存、获取等,未能深入到在数据产生之时就进行对数据实现管理和促进数据利用的活动,造成系统和服务在更替时出现历史数据无法被访问和重用,或需要清洗大量数据才可获取有用信息,这就是缺乏对数据全生命周期的关注。再如由于数字技术和数字化设备的发展较快,过往采集的数据资源格式无法再访问或复用,导致博物馆的应用程序或是在展览中的展示屏出现内容缺失、无法交互,甚至乱码黑屏等问题,究其原因主要是缺少对数据可持续利用和重用的规划。

不同于传统模式,“数据策管”作为贯穿数据整个生命周期过程的持续性数据管理活动,强调的是数据的全生命周期,以正确的顺序识别和计划各阶段活动,从而维护数据的真实性、可靠性及完整性,目标是保证数据不仅仅按原有方式被应用,实现数据增值[1]。对于动态的数据集,它意味着要不断对数据进行丰富和更新,使其能够符合应用目标。数据策管是针对数据的质量控制规范,也就是在利用、转化数据而产出一系列数字内容的过程中,开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数字内容的价值。数据策管需要充分融合业务、技术和管理,以确保数据使用价值和文化价值。在博物馆领域,数据策管独有的增值特点对馆藏文物的保护及公众教育起着重要作用,其核心为保护(conservation)、保存(preservation)和获取(access)[11-12]。国际上,随着图书馆、档案馆、博物馆一体化的趋势,单纯的数据管理、保管、监管已无法满足多场景、多元化、多平台的数据应用,数据策管的综合性意味着从数据产生之前即要开始积极管理,包括提前进行数据生成的有效规划,并认为数据的重用是实现数据价值和持续利用的关键,而数据要想实现重用,它们必须经过专门的处理,通过持续的策管增值活动和对数据生命周期动态管理则是解决数据长期应用和重复利用问题的关键[13]。博物馆的核心职能为收藏、研究、展示和教育,利用数据策管能够提高博物馆数据资源的价值、利用率和共享能力,从而提升信息传播、资源重复利用效果,不仅可以更好地发挥博物馆服务公众职能,还可以节省博物馆成本。

数据策管概念的提出,提醒机构认识到从数据产生之时就需要各方合作制定策略,科学地对数据生命周期各个阶段进行管理,保证数据质量及状态,达到提升数字内容利用效率的效果。这一进步要求博物馆在数字化工作时除了关注数字服务质量,也应同时注重数据质量,即在确保数字内容能在当前使用的同时也能在未来被真实再现和利用,同时实现知识增值。

二、 博物馆“数据策管”的特征

DCC数据策管周期模型分7层,中心层为数据层,第2至5层为数据策管生命周期功能活动层,第6层为数据生命周期顺序步骤层,第7层为特别处理层。模型分为4个模块:“数据”对象、数据策管生命周期功能活动、数据生命周期顺序步骤以及特别处理。博物馆的数字服务设计工作重点在于研究用户需求及前端媒介发展趋势、制定工作规划并进行团队沟通协调。数据策管周期模型的加入要求数字服务设计团队从规划之初关注数据业务,并将参与到数字内容制作流程中的各个团队组织进数据策管工作队伍中开展数据服务。本文基于数字服务设计工作流程中的顶层设计、方案实施、总结评估三个方面,分析博物馆数据策管的特征[14]。

(一)数字服务设计结合数据策管的顶层设计

1. 数据保存计划

在数字内容生产之前,博物馆数字服务设计的主要职责是对用户及数字内容制作方案进行调研,除了对用户体验等方面进行调研,也需总结出数据管理上待改进之处。在这一阶段,为确定用户对数字内容的利用需求,根据“FAIR”(findabilty,accessibility,interoperability,reuse)原则,需要对数字内容的可寻找、可访问、可交互、可再用方面进行用户驱动型的全面规划[16]。数字服务设计工作通过前期调研,对数字内容服务环境及用户使用场景相对了解,可以与数据保存者合作,参与制定数字内容的管理规则,包括数据创建规范、数据组织、管理的标准、道德规范和知识产权问题、数据共享和反问计划、以及长期保存策略[17]。通过制定规则可以明确需求者的具体要求,为数据的生命周期不同阶段提供科学指导,保证产出质量。

2. 描述与表示信息

因成本预算等原因,博物馆所制作的数字内容大多分布在各种数字媒介中,所以亟需建设一个覆盖所有媒介的统一资源检索利用引擎,实现一站式的数字内容查询服务。在梳理制定主要规则后,需进一步规范数据接口开发统一检索模块。在描述及表示阶段,数字服务设计团队应基于用户调研结果,分别构建不同属性数字内容的索引和字段,也就是参与制定元数据的标准及描述,确保数据对象能够被用户快速、准确、全面的获取,能够长期有效地共享、控制、复用[18]。数字服务设计团队可以在制定元数据描述内容上提供建议和协助,共同研究数据存储库建设,合作完成数据的上传、检索、提交。

(二)数字服务设计结合数据策管的方案实施

在博物馆中,数字服务设计的方案实施阶段主要为落实具体的服务功能开发制作工作,与文物数字化、信息系统构建、数字资源、内容转化等团队沟通协作,重点为保证按时、按规定完成交付,却很少了解或管理数据状态。为了确保数据长期可用并提高利用效率,数字服务设计团队需要关注数据每一环节的生产归导过程、加强各团队之间的合作,根据具体实施情况调整、更新需求文档,关注数据状态,保证数据状态有序有效,数字内容可长期共享。在策管周期模型中的映射涉及社区守望及参与,以及数据生命周期顺序步骤层与特别处理层[14,19],以提升数据生产规范、增值价值、安全性和长期可用性。

1. 社区守望及参与

目前,互联网已经成为公众学习和生活的重要场所,数据共享成为博物馆更为关注的课题。但数据资源类型广泛,公众习惯使用的媒介平台种类繁多,这导致数字内容在不同平台中所产生的数据结构各异,造成数据共享困难。数据共享的主要目的是维护数据在内容层面的可用性、技术层面的可持续性及基于两者的用户层面的价值性[14]。数字服务设计的一项职能在于转化线上内容,这是连接用户需求和开发要求的重要一环。因此在数字服务设计过程中加入数据策管环节,能够在制定数据交换标准等方面发挥积极作用,为实现不同媒介平台的资源共享提供信息参考及实践建议,对博物馆建设用户友好型、数据共享型媒介平台提供依据。

4) 所在楼层、公共交通、教育配套、生活配套对徐州市主城区的住宅价格影响不大.这可能是由于选择的研究区域为徐州市主城区,居民生活条件好,私家车拥有率高,学校分布均衡,基础设施完善.

2. 数据生命周期顺序步骤层与特别处理层

数据生命周期顺序步骤是围绕数据进行的8个行为,包含:概念化、创建或接收数据、评估和选择、摄取、保存活动、存储、访问和使用及再利用、转换;特别处理是在特别情况下可能需要增加的额外行为,包括处理、重新评估和迁移[14]。博物馆的数字服务设计在这一阶段主要是根据方案执行情况和各方反馈制定、更新需求,与后端技术人员同步信息。数据的加工、存储等具体执行工作通常直接由博物馆的文物信息管理系统和数字资源团队进行。在这一过程中,如果缺乏前后端之间的全面沟通,数字内容制作规划信息不对等,有可能导致数据只能适用于某一媒介平台或系统,出现数字内容更新迭代,或者更换系统之后,数据无法使用的情况。数字内容无法在前端长期利用,就需要重新对数据进行加工、存储、获取等,增加工作成本的同时也延长了数字内容制作周期。在用户要求不断增加、数字内容不断迭代的环境下,快速应对前端变化、提升数据利用率是博物馆增加竞争力的一个重要因素。因此数字内容进入执行阶段时,在数字服务设计中须加强前、后端技术的合作,密切关注数据质量,及时总结用户感兴趣的主题、语义及信息,对后端技术人员构建知识增强系统提供支持,提高对数据策管的意识。

(三)数字服务设计结合数据策管的总结评估

博物馆的数字服务设计在总结评估方面主要是对数字内容产出结果的分析总结,重点关注用户使用情况、复盘项目问题,规划数字服务的下一步优化策略。结合数据策管工作,为了保证生产的数字内容及其产生的数据能够不断地被应用和复用,节省博物馆成本,在这一阶段需要在总结工作中主动将数据情况一并进行收集、管理、评估,发现并提供用户个性化数据利用信息,自下而上制定用户驱动型数据质量改进方案,包含参与数据收集与关联、用户体验与改进等,并确保切实可行。在策管周期模型中的映射涉及管理与保存,以及数据特别处理层[19],以重点提升数据的增值价值。

在管理与保存方面,根据DCC数据生命周期模型,在这一阶段,管理与保存形成一个连续不断的动力循环,来保证数据策管的成功实施。按照Panos Constantopoulos 等人基于DCC数据策管生命周期模型和DCU数字策管过程模型的研究,这一阶段具体包含了监管、知识增强与维护三个方面[20]。总结评估阶段的核心在于实现数据价值增值,在增加数据资源功能性的同时,减少“垃圾”数据的产生,即数据已无法在前端使用,但却在后端处于长期保存的状态。除了将本机构的数字内容发布与共享之外,数字服务设计团队通过分析用户行为,有助于将用户行为数据与机构自身发展制定的计划建立关联,提供个性化的利用场景。基于这一关联,参与数据的管理和保存工作,能够让数据更加有序和有效,提高外部对数字内容的利用率。

三、 故宫博物院“数据策管”的策略与思路

对于数字内容的管理,一方面需要对用户调研,把控数字内容,合理策划数字内容;另一方面需要对数据进行有效管理,在服务能力、人员合作、跨学科技术等诸多方面进行规划[21]。一般情况下,国内博物馆往往缺乏专门统筹策管数字内容的岗位和硬件条件,但要提升数字内容利用效率,须数据策管人员主动、持续地在数据的生产、保存、增值方面加以全面管理。故宫博物院(以下简称故宫)在实践与研究中发现,由于数据的多样性与复杂性,数字内容利用率的提升效果不显著——数据缺乏主动管理,其中一个重要的原因是相关人员的协作存在障碍。此前,大部分博物馆主要是从数字服务设计的业务视角开展数据相关工作,系统是业务系统,考虑的是业务功能的实现,较少从数据层面考察业务流产生的这些数据。如今,机构逐渐重视通过分析挖掘业务所产生的大量数据来支持决策,但从业务系统及业务功能实现的角度较难达成,这就导致需要增加数据视角梳理业务流产生的数据,起到能够支撑数据驱动的决策过程,以及和其他业务产生的数据进行联合分析。这种模式下,工作职能的割裂以及专业能力的不同导致参与数字内容全生命周期的各个团队在协同工作时沟通不够深入,对于数字内容未能提前开展足够有效的数据策管,数据的流失、数据的不可用、数据的需求不匹配等问题成为阻碍数字内容有效管理的隐患。为应对以上问题,基于数据策管周期理论完善数字服务设计成为故宫的一个重要思路。

(一)数据策管与数字服务设计并行策略

为将数据策管工作融入数字服务设计环节,加强对数据价值的关注,故宫结合两部分内容制作了基于数据策管的数字服务设计扩展模型,涵盖顶层设计、方案实施和总结评估三个方面、13个阶段。从工作内容分析,基于数据策管的数字服务设计工作,对于参与管理数字内容具有一定的积极影响,比如数字服务设计工作面向公众、更加理解用户的需求,进而能最大限度地参与到数据相关规则制定的工作中;数字服务设计工作需要不断与各业务团队沟通、协调,善于连接前端与后端合作工作,保证管理的顺利进行;数字服务设计工作在数字内容的生产和利用链路积累了大量的实践经验,可结合拓展到数据策管工作之中;数字服务设计工作擅长内容转化,能够充分挖掘数据价值提供参考信息等。

新的扩展模型以数字服务设计的实际工作周期为基础,融合数据策管周期模型,建立数字服务设计与数据管理设计的并行工作机制(见图1),探讨利用数据进行数字内容服务设计时,在每一工作环节可能加入的数据策管理论,以此增加所使用数据的利用寿命、保存方式和增值效果[9],从而提升数字内容的利用率和管理模式。下文将具体分析故宫博物院移动端一站式数字服务的顶层设计、方案实施和总结评估三个阶段,探索运用新机制融入数据策管所进行的工作。

图1 基于数据策管的数字服务设计扩展模型

(二)结合数据策管的顶层设计策略

1. 数据保存计划

当前,故宫博物院的数字内容存在数量繁多、位置分散、各平台数字技术多样等情况,导致更新迭代过程繁琐、数据维护成本较高。为改善这一情况,故宫博物院在移动端建设“一站式”数字服务平台——“故宫博物院”微信小程序,调用并整合核心数字内容,以统一现存的大量数字内容平台并进行科学管理保存,提升数字服务质量和运营效率。在故宫博物院“一站式”数字服务方案制定时,除了对用户体验等服务方面进行调研,也总结出在数据管理上待改进的问题。通过梳理线上数字内容,对其进行整合和分类,构建“一站式”服务平台承载核心数字内容(见表1)。

表1 “故宫博物院”小程序整合的故宫线上数字内容

在设计故宫博物院一站式数字服务中,通过用户调研总结出初期建设一站式数字平台的整合重点:一是整合核心在线数字资源,统一维护、统一调用。二是通过规范各个平台的数据接口管理、统一日志等工作,推进在线服务及相关业务数据管理规范化。数字服务设计通过与数字内容生产全周期的团队合作共同制定数字内容的管理规则,可以明确需求者的具体要求,为数据活动的不同阶段提供科学指导,保证产出质量和数据增值价值。

2. 描述与表示信息

在一站式数字服务的设计中,元数据字段的标准及描述参考了故宫博物院建设的文物信息管理系统、数字资源管理系统,同时参考各个数字平台和数字内容现有的元数据制定情况,进行综合评估后确定提取及整合复用方案,实现对元数据的统一管理。以文物信息管理系统、数字文物库、“故宫博物院”小程序三者中文物信息元数据字段的映射关系为例。故宫博物院建设的文物信息管理系统已对馆藏文物和建筑制定了元数据规范且相对比较固定,数字文物库当中文物基础信息的元数据字段来源于文物信息管理系统,在一站式数字服务平台中,通过综合评估后小程序直接提取、复用数字文物库中的元数据字段,保持元数据标准及描述与底层文物信息管理系统一致。此方案的制定一方面提升数据管理效率,只维护底层数据系统即可保障元数据的标准及描述在链路上始终保持一致;另一方面保证数据输出的真实性和可靠性,数据链路确保元数据可作为唯一识别字段,向业务人员及普通用户提供准确、高效的索引。

根据制定的规则,一站式平台的数字内容建设查询服务模块,对元数据字段描述的要求具体到每一分类(见表2)。数字服务设计过程中需要在制定元数据描述内容上提供建议和协助,共同研究数据存储库建设,合作完成数据的上传、检索、提交。在数据生产阶段开始,保证数据链路统一、真实可靠。

表2 “赏名画”版块元数据描述

(三)结合数据策管的方案实施策略

1. 社区守望及参与

在建设故宫博物院一站式数字服务中,为寻找用户友好型数字媒介,前期要进行大量调研。故宫博物院制作的数字内容涵盖App、HTML5页面、微信小程序等多个数字媒介,较为复杂。通过对比各媒介平台的特点,微信小程序已经开放多类数字内容的场景入口且用户基础最为广泛[22],这两大优势符合现阶段故宫数字化应用策略,故将其作为承载平台,以适应整合目前核心数字内容。利用微信小程序兼容性强的特点,通过不同平台之间数据调用、同平台(小程序)间直接跳转的方式迅速、低成本的接入自身架构中,能够顺利解决各个平台之间的“信息孤岛现象”并规范各类资源数据接口标准。在制定数据接入方案时,各数字内容不是简单的直接呈现,为了消除板块之间的割裂,增强用户体验,其他媒介平台中的核心信息整合运用到原生开发的页面框架中,以“故宫博物院”小程序中“赏物”版块为例。这一版块下的内容分别来自不同的数字内容平台,“赏名画”栏目中的绘画类文物信息数据来源于故宫“名画记”,“文物库”栏目中的文物信息数据来源于故宫“数字文物库”,“多宝阁”栏目中的文物三维数据信息来源于“数字多宝阁”。

2. 数据生命周期顺序步骤层与特别处理层

DCC策管周期模型中,此阶段主要围绕数据生产、保存和处理来执行一系列具体工作。这两层针对数据状态,按照实施情况以及前端人员的改进方案,处于连续循环的过程,不断优化数据质量。在数据处理阶段,为保障其在媒介平台的可获得性和兼容性,要明确数据审核和格式管理。在搭建“故宫博物院”小程序一站式数字服务平台的实施过程中,接入数据的方式主要通过API接口实现。通过参考用户调研结果,数字服务设计团队参与对表格、存储路径等方面进行合理创建制定,实现数据库的正常运营[23]。在保障数据更加有序和有效的情况下,增加从各数字内容端口和后台数据系统调取有关文物的数据信息效率。依靠接入的数据,基于数据库中的内容,可使用到小程序独立开发的原生页面框架中,提升数据展示灵活性。在数字服务的实施方案阶段,结合数据策管有利于将各个数字内容的数据接口标准化、规范化,提高数据安全性。

(四)结合数据策管的总结评估策略

数字服务设计团队在数字内容上线后,会对其使用情况、用户反馈等数据进行汇总,制定下一步的改进方案。故宫博物院在一站式数字服务平台的总结评估环节中,会及时分析用户行为数据。自2020年7月16日平台正式发布上线起一个月内,总访问次数326.9万,总访问人次129.2万。数据显示,一半用户会体验小程序内的文化专题两次及以上,有明显的用户粘合现象,“老用户数”占全用户的40%。同时用户的平均体验时长为3分01秒,趣味的交互惯性会增加体验时长。

除对使用数字内容产生的用户行为数据进行评估外,数字服务设计团队也借助问卷调查的形式进行用户调研。2020年7月至9月,设计团队向公众发放调查问卷(1)问卷调研对象为一线、新一线、二线、三四线城市,18~60岁人群,调查样本量为1000份。。结果显示,对比中国区域内现有博物馆数字项目,公众对故宫制作的数字内容的整体认知度最高,约占59%。对了解并使用数字内容的用户进行研究分析,能够快速获取故宫知识和在线一站式游览模式是用户喜爱小程序的核心原因,以此提高用户访问量和利用率。同时,89%的公众认为数字文博对提升故宫文化兴趣有着积极影响。综上,以用户为中心的用户驱动型数字内容设计具有更高的竞争优势。用户体验的设计不在于自上而下地运用技术方案感知需求,而是需要根据有实际意义的调研结果,自下而上地运用用户导向型方法提升数字服务。在这一循环中需要各个团队通力合作,根据用户与数字内容之间的交互效果改进数据策管方案,提升数字内容的数据增值。

四、 结论

运用数字服务设计与数据策管并行机制搭建“故宫博物院”小程序,在此平台获取数字内容的用户数量远超于各个独立媒介平台的数量,对提升数字内容利用效率产生了实质性效果。一方面通过访问数据的倍数增长及多次访问的行为数据得出,用户粘性较强,对使用数字内容的状态较满意;另一方面,通过调查问卷显示,大量用户对于知识全面性、技术承载方式、流畅便捷的体验及文化元素的创意形式都较为满意,并因此愿意推荐给其他用户。同时将核心数字内容集合到此一站式服务平台,可对原本割裂的各团队及数据进行统一管理,实时同步更新底层数据结构、保障前端运营机制、快速解决运维问题,从而提高数字内容利用率。

为改进数字内容的管理能力,提高数据生产、保存及增值质量,故宫博物院搭建了一站式数字服务平台,集成核心数字内容,建设文物信息库。同时,为防止数据流失,保证数据长期可用,基于数据策管理念开展新的数字服务设计工作。从数字服务设计的角度来看,在数字内容设计、实施、总结的过程中,与数据策管并行的工作机制思路可归纳为:以实施需求为目标,结合数据策管理论参与到制定各数字内容的元数据体系和加工模式中,对接口一致性进行规划,使数字内容之间互通,更好地对数据进行维护工作;在数字服务设计中提升数据策管意识,增强数据策管知识,了解如何与内容保存者协作提升数据保存及复用能力,突破以往各个数字内容仅仅围绕自身考虑的局限;在数据调研工作中,对数字内容的长期可持续发展提供参考信息,实现数据增值价值。博物馆新的数字服务设计工作模式不仅成为连接博物馆数字内容与公众的桥梁,也帮助数字化全流程工作团队参与数据策管工作中,协助、建议数据策管周期各个阶段的方案制定,实现加强数据增值、共享、长期利用和保存的策管目标。

但实际上,博物馆领域由于缺乏相关理论研究、实践基础和技术支持,以数字服务设计的角度推动数字内容管理工作还比较浮于表面,且评价机制主观性较强,目前只能依赖需求策略后推数据策管各阶段的机制。数据策管对专业知识、数字素养、综合技能有更多要求,因此数字服务设计结合数据策管也面临诸多挑战。未来,随着数字媒介技术的不断发展更迭,故宫博物院也将继续探索更加适宜数字内容集成的媒介环境,注重在提供数字服务的时候,强化数据服务意识,完善相应的线上数字内容管理机制。

猜你喜欢
数字内容用户
内容回顾温故知新
答数字
关注用户
数字看G20
主要内容
关注用户
关注用户
如何获取一亿海外用户
成双成对
数字变变变