高校科研数据的隐私风险与治理
——以图书馆科研数据管理为视角

2023-03-21 06:29
新世纪图书馆 2023年12期
关键词:数据管理科研人员研究

屈 宇

0 引言

大数据时代将人类社会带入数据利用的黄金时代,在学术领域,科研数据成为数据密集型研究的重要组成部分,它所具有的证据价值对于确定研究的完整性及科研项目的成功至关重要。然而,随着数字化转型进程中数据技术与个人信息的深度融合,科研数据应用的负面效应逐渐显露,其中最主要的表现即为侵犯个人数据隐私,使得个人信息保护与数据充分利用之间形成对立,阻碍数据价值的进一步释放,因此,对于科研数据的隐私风险展开治理成为必然。

科研数据涉及的隐私侵犯也是科技伦理失范最常见的表现之一,多指在数据收集、处理、共享与使用过程中违反道德原则和价值观的行为,包括未经授权收集个人敏感信息,未经允许共享个人数据给第三方或用于未经授权的目的等。发达国家普遍对科学研究进行伦理监管以防范数据隐私风险,我国也在加快科技伦理失范的监管进程,目前,国家科技伦理委员会已成立人工智能、生命科学、医学三个专业委员会,相关领域科技伦理高风险活动清单正在拟定[1]。高校科研数据的隐私风险已成为科技伦理监管的重点,从而对高校科研数据管理的实施主体——图书馆提出了新的要求。高校图书馆通过建设数据平台或机构知识库等数据存储设施,为高校科研活动提供覆盖科研生命周期和数据生命周期的数据管理,在监管数据从收集、处理、存储、发布到重用的流转过程中,数据的法律问题尤其是数据隐私面临考验,对数据的顺畅流转构成一定的困扰。如何规范数据流通、保护个人隐私以符合国家政策监管要求成为高校图书馆科研数据管理工作的当务之急。故笔者梳理科学研究中容易发生数据隐私风险的活动,结合我国高校图书馆科研数据管理中数据隐私风险防范的实践与不足,提出相应治理策略,以期助益个人数据隐私保护,促进高校科研数据的共享与利用。

1 科学研究中的数据隐私风险

科学研究中的数据来源多样,与个人数据存在相当比例的交集,新型数据密集型人文社会科学研究、跨学科或交叉科学研究、大量生物学、医学研究中的底层数据皆来自个人数据。个人数据是个人信息的电子化存在形态,是与具体个人挂钩的直接涉及某个人的知识的记录或数值,包括姓名、地址、身份证件、个人特征等个人唯一标识符,以及健康状况、遗传信息、政治观点、宗教信仰,甚至刑事犯罪记录等特殊类别信息[2-3]。个人数据因其所承载的个人可识别信息而关涉人格尊严的典型形态——隐私,而隐私概念也进而在数据领域延伸形成数据隐私。数据隐私既包括数据中直接或间接蕴含的,涉及个人或组织的,不宜公开的,需要在数据收集、存储、查询、分析、发布等过程中加以保护的信息;也包括保护数据隐私的能力,如数据匿名化、数据扰动、数据加密等技术[4]。大数据时代,科研数据所具有的学术价值需要通过数据的广泛传播与重用来实现,这就使得科学研究中的个人数据在生命周期的流转中对数据隐私产生威胁,因此科研人员需对容易导致数据隐私风险的科研活动保持高度关注,注意隐私风险的防范,尤其在涉人类受试者研究和国际合作研究中。

1.1 涉人类受试者研究引发数据隐私风险

大数据时代,社会信息化和智能化程度飞速提升,技术环境也发生了巨大的改变。一方面,新兴科技革命大量发生在与个人生活或个人权利联系更加紧密的信息科学与生命科学领域,激起众多伦理与法律争议;另一方面,人文社会科学研究转向数据密集型研究范式,利用社交媒体、智能设备、网络日志等获取实时数据进行网络分析、聚类分析或关联分析成为热门,也给个人隐私保护带来威胁。大量包含人类受试者或参与者的新兴领域研究或研究方法使科研活动成为潜在的数据隐私风险源,对人类社会长期形成的社会价值体系构成正面挑战。涉人类受试者研究固然以促进科学或推广知识为宗旨,但因涉及到个人可识别信息的分析或收集,并且个人身份或相关信息已经或易于被研究人员确定,就对个人隐私或保密性构成了威胁[5]。科研人员须在进行以下类型研究时特别注意潜在的数据隐私风险。

(1)涉及个人可识别的受保护的健康信息的研究。此类研究中可能包含以任何格式(电子、纸质或口头)传输的带有可识别个人的人口统计信息,涉及个人过去、现在或未来的身心健康、诊断、治疗以及医疗保健等情况,可能带有姓名、出生日期、住址、电话号码、IP 地址等标识符,以及指纹、全脸照片等生物识别标识符,这些标识符均受隐私规则要求的约束,数据的滥用或无意暴露均可能导致隐私泄露。

(2)利用计算机和互联网收集人类参与者数据进行研究。当研究人员使用各种软件程序通过互联网分发和收集调查数据、创建商业调查、第三方调查或通过电子邮件进行调查时,调查数据的托管、存储、传输或删除环节都有可能存在隐私泄露风险。

(3)使用社交网站或移动设备进行人类参与者研究。随着社交网络新媒体与技术如Facebook、Twitter、微信等的广泛应用与发展,研究人员大量使用平台数据进行数据挖掘、使用网络爬虫或被动收集数据以了解人类行为和趋势,如果数据中的个人信息未能充分去识别,或数据被用于研究之外,就很容易产生伦理问题。Facebook 数据门事件即属此类,剑桥大学心理学系讲师 Kogan 声称以学术研究为目的获取了Facebook 的用户数据,但数据脱离了学术用途,被转移至剑桥分析公司用于影响选举,并帮助特朗普2016 年赢得总统大选[6]。

(4)涉及已有数据或二手数据的研究。已有数据或二手数据是指研究开始前业已存在的不具有隐私风险的个人数据,如已故者的历史记录和历史档案、可公开获得的虽可识别但非私人信息的数据、匿名数据集等,这些通常不构成人类受试者研究,但是已有数据或二手数据一旦与包含私人的、可识别信息的其他数据集混合,整个数据集就具有了潜在的敏感性,可能导致隐私侵犯。

1.2 国际合作研究导致数据跨境隐私风险

随着开放科学运动的深入,开放数据与开放的数据监管设施为数据的全球流动提供了便利,数据跨境传输促进了国际科学界更多的合作,但也因地区规制的差异带来新的数据隐私风险。事实上,对于个人数据隐私和安全的保护,不同的司法管辖区对数据隐私的范畴、约束、豁免不尽相同,法律规制普遍存在差异,如不事先加以了解并遵守,很容易在数据跨境流动中引发隐私风险,有可能导致严重的后果,阻碍数据传输与国际合作。

以欧盟《通用数据保护条例》GDPR 为例,这部法律虽然加强了整个欧洲个人数据隐私的保护与安全,但与世界其他国家或地区的法律规定不尽相同。首先,GDPR 适用范围广泛,它以数据主体的物理位置决定法规的适用性:在数据收集时实际位于欧洲经济区国家内的个人数据(无论参与者是否欧洲经济区国家公民或居民)受GDPR 保护;在数据收集时实际位于欧洲经济区以外任何地方的个人数据(即使参与者是欧洲经济区国家的公民)不受GDPR 保护,但是,如果该数据在返回欧洲经济区后被使用、存储或共享,则此类数据仍受GDPR 保护。欧洲以外发生的科学研究,当涉及以下任何一项时都会涉及个人数据隐私。(1)通过社交媒体招募的参与者居住在欧洲经济区;(2)使用第三方处理器如Qualtrics、Skype 等从居住在欧洲经济区的参与者那里收集数据;(3)直接接收来自欧洲经济区个人参与者或合作者的数据,以及前往欧洲经济区收集参与者的数据;(4)从合作者或其他第三方接收已被确定为受GDPR约束的数据时,都有可能受到GDPR 的管制。其次,GDPR 不仅保护可识别数据,还保护编码数据,这与其他国家形成显著差异。编码数据已通过去识别、加密、身份验证或访问控制等手段来防止信息泄露,在美国,编码数据不受隐私法保护,但GDPR 仍视之为个人数据。此外,对于匿名数据,即便不再存在指向私人信息的代码或链接,而且研究人员也无法将匿名信息与特定个人联系起来,GDPR 仍要求有关匿名数据的任何电子记录或纸质记录必须销毁。GDPR还为个人数据引入“被遗忘权”,允许任何人类参与者可以随时要求删除他们的数据[7]。因此,如果科研数据的范畴或性质适用GDPR,科研人员一定要严格遵守相关法规要求,包括关于知情同意、数据安全规则、及时通知任何安全漏洞的特殊规定,以及数据的被遗忘权等,未能遵守的科研人员甚至所在的科研机构都可能面临巨额罚金。

2 我国防范科研数据隐私风险的法律规制与政策监管

数据因其流通性、跨越性与可复制性而极易产生法律风险,全球范围内已有约120 个国家和地区制定了数据保护法规对其进行规制,其中欧盟的立法思路和系列保护规制对世界各国都产生了深远影响。在1995 年和2016 年,欧盟先后颁布《个人数据保护指令》与《通用数据保护条例》(GDPR),针对数据收集、储存、处理、披露等方面存在的各种风险进行规范,又在2022 年批准了《数据治理法案》,旨在从根本的人权视角来保护数据隐私,并在此基础上促进创新[8]。欧盟不断发展和完善对数据隐私的保护规制,强调在保护数据权利的同时防止数据流通受到干扰,这一治理理念很好地平衡了互联网与大数据时代的多方需求。

我国与欧盟同为大陆法系,在数据利用的规制方面对欧盟多有借鉴,《科学数据管理办法》以及《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)均对保障科学数据安全,增强数据要素共享提出明确要求[9-10]。但是,我国至今尚未出台专门的数据隐私保护法,而是通过多部法律中的相关内容以及多领域监管规范对个人数据隐私实行间接的保护。其中私法方面以《中华人民共和国民法典》为主,在人格权立法中细化了隐私概念,增设“个人生活安宁”这一条款来强化对个人隐私的保护。公法方面,2017 年颁布的《中华人民共和国网络安全法》规范了个人信息的保存和保护、法律责任、运营商对其行为的承诺等内容;同年底,国家信息安全标准化技术委员会发布《信息安全技术个人信息安全规范》,对企业必须遵守的隐私政策进行规范,并加强了对生物特征识别的保护。2021年颁布的《中华人民共和国数据安全法》进一步明确了数据安全与隐私保护的法律责任,随后,《个人信息保护法》正式施行,这是我国第一部专门针对个人信息保护的统领性法律文件,对公民个人、信息行业和监管机关都影响重大。《个人信息保护法》借鉴了欧盟等发达国家的立法经验,对个人信息处理规则、权利、义务以及法律责任等进行了规制, 并授权国家网信部门作为主要监管部门负责统筹协调个人信息保护和相关监督管理工作。我国当前主要由《个人信息保护法》、《网络安全法》和《数据安全法》中的个人信息保护内容间接规制数据隐私,对个人数据而言,法律内容的设定显得宽泛,权限界定含糊,违法处罚指向不明,追责方式也以事后追责为主;且监管部门更关注数据的安全,因而,现行法律及监管对个人数据隐私的保护总体上显得不够直接和充分。

对于科研活动以及科研数据中的隐私风险,法律或监管也未能体现出清晰的防范路径。在法律规制方面未能明确界定科学研究中的隐私侵害行为,也缺乏对科研人员风险行为的底线约束,既有处罚主要侧重一般社会行为下的隐私侵犯,并不适用于科学研究。此外,事后追责制、“知情同意”规则已逐渐不适应新时代场景下的实际效用。在监管方面由于对数据获取和传输的审查缺失或疏漏也频频造成隐私泄露,典型案例如华山医院与华大基因未经许可与牛津大学开展中国人类遗传资源国际合作研究,并未经许可将部分人类遗传资源数据通过网络跨境输出,造成我国大量重要的人类遗传资源非法外流,而类似的研究在欧洲或美国审查会非常严格[11]。

数据隐私保护是数据要素充分利用的前提,过于零散的规制不利于数据隐私保护的司法实践和监管,我国应积极学习发达国家数据规制的经验,尽快构建数据隐私的立法体系,加速数据隐私专门立法进程。在相关立法方面,不仅应明确各级政府部门的职责、数据隐私的保障措施、数据各方主体的权利、责任及处罚条款等,还应在数据保护的范畴、流转环节和风险类别方面进行细化,将个人数据扩展界定为从采集、存储到传播的各个环节都要对其进行保护的数据,将数据从采集、存储到传播各个环节的隐私权益规范化与法制化,使各类型数据包括科研数据获得确切的保护。而且,在立法作用方面要考虑前瞻性与预防性,变事后追责为事前预警,提高数据隐私保护的效果。同时,还要授权监管机构负责统筹,高效践行法律,保障实施效果。

3 高校对科研数据隐私风险的规范与审核

为了规避科研数据在收集、处理和流通过程中可能产生的风险,高校作为科学研究的重要阵地和科研活动的主要管理者,通常在国家法律法规框架内以及科学管理部门监管要求下,面向科研人员制定更为具体的规章制度来规范本校的科研活动,确保进行负责任的研究。制度内容一般会包含隐私政策,特别对涉及个人隐私的人体研究给予基本的行为规范。如南京大学在《南京大学科学研究行为规范与学风建设管理办法》中提到“在数据资料的采集与分析等方面,遵守诚实客观原则。”并且要求“尊重研究对象(包括人类和非人类研究对象)。在涉及人体的研究中,如在人体上进行研究、用人体细胞或组织器官等进行的实验和根据人体研究数据所进行的研究等,必须遵守现行的国家法律法规和伦理道德要求,保护受试人的合法权益和个人隐私,并保障其知情同意权。”并且要求“如发现研究活动存在弊端或危害,应自觉暂缓或调整,甚至终止,并向该研究的主管部门通告。”但管理办法对隐私风险高发的其他类型研究未及覆盖,约束范畴有限[12]。对跨境合作项目,《南京大学关于加强境外科研项目管理的实施意见》中要求“各院系对项目研究计划进行内容论证,重点论证研究数据、研究方法、研究成果的意识形态安全管理风险”,监管的重点在于意识形态安全,而数据跨境的隐私风险未能引起关注[13]。可见,高校层面对科研活动所涉数据隐私风险的监管政策不够全面和具体,存在监管空白,对科研人员缺乏有效的规范。

此外,鉴于数据隐私具有系统化、复杂化特点,个体往往难以在短时间内做出正确的判断,高校在制度政策约束之外,理论上应采取必要的行动干预——伦理审核。如果不能对涉人类参与者的科研活动提前进行主动的伦理审核,待到研究产生的原始数据、衍生数据以及成果数据进入数据存储设施,并通过数据平台或机构库发布共享供用户使用,就有可能陷入隐私困境,并最终阻碍数据的获取与重用。曾经就发生过有科研人员隐私意识薄弱,直到投稿到国外期刊被撤回,才知道文中涉人类参与者研究数据侵犯了个人隐私。欧美大学通常召集相关专业人士成立机构审查委员会,对大学开展的涉人类参与者研究进行提前审核并处理投诉,以免违反研究伦理和监管要求。以康乃尔大学为例,大学层面运营一个机构审查委员会IRB(Institutional Review Board),该委员会基于联邦法律,对校园所有涉及人类参与者的研究项目在研究开始前先进行审查,决定批准或豁免,以保护参加大学研究的个人权益;同时,IRB 还制定了多种指南,包括对不同司法管辖区隐私法律的指导、国际合作指导等等,引导研究人员正确使用外部政策、法规以及最佳实践,尽最大可能规避潜在的数据隐私风险[14]。

在我国,伦理审核已在国家层面受到重视,2022 年 3 月,国家印发了《关于加强科技伦理治理的意见》,为防范科技风险,全面推动科技向善制定了规划路线[15]。对科研项目的数据隐私风险,伦理审核通常立足以下基本原则:(1)确保知情同意程序充分和准确地向潜在参与者解释了参与的可能风险, 包括其个人数据可能泄露的风险。(2)恰当地保护人类参与者信息的隐私或保密性,并在研究方案申请和同意书中记录相关程序。(3)最小化参与者的潜在风险,包括与意外或恶意安全漏洞相关的风险。通过帮助研究人员在满足研究安全的前提下设计和开展人类受试者研究,伦理审核既能保护参与研究的人类受试者的数据隐私,也能保护研究人员和大学自身。目前我国已有少数大学响应政策成立了研究伦理审查委员会,如2022 年12 月,中国科技大学与清华大学的科技伦理委员会先后成立,逐步开展特定领域的日常科技伦理审核工作[16-17]。可以预见,伦理审核制将很快被越来越多的高校采用,这将有助于把科研活动对人的影响纳入科技伦理治理的范畴,将研究中的数据隐私风险扼杀于摇篮,同时,也对图书馆在科研数据管理中开展隐私风险治理提供有力的支持。

4 图书馆在科研数据管理中防范隐私风险的实践与不足

科研数据管理已逐渐成为我国双一流高校的标配,从提供数据存储服务的数据平台或机构知识库的建设来看,以高校图书馆为核心的科研数据管理服务广受认可,高校图书馆也被认为是遵循数据生命周期进行数据监管的最佳主体。据孙清玉等统计,近七成双一流高校图书馆建设了数据平台或机构知识库,开展高校科研数据的收集、利用与整合[18]。作为图书馆数据平台或机构知识库数据监管工作的一环,数据隐私的保护主要通过隐私政策、技术保障和素养教育等措施来实施。

4.1 利用隐私条款的约束来防范

发布隐私条款或保护政策是防范数据隐私风险的重要手段,平台或机构库通常在站点首页或使用条款中添加隐私内容,引导数据存储者规避隐私风险。笔者在网络调研中注意到部分平台或机构库未披露隐私政策,而发布的隐私政策则大多过于简单,常常声明一句“不得用于研究之外”,显得相当敷衍。西安交大知识门户额外要求数据提交者和使用者明确告知个人信息的收集来源,以保证个人信息安全,不被出于商业性、公益目的或透露给任何外部单位及个人;复旦平台发布了6 条隐私声明,对信息的收集、使用、安全性、反馈与撤销等作出简要说明;北大平台未在使用条款中集中展示隐私政策,而是将具体的隐私声明纳入各相应条款,要求用户在上传、下载、发布、提交、传输或传播数据时不得侵犯个人隐私,隐私政策内容相对丰富和全面,尤其对用户提交数据中的个人身份信息识别、数据下载和使用时必须满足的条件等进行了枚举,并强调用户提交的数据需满足二手数据或知情同意等前提,但平台不对提交的数据进行审查。总体来看,数据平台或机构库的隐私政策存在大量空缺或不完善,对科研人员缺乏具体的指导和明确的约束;虽然越是开放性好的平台,隐私政策内容也趋向丰富,但仍然与发达国家存在较大差异。欧美大学的图书馆通常会设置专门的隐私主页,除发布详尽的隐私政策外,更大量展示隐私相关知识、政策、法规(包括本国和他国的隐私法规)、国际合作隐私风险、隐私许可等内容,并积极提供隐私课程培训、隐私风险咨询、隐私评估以及最佳实践来指导科研人员尽力规避数据隐私风险。我国高校和图书馆在制订隐私政策内容和提供隐私服务方面表现出严重的不足和滞后,难以满足科学数据开放共享和重用必备的法律要求。

4.2 通过平台安全技术手段来防范

数据隐私还包括保护数据隐私的安全技术内容。数据存储依赖安全的计算机体系与新兴的数据保密技术,鉴于数据在其生命周期的每一环节都可能遭遇隐私泄露或其他不确定因素,平台或机构库通常对数据从初始生成到终结归档或删除的各阶段施以技术手段保障数据的安全。北大平台通过强调用户信息的真实性、请求与审核机制、多层级群组化的访问控制以及平台日常维护与数据备份来保障平台数据的安全,对平台汇聚的一批具有极高影响力的精品调查类数据进行清洗加工,去识别隐私信息后再供用户使用。复旦平台主要存储社科数据,包含大量隐私数据,但平台只向外提供经过脱敏已无法辨识的合计数据,并采取适当的安全防护措施,防止FISR 控制下的信息丢失、滥用和篡改。西安交大知识门户利用XJTU Academic Hub 屏蔽成果元数据中的个人隐私信息,最大限度保障个人信息安全。可以说,平台或机构库通过数据清洗、匿名去标识化等脱敏技术以及传统使用的定期升级、防病毒、加密、防火墙、身份验证、软件补丁、更新等技术措施对数据隐私安全构成了基本保护。然而,随着数据开放共享现实需求的不断增长以及平台数据存储量的持续走高,尤其在向云存储过渡的进程中,传统的安全防护技术恐难防御层出不穷的新发安全漏洞,隐私泄露将成为数据安全的一大隐患。

4.3 通过科研人员数据素养来防范

数据素养关乎科研人员的数据技能和科研伦理道德,具备较高的数据素养尤其是隐私素养有助于科研人员清晰识别和主动规避数据隐私风险。目前,高校的数据素养教育还不普及,且目前开展的数据素养教育也以传授数据技能为主,涉及隐私相关内容很少。如北京大学图书馆、武汉大学图书馆开发的数据素养课程中涉及少量科研伦理以及数据隐私素养内容,复旦大学社科数据平台在这方面表现相对优秀,在平台“数字素养”模块中专门针对“数字社会责任”开设了“法制道德规范”和“数字安全保护”课程,但大多数平台或机构库尚不能提供针对性的教育内容。隐私教育的缺乏不利于快速提升科研人员的隐私意识,仅依赖科研人员的自律难以有效防范数据隐私风险。

5 图书馆在科研数据管理中深化隐私风险治理的对策

通过梳理高校在科研数据管理中防范隐私风险的现实表现,可知高校图书馆的隐私政策及相关配套服务未能很好地约束或引导科研人员,亟需完善,在数据监管平台风险防控上技术较为陈旧,难以有效抵御网络数据安全的威胁与隐私泄露。最为关键的是隐私素养教育内容严重不足,远不能快速提升科研人员对隐私风险防范能力,因此,高校科研数据隐私风险的防范仅依赖目前的实践不足以获得满意的效果,无论从短期或长远看,都将制约科研数据的流转传播和价值释放。举目研究界,科研数据隐私的防范与治理课题也未获得足够的关注与指引,学者们热衷介绍各种隐私保护技术,或者从理论层面探讨大数据时代科学数据共享的伦理问题,只有少数研究探及实际应用,如罗兰花等基于医疗数据开放共享过程中出现的隐私问题,面向数据生命周期构建了一个隐私保护框架[19]。艾琼等则从我国科研工作者获取国外学术信息这一独特角度谈及隐私保护,并提出防范策略[20]。以及魏来等调研中外十余所大学科学数据管理平台的隐私保护政策,为我国出台相关法律法规,明确具体保护措施提出了建议[21]。但正如盛小平等总结,现有科研数据隐私的治理研究整体上还不成熟,需结合现有实践进一步深化[22]。因此,科研数据隐私风险的治理仍需着眼于科研数据管理实践,基于国家对数据隐私的法律保护以及大学层面开展的科技伦理审核,高校图书馆应在科研数据管理中深化数据生命周期隐私监管,同时不遗余力地提高平台隐私技术保护水平,以及对研究人员开展具有针对性的数据素养教育,指导科研人员正确使用外部政策、法规以及最佳实践,尽最大可能规避潜在的数据隐私风险。

5.1 健全和完善数据隐私保护政策和措施

图书馆作为高校科研数据管理的实施主体,应在高校科研活动中提供覆盖科研生命周期和数据生命周期的数据安全防范措施,在科研数据平台或机构知识库应用上制订详尽的隐私政策,对科研数据在收集、提交、上传、发布、下载、传输或传播等各个环节可能引发的隐私风险加以揭示,对科研人员潜在的风险行为进行明确的警示。实践中,可以通过研制隐私风险清单供科研人员自查,并开展隐私咨询来解答科研人员的疑惑,引导科研人员正确识别以及合理规避个人数据中的隐私风险。

5.2 加强和优化数据全生命周期隐私监管

由于当下科研人员对数据隐私风险的认知普遍不足,在科研数据管理中开展全生命周期隐私监管就显得颇有必要,有助于实时预警数据隐私风险,制止不当行为。具体而言:在数据管理规划阶段,平台或机构库应审查研究项目是否经过伦理审核批准,相关伦理或安全培训有无完成,某些生物医学领域的特别培训需要强制完成。在数据处理与存储阶段,应审查研究人员对数据的描述,明确数据的类别,不同类别的数据可能导致不同程度的隐私风险,需要差异化管理,某些健康信息可能需要签署特别的保密协议;对于数据的处理,应审查其合法性,确保经过数据主体的同意并授权,数据需经过清洗去标识,确保不暴露个人隐私信息。在数据共享与利用阶段,应确保用户对数据流动和使用的知晓及同意,避免隐私数据的不正当分享,如果发生隐私泄漏,应立即向伦理审查委员会报告,以便采取恰当、及时的处理措施。如果数据涉及跨境传输,要特别重视法律的国别差异,尤其是GDPR,应注意数据的被遗忘权以及确保有效删除等。总之,基于数据生命周期监管的隐私治理,关键在于使数据在流转的不同环节严格遵守法规和政策要求。通过隐私政策的间接引导以及数据全生命周期的主动监管,可能有效制约科研数据引发的隐私风险。

5.3 不断升级完善数据隐私与安全保护手段

数据隐私的治理还包括隐私保护技术的治理,应不断更新平台安全技术,防止科研数据隐私的泄露。随着云计算、大数据和边缘计算等技术的发展,数据隐私保护技术也在不断演进和完善,虽然任何技术都不可能带来绝对的安全,但数据平台或机构库应不断追踪科技发展,利用最新的技术营造相对最安全的数据存储环境。隐私计算在欧美大学已普遍用于保护数据隐私,如康奈尔大学利用隐私计算中的可信执行环境概念,对硬件在物理上加以保护,对软件配置进行漏洞监控,从而保障敏感数据安全;同时还提供隐私保护工具,如跟踪拦截器等来破坏黑客位置定位,并使用多方安全计算技术为数据加密,避免隐私数据被第三方非法获取[23]。我国医疗界对隐私计算已有试水,如王晨等发文介绍上海交通大学附属瑞金医院已使用数据分型、联邦学习等隐私保护技术保障临床科研数据平台的安全[24]。利用新技术手段保障数据隐私安全,是高校科研数据隐私风险治理的重要一环。

5.4 提升科研人员对数据隐私风险意识和能力

高校图书馆的数据隐私治理还应重视加强科研人员的数据素养教育。目前,数据素养教育还不够活跃,常隐身于信息素养教育,数据内容还不充足,数据隐私内容更显稀缺,短期教育效果也不明显,然而,治理是持续的,素养教育更应常抓不懈。针对科研数据管理中的数据隐私风险,图书馆应广泛开发面向科学研究的隐私素养教育内容,包括隐私风险识别、法律法规知识,隐私评估方法等,采用强制培训、线上课程、小型研讨会甚至素养竞赛等丰富多彩的形式,提高科研人员对数据隐私风险的认知、对相关法律法规的了解,使他们更具有隐私意识,尊重个人隐私,主动防范数据隐私风险,进行负责任的科学研究。

猜你喜欢
数据管理科研人员研究
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
企业级BOM数据管理概要
FMS与YBT相关性的实证研究
定制化汽车制造的数据管理分析
科研人员破译黑猪肉特征风味物质
海洋环境数据管理优化与实践
辽代千人邑研究述论
CTCS-2级报文数据管理需求分析和实现
治疗艾滋病,中国科研人员有了新发现
广东公安科研人员风采