开放科学数据背景下档案馆个人数据开放获取政策研究

2020-07-29 12:33罗敏姜鑫
档案与建设 2020年6期
关键词:开放获取隐私保护档案馆

罗敏 姜鑫

摘要:随着开放获取运动的不断深入发展,档案机构陆续加入开放数据的阵营中并迅速发展。通过对国外档案馆数据开放获取政策的考察分析,探讨如何在保护个人隐私的前提下促进档案馆开展开放获取运动,有助于发挥档案数据开放获取的社会价值和经济效益,并为完善我国档案馆数据开放政策提供参考性建议。因此,文章研究使用内容分析法,在调研国外档案馆制定和执行的有关个人数据开放获取政策基础上,结合各国已有的数据保护法,从数据存储规范、数据重用规范和数据权益规范着手,针对档案数据开放获取政策中开放个人数据的规定进行了研究解读。最终提出国外档案馆数据开放政策中对个人数据保护的规定较为成熟,我国在丰富的档案数据开放理论研究和实践中,应尽快完善开放获取顶层设计,加强个人数据保护制度建构,搭建开放数据平台,实现资源共享。

关键词:科学数据;开放获取;档案馆;个人数据;隐私保护

分类号:G275

Research on the Open Access Policies of Personal Data in Archives in the Context of Open Scientific Data

Luo Min1,Jiang Xin2

(1. College of Information Management of Heilongjiang University, Harbin, Heilongjiang, 150080; 2. Research Center of Information Resources Management of Heilongjiang University, Harbin, Heilongjiang, 150080)

Abstract:With the continuous development of the open access movement, the archives have been promoted to join the open- data camp and develop rapidly. Through the investigation and analysis of the open access policy of data in foreign archives, we can explore how to promote the open access movement of archives under the premise of protecting personal privacy. Give full play to the social value and economic benefits of open access to archival data, and provide reference suggestions for perfecting the open access policy of data in archives in China. Therefore, this paper uses content analysis method on the basis of the policy on open access to personal data developed and implemented by foreign archives, and in combination with the data protection laws already in place in various countries, the research and interpretation of the provisions of open personal data in the open access policy of archives data should be carried out from the basis of data storage norms, data reuse norms and data rights and interests norms. Finally, this paper puts forward to that the provisions on personal data protection in the data opening policy of foreign archives are more mature, and in the rich research and practice of open data in archives, we should improve the top-level design of open access as soon as possible, strengthen the construction of the personal data protection system, and set up an open data platform to realize the sharing of resources.

Keywords:Scientific Data; Open Access; Archives; Personal Data; Privacy Protection

在科學数据开放共享的大环境下,数据已成为国家基础性战略资源,为开展科研活动和促进社会创新发展带来更多的机会。以欧美为代表的众多国家都已制定了推动科学数据开放获取的政策。如欧盟于2014年发布“地平线2020计划”,要求所支持科研项目的研究成果、研究报告和科学数据都必须开放获取,确保研究结果的公开和透明;2018年9月欧洲科研资助机构联盟发布“开放获取S计划”,阐述了未来科学数据开放获取的基本原则[1]。我国国务院于2018年颁布《科学数据管理办法》,明确了科学数据从采集、汇交、保存到共享利用等规定。然而,数据量的增长和信息技术的快速发展使科学数据开放获取面临许多实际问题。

作为提供公共服务的数据中心,档案机构存储着大量且密集的数据,是推动数据开放的核心力量,但由于档案的特殊性,侧重“保密”的责任定位在一定程度上阻碍了档案馆有效开展数据开放运动。为解决这一问题,美国国家档案与记录管理局发布《2018—2022战略计划》,提出让公众公开获取联邦政府记录来提高透明度、培养公众参与以及加强民主[2];新西兰档案馆颁布的《2057战略》提出三个战略领域,其中之一是坚持信息公开透明以支持开放政府行动[3]。此外,考虑到档案馆密集的馆藏资源可能包含个人隐私数据,在开放获取过程中难免与隐私保护产生冲突,要明确数据开放并不是无限制的开放,还需对可能带来潜在影响的矛盾进行关注和研究。即如何在开放数据的背景下协调好数据开放工作和个人数据保护问题是当前各国档案机构需尽快解决的问题。

1研究设计与文本选取

研究采用内容分析法,通过调研国外档案馆网站开放获取数据政策,从数据存储规范、数据重用规范、数据权益规范三个方面着手,针对政策文本内容进行深入分析,并提炼评述性的说明。

国外档案馆大部分已经颁布了关于个人数据归档管理及开放获取数据的政策,或者遵循本国信息委员会发布了数据管理文件(见表1)。在已有的数据保护法下各国更加重视开放数据过程中个人数据的保护。笔者对国外档案馆在开放科学数据背景下开放个人数据的政策规定进行研究,探讨如何在保护个人隐私的前提下充分实现档案数据开放获取的社会价值,创造经济效益,以促进档案馆开放数据运动的发展,并确保数据使用者和数据主体间的利益双向平衡,从而为我国档案馆数据开放政策制定和完善提供参考。

2国外档案馆数据开放政策内容分析

国外档案馆颁布的数据开放政策旨在通过指导档案部门正确处理包含个人数据的档案资源以平衡开放获取与个人隐私安全之间存在的紧张关系。自档案移交进馆时起,档案管理人员首先根据价值鉴定判定是否长期保存,同时规范数据存储格式和标准,以确保数据质量和数据可用性;其次,在数据开放利用阶段,需要明确受到豁免或限制的特殊情况,在发挥开放数据价值时保护利益主体的权益。基于此,笔者就搜集的政策文本进行内容分析,分别论述个人数据的存储规范、重用规范和权益规范,并总结个人数据归档工作依据各国不断修正更新的数据保护法所做出的调整。

2.1个人数据存储规范

(1)数据存储格式及标准

档案管理工作中,数据格式和标准规范性对推进数据开放和个人数据保护起着重要作用。开放数据常常可能因为数据标准或格式的不一致直接影响数据的获取和利用,对此,美国数据门户网站Data.gov和英国Data.gov.uk的开放数据集均以统一的数据标准和通用数据格式发布在国家级的政府数据开放平台[12],俄罗斯联邦档案署推行的指标则要求以RDF格式开放数据集[13]。

进入信息时代以来,为适应信息技术发展环境,电子数据和电子文件的归档标准也有了新的要求。美国国家档案与记录管理局发布的《2018—2022年度战略计划》提出,NARA正致力于以“开放政府”原则为基础实现转型,引领电子文件和电子档案的管理实践[14],并提出在现代化的电子档案存档2.0信息系统中开发处理电子档案记录的新应用。

(2)数据存储原则

档案需要经过价值鉴定来决定是否长期保存,这样有利于缓解数据保护和利益获取之间的冲突,保障具有持久价值的数据归档以及提高档案质量和减少档案馆后期重新整理数据的成本。归档的目的在于确保和维护数据处于可用状态,为公共利益服务。所以在考虑永久保存个人资料时,应考虑其在多大程度上促进了公共利益,特别是研究人员用于科学研究方面的作用。事实上,具有永久保存价值的数据量很少,根据维基百科显示,在美国联邦机构开展政府业务过程中创建或接收的所有记录,大约只有1%至3%被认为具有永久保存价值并转移到国家档案馆永久保存和查阅[15]。

数据的存档和管理遵循最小化原则,即根据处理目的将所收集、处理的个人数据限制在必要的内容上,使接触数据的工作人员控制在最小可行范围内。特定条件下应该设立个人数据保护信息专员,授予更多权利来维护个人利益,包括赋予调查权、追责权及处罚权。

2.2个人数据重用规范

(1)科学数据研究豁免

数据保护法中对科学数据研究豁免做出相关的说明,指出存档需要符合公共利益。《通用数据保护条例》提到,拥有公共利益记录的政府当局或私人机构,应根据联邦或成员国法律,为一般公共利益提供获取、保存、评估、整理、描述、交流、推广、传播和访問持久公共价值记录的服务[16]。以公共利益为目的的数据重用允许机构在不经同意的情况下处理个人数据,不受目的限制的约束,比如用于统计、科学和历史的研究、言论和信息自由的处理,但是仍应实施适当的保障措施,保障数据主体的权益和自由,尊重数据保护的本质,尽量减少不利影响。

(2)隐私影响评估

披露档案个人数据之前还应进行隐私影响评估(Privacy Impact Assessments,PIA),结合数据的性质、数据主体年龄和背景等因素,考虑重用是否会对数据主体造成经济、生理或精神层面的持续性损害。美国国家档案馆的隐私政策指出,PIA用于分析如何收集、存储、保护、共享和管理个人身份信息,其目的是证明系统所有者和开发人员在系统的整个生命周期中都有意识地考虑到了隐私保护[17]。澳大利亚信息委员会于2014年发布《隐私影响评估指南》[18],说明了隐私影响评估的过程。英国内阁办公室在2012年发布《开放数据白皮书:释放数据潜力》,提出在数据开放过程中进行隐私影响评估[19]。

2.3个人数据权益规范

(1)数据主体权益

数据保护法强调数据主体对个人数据感知和控制的重要性,给予公民更多的个人数据控制权,即数据主体的知情同意权、擦除权、更正权等,认为数据主体有权知道自己的数据为什么被收集、有什么用途、是否正在被处理以及申请擦除或修改不当的个人数据,但是在可能损害公共利益实现的情形下,这些权利则不适用。

当数据发布、重用和访问时,为确保所披露的信息在任何情况下都不能指向特定的主体,可以采取匿名化处理,即删除可识别出数据主体的标识符,使数据主体不能从特定文档的信息中被识别出来。在结构化的数据集中,可以通过删除记录级别的标识符实现,使其指向特定的集合而非单独的个体,如指向整个地理区域中的全部个体。

(2)数据使用者权益

原始记录性是档案的本质属性,所体现出来的凭证价值使其区别于并优于其他资料[20]。为了让档案使用者能有效地利用档案数据,数据归档之前的收集工作应该以明确的目的,保证其合法性、公正性和透明性。所有新收集的档案,无论是数字档案还是纸质档案,都应酌情进行风险评估和抽样,以确定这些档案是否包括法律规定的个人数据,保障数据来源的可靠,以及数据本身的真实、完整和可用性。

作为档案保存的个人数据并不需要实时更新,最重要的是展现历史的完整性,而非当前的准确性,在更正时可以通过补充语句来保证原始数据的完整。

3归纳政策内容要素

新形势下个人数据归档工作更加注重对个人数据的隐私保护,经考察分析,国外档案馆数据开放政策在不断更新的数据保护法下相应地进行了一些调整:第一,强调数据主体对个人数据的控制权,如知情同意权、擦除权、更正权等;第二,要求设置数据保护官、数据保护专员,对个人进行大规模、定期和系统的监测;第三,通知数据主体个人数据泄露情况;第四,对申请获取个人数据的档案服务请求进行隐私影响评估;第五,声明用于科学历史研究的个人数据处理豁免;第六,任何可能造成数据主体经济损失或人身伤害的处理,都必须有适当的保障措施以维护数据主体的权益。综上所述,考虑我国目前档案馆开放数据发展实际情况,笔者对国外档案馆开放数据政策内容要点进行了梳理(如表2所示)。

4对我国档案馆数据开放政策制定与执行的启示

档案馆作为科学数据的管理者,支持和推动科学数据开放共享运动[21]。在我国丰富的档案理论研究与实践的基础上,科学数据开放获取是时代的新要求和事业的新发展,档案馆确立自己的行业标准不仅是响应国家数据开放政策,也是适应数据开放环境变化的必经之路。

4.1完善顶层设计,平衡档案管理工作与开放共享需求

档案馆是收集、保管档案的机构,其一贯的严谨作风与开放共享的大环境有着不可避免的冲突和矛盾,随着开放获取运动的推行,档案馆应根据实际情况开展档案管理工作,将开放获取更好地融入日常管理之中,避免固步自封。其中政策的支持和指导是平衡档案管理工作有效开展和推进开放获取运动持续健康发展的关键,在开放获取环境下能够有效引领档案数据开放实践。从国家层面完善政策细节,为档案工作提供可靠的支撑,进一步促进国家档案数据开放的有序进行,建立具有中国特色的档案数据开放获取政策体系[22]。

4.2推动制定专门的个人数据保护法

个人隐私需要法律的强制执行力来维护,英国、美国、德国、澳大利亚等多个国家已经制定和颁布了个人数据保护法律,成为各国相关法律的标杆。虽然我国的许多行政法规包含保护个人隐私的规定,但是太过分散,仍需一部基础性的法规适用于不同场景下的个人隐私保护。2019年12月20日在全国人大常委会法工委的第三次记者會上,发言人岳仲明表示中国将于2020年制定个人信息保护法、数据安全法等[23]。此外,档案个人数据主体的权益、档案保管者的责任、档案使用者利用档案的权利应当同保护隐私的义务相协调[24],将档案开放利用环节中所涉及的关键各方纳入隐私保护法制定的考虑因素。

4.3加强档案馆开放数据建设

随着大数据的纵深发展,档案工作逐步从传统档案管理走向新时代档案数据管理[25],数据与档案服务间的结合引起越来越多的关注,其中个人数据保护问题、档案管理技术变革问题、开放数据下政府对档案工作的执法问题等较为突出,且人们获取信息的渠道越来越多样,档案馆需要开辟更多的途径让公民接触档案[26]。将开放数据融入档案工作,建立档案馆开放数据共享平台,不仅能够为档案馆数据服务提供更为便捷的获取途径,也可以通过档案工作进一步促进数据开放。档案馆开放数据建设使档案管理工作更好地适应新时代数据服务要求,实现开放数据价值,推动社会发展与进步。

5结语

社会的数字化变革使传播和获取海量数据成为可能,与此同时,人们呼吁保护他们的个人隐私。在大数据技术的发展和支持下,我国档案资源的开放利用有序展开,而档案利用和隐私权保护两者之间存在不可忽视的冲突,档案机构和档案工作者需要做出相应改变以应对这一挑战。为实现档案数据开放获取的稳定推进以及适应科学数据开放环境的要求,我国应结合社会发展的实际情况,做好开放获取的个人数据保护制度建构,加强档案人员数据管理能力和电子档案利用管理工作,完善档案数据开放获取顶层设计,保障档案数据的准确性和持续可用状态,以平衡档案有效利用和个人数据保护之间的关系,充分发挥档案数据开放获取的价值,使档案数据管理工作和个人数据保护工作在开放环境下日趋规范化和标准化。

*本文系国家社会科学基金项目“科学数据开放政策分析与评估研究”(项目编号:16BTQ060)和黑龙江省高校基本科研业务费专项资金项目“基于政策文本分析的科学数据开放共享政策研究”(项目编号:RWSKCX201922)阶段性研究成果。

注释与参考文献

[1]范昊,王贺.欧洲开放获取政策及其启示——以“开放获取S计划”为例[J].图书馆学研究,2019(9):37-43+73.

[2]NARA.Strategic Plan 2018—2022[EB/OL].[2020- 02-13].https://www.archives.gov/about/plans- reports/strategic- plan/ strategic-plan-2018-2022#toc-nara-mission-vision-and-values.

[3]Archives New Zealand. Archives 2057 STRATEGY[EB/ OL].[2020-05-18].https://assets.ctfassets.net/etfoy87fj9he/ 3P6g4z4tVLrCzd3L5fYj2F/a30f98886043c7122304303e7e269c1/ archives_2057_-_strategy_english_1.pdf.

[4]The National Archives. Guide to archiving personal data[EB/OL].[2020-05-22].https://www.nationalarchives.gov.uk/documents/information-management/guide-to-archiving-personal-data.pdf.

[5]NARA.Open Data Policy[EB/OL].[2020-01-20].https:// www.archives.gov/data.

[6]OMB. Guidance on Inter-Agency Sharing of Personal Data[EB/OL].[2020-02-10]. https://obamawhitehouse.archives.gov/ omb/memoranda_m01-05.

[7]OMB. Privacy and Personal Information in Federal Records[EB/OL].[2020-02-10]. https://clintonwhitehouse3.archives. gov/OMB/pubpress/privacy.html.

[8]OAIC. Protective Security Policy Framework[EB/OL].[2020- 02- 12].https://www.protectivesecurity.gov.au/sites/default/ files/2019-12/pspf-infosec-08-sensitive-classified-information.pdf.

[9]OAIC. Guide to securing personal information[EB/OL].[2020- 02- 12].https://www.oaic.gov.au/privacy/guidance- and- advice/guide-to-securing-personal-information/.

[10]LAC. Guidelines for information management[EB/OL].[2020-02-13].http://www.bac-lac.gc.ca/eng/services/governmentinformation-resources/guidelines/Pages/introduction.aspx.

[11]Archives New Zealand. guidance on how to determine access levels[EB/OL].[2020-01-21].https://archives.govt.nz/publications/records-containing-personal-information-held-at-archives.

[12]陈展.档案数据开放推进路径探略[J].浙江档案,2019(1):20-22.

[13]肖秋会.俄罗斯联邦档案署的开放机制建设与开放数据方案[J].档案与建设,2017(4):21-23+35.

[14]马海群.档案数据开放的发展路径及政策框架构建研究[J].档案学通讯,2017(3):50-56.

[15]维基百科.国家档案和记录管理局[EB/OL].[2020-01-24].https://wiki.hk.wjbk.site/baike-國家档案和记录管理局.

[16]EU. General Data Protection Regulation[EB/OL].[2020-05-25].https://gdpr-info.eu/.

[17]NARA. Privacy Impact Assessments[EB/OL].[2020-05-30].https://www.archives.gov/ privacy/privacy-impact-assessments.

[18]OAIC. Guide to undertaking privacy impact assessments[EB/OL].[2020- 02- 15]. https://www.oaic.gov.au/privacy/guidance- and- advice/guide- to- undertaking- privacy- impact- assessments/#is-a-pia-necessary.

[19]黄如花,刘龙.英国政府数据开放中的个人隐私保护研究[J].图书馆建设,2016(12):47-52.

[20]刘旭光,刘蔚.档案利用率质疑[J].档案学通讯,2011(3):98-101.

[21]盛小平,王毅.利益相关者在科学数据开放共享中的责任与作用——基于国际组织科学数据开放共享政策的分析[J].图书情报工作,2019(17):31-39.

[22]侯衡.中西方档案开放理论比较研究[J].浙江档案, 2015(1):13-16.

[23]法工委.全国人大常委会法制工作委员会发言人第三次记者会[EB/OL].[2020-05-20]. http://www.npc.gov.cn/wszb/ wzzb7/wszb_wzsl.shtml.

[24]闫静.美国档案开放利用中隐私保护立法经验及特点分析[J].档案,2015(10):52-55.

[25]陈雪燕,于英香.从档案管理走向档案数据管理:大数据时代下的档案管理范式转型[J].山西档案,2019(5):24-32.

[26]冯惠玲,刘越男,马林青.文件管理的数字转型:关键要素识别与推进策略分析[J].档案学通讯,2017(3):4-11.

猜你喜欢
开放获取隐私保护档案馆
关于智慧档案馆与数字档案馆的关系探讨
浅谈MOOC与信息素养教育
“大学图书馆发展趋势与服务创新论坛”综述
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
国外开放获取平台对我国科技期刊OA发展的启示
社交网络中的隐私关注及隐私保护研究综述
大数据时代的隐私保护关键技术研究
开放获取对国际眼科学期刊文献计量学指标的影响
when与while档案馆