新时代数据治理驱动档案管理创新发展分析

2021-07-02 15:03彭亚松蓝彧辉
科学与财富 2021年12期
关键词:数据治理创新发展新时代

彭亚松 蓝彧辉

摘 要:治理是现代社会、政治、经济、文化高度发展的产物。1995年,全球治理委员会在《我们的全球伙伴关系》研究报告中指出:“治理是各种公共的或私人的个人和机构管理共同事务的诸多方式的总和。它是使相互冲突的或不同的利益得以调和并且采取联合行动的持续的过程。”2013年党的十八届三中全会指出:“全面深化改革的总目标是完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。”2017年党的十九大报告提出:“加强社会治理制度建设,完善党委领导、政府负责、社会协同、公众参与、法治保障的社会治理体制,提高社会治理社会化、法治化、智能化、专业化水平。

关键词:新时代;数据治理;驱动档案管理;创新发展

引言

随着信息技术的深化应用,“一切业务数据化”[1]由构想成为现实,数据正在以惊人的速度不断增加,其类型不断丰富,其价值得到高度认同。数据管理正在成为当代社会的一项基础性管理工作,成为一项新兴行业[2]。数据治理作为数据管理的核心领域,在众多数据管理话题中得到了特别关注,已形成了一个颇具影响力的领域,表现在:先后成立了若干相关国际组织,比如数据管理协会(DAMAInternational)、数据治理专业组织(DGPO)、数据治理研究院(DGI)等;连续召开以数据治理为主题的年度性国际会议,比如数据治理与信息质量大会、欧洲数据治理大会等;产业界研发并推广专门的数据治理工具[3];数据治理方面的国际标准[4]、国家标准[5]陆续出台;工业和信息化部《关于工业大数据发展的指导意见》(工信部信发〔2020〕67号)对工业企业明确提出“提升数据治理能力”的要求,并将“完善数据治理”作为重点任务。

1档案数据治理研究动态

目前,档案治理研究主要集中在档案资源建设、档案法规建设、档案安全等方面,对档案数据治理研究相对较少,主要体现在以下三个方面:一是档案数据治理动因研究。WoolfreyLynn(2009)研究了调查数据档案在非洲地区治理中的作用,认为“调查数据档案是推动政策制定与社会研究的重要动力,非洲缺乏有效的调查数据档案,阻碍了国家政策的制定”。

“档案部门推行双套双轨制,制约了政府治理信息化能力的提升。” “随着‘上游’部门的业务实践已经开始规模性地呈现出数据态的典型特征,数据(化)转型已经引发文档部门的‘生存’危机,催生数据管理问题。” “海量档案数据的管理、大数据时代智能数据管理、档案管理效率等推动着档案数据治理的产生。”二是档案数据治理主体研究。分析了档案工作者和文件管理人员在地方治理中的角色,“以南非为例指出治理、消除贫困等问题都依赖于档案工作者和文件管理人员对档案信息的保管和获取”。 “只有多方合力和联动,共同治理,才能有效推动文件管理数字转型的顺利进展。”

对政务文件的归档主体地位进行了分析,提出“档案部门要借助既有的档案行政管理网络,通过制度、组织、机制、契约等治理技术,和相关机构结盟,协同开展政务文件归档。”[10]三是档案数据治理策略研究。澳大利亚国家档案馆(2016)以政府信息资产为核心制定了政府信息治理框架(InformationGovernanceFramework),“将多元治理、绩效评估和风险管理等先进理念融入政府信息策略中,并将其贯彻落实;通过问卷调查形式定期核查政府机构信息治理策略的执行情况”。 “档案管理部门在数据治理体系下有计划地在风险应对、组织业务活动记录、保存计划、元数据收集、访问控制、格式管理、数字取证等方面建立规章制度、标准体系以及技术工具集合,融入政府数字化转型。”

从目前的研究来看,面临的问题主要有:一是理论研究深度不足,未能全面分析大数据时代档案数据治理面临的机遇和挑战,对档案数据治理的内涵、方式、运行机制、实现路径等缺乏深层次研究,档案数据治理理论有待探索建立;二是缺乏整体性思考,相关研究内容较为零散,不够系统完整,整体理论框架尚未建立,对大数据时代档案数据治理体系缺乏系统研究和整体认识。由此可见,开展大数据时代档案数据治理研究有着巨大的理论潜力和现实需求。

一是能够拓展档案学研究思路。将治理理论与档案数据关联起来,从治理理论审视档案数据管理,推动档案学理论与治理理论交叉渗透融合,拓展档案管理研究领域,促进档案数据资源建设,丰富档案学研究内涵,为档案学研究提供新思路、新路径。二是开辟档案数据治理研究新领域。大数据时代数据资源的空间结构发生颠覆性改变,面对数据飞速膨胀、高度分散、价值多元、深度共享的特征,迫切需要开展档案数据治理研究,对档案数据治理主体、运行规律、内在关联、治理手段等进行多维度思考和深层次审视,形成档案数据治理研究范式。三是提升档案数据治理能力。通过创建大数据时代档案数据治理体系,着力探究档案数据治理运行机制及实现路径,有效提高档案数据管理效率与效能,增加档案数据公共服务供给,减少“数字鸿沟”和“数字不平等”,达到档案数据善治的目標。

2新时代档案管理创新发展的难点与对策

2.1档案数据资源的采集与保存难点

在大数据不断发展的今天,档案管理创新发展的难点在于如何借助大数据来加强档案数据资源的采集和建设。例如,企业档案数据形成诸多不同的系统,需要在不同系统中做好对接工作,实施数据采集的前端控制。

2.2档案数据资源管理的创新发展对策

2.2.1采取智能合约技术加强对档案数据的采集

档案部门要加强与数据形成部门的沟通,共同研讨并制定自动归档的智能合约,通过合约方式对各方的参与明确职责,完善归档条件。

2.2.2采用网络爬虫技术进行数据采集

结合主题网络爬虫工作原理设计主题爬虫系统,就特定领域主题中的数据予以采集,同时结合实际需求有针对性地进行优化,确保所收集数据的专业性、准确性和灵活性。

2.2.3档案数据资源质量管理

在数据采集的同时,切实加强档案数据资源管理,尤其是发挥大数据技术的优势。首先,以信息技术为载体,致力于档案信息化建设水平的提升。数字资源建设是整个档案管理的重要前提,需要尽可能地达到档案资源的共享。在档案整合方面,应利用可视化分析技术、云计算技术和语义分析等数据挖掘技术加以强化。其次,以安全建设为核心,致力于工程档案信息化管理的安全保障。

在准入安全建设方面,需要切实做好访问控制,更好地达到档案信息资源共享、受控的目的,包括完善访问控制体系、优化访问控制技术、对用户访问权限进行合理的认证与控制等方面。在接入安全建设方面,在保证电子档案信息资源得到受控共享的基础上,做好上传、加密控制,确保存储安全和档案用户隐私安全。最后,切实注重数据质量控制,以大数据技术为载体,加强电子文档信息资源的分析,更好地在管理决策上提供支持,从而确保管理的专业性。

2.3新时代档案管理创新发展的数据安全问题

数据安全是新时代档案管理创新发展的重要内容,所以需要切实加强数据风险的管控。因为数据属于整个导入系统平台中自动生成,所以势必会存在一定的风险。目前,很多数据编程的生命周期较短,在独立技术控制水平上较低,各类数据使用与保存在很大程度上依赖各类软件供应商,长期独立可控风险较高,一旦软件供应商发生变更,将可能导致原始数据难以正常使用,进而出现不可逆转的问题。除了这一常规的风险外,由于不同类型数据的存储格式较多,在不同的平台之间迁移时有很多风险,数据生成时采用的是专用的软件格式,若直接接收数据,现有的文件管理系统并非采取标准开放式的体系结构而开发。

所以,存档的数据具有迁移性与遵从性风险,而没有打开的存档格式使得数据复制可信度风险较大,不受信任存档数据难以达到法规要求。最后,在生成数据应用软件方面正在不断升级与版本控制,不同版本间的迁移风险较大,设计与制造部门在数据迁移时要确保其具有较强的可用性。

2.4确保数据安全的对策

为确保数据安全,需采取规范化、过程化和集成化处理对策。在规范化处理方面。需要对采集数据根据目前国际通用原则,对数据存储结构开放与可信,也就是分类型做好数据的处理,转换成适合长期保存的一种中间格式。当数据转换完成之后,需要对其完整性和有效性进行验证,再存储在独立归档库之中。而归档库则是利用时间戳和检验的方式来确保其完整性与不可更改性。在过程化处理方面。在数据转换过程中,需要经过三个过程,具体流程是:提取→转换→验证。其中,转换是从现有的业务管理系统中进行数据的提取和接收,并对其检验,且不能更改文件,再对所提取和接收的原始数据实施格式转换。整个转换过程严格按照相关标准,且兼容主流格式,在转换目标格式时采取与相关要求相符的格式,并利用系统就数据集进行自动验证,确保验证合格的数据能得到长期保存下来。在集成化处理方面。数据保存需要实施软件与配套的硬件的集成化支撑,且软件需要具有时间戳验证和校验功能,同时与有关要求相符,做好归档数据的封装,并形成存档包达到永久保存,按需形成分发包来分析和利用数据,并提升原始数据的轻量化特点,确保数据安全得到保障的前提下,才能更好地促进数字档案资源的开发与利用。

2.5 继续使用制度规范类数据治理方法

制定数据战略,加强数据立法,数据管理制度规范,这些是我们相对熟悉的数据治理方法。近年来我国数字档案管理方面的制度规范高密度出台,对于档案数据的规范化管理起到了积极的推动作用。在数据治理理念引导下,无论是宏观还是微观层面的制度规范建设,都需要进一步融入国家和机构数据治理的总体发展之中,尤其是在大家都非常关心的数据治理领域发出档案的声音。在宏观层面,近年来政府信息资源开放共享、个人信息保护、数据安全、大数据开发等都是关系到国家安全和社会治理的重要领域,2020年5月25日,全国人大常委会工作报告指出,今年将制定个人信息保护法和数据安全法.

档案部门应重视这些法律的制定和贯彻。在微观层面,档案部门应重视数据安全管理、元数据管理、数据质量管理等基础性管理活动的制度建设,切实改变纸质时代粗放的管理方法,面向信息系统中细颗粒度的数据管理,将多年来档案部门在可信数据维护、数据合规性方面的经验应用到数字环境中,写到制度中。

2.6 积极应用成熟度模型等评估类数据治理方法

DAMAInternational2017年第二版数据中,单独设立了数据管理成熟度的章节,成熟度模型最早是美國国防部用来开展软件供应商能力成熟度的工具,后被广泛应用于其他领域[38]。相比其他相对静态的评估方法,成熟度模型识别某项工作关键过程域和关键实践,不仅能够评价数据管理的现有状态,而且提供改进路径,因而也是过程改进模型。目前国内外先后出现多个数据管理成熟度模型,有些侧重于数据管理全局性的评价,如《数据管理能力成熟度评估模型》(GB/T36073—2018,简称DCMM);有些则侧重在某个方面的评价,如数字长期保存成熟度模型等。

数据成熟度模型是推动数据治理从虚走向实的一种方法和工具。《关于工业大数据发展的指导意见》的明确要求推广GB/T36073—2018,构建工业大数据管理能力评估体系,为此“鼓励各级政府在实施贯标、人员培训、效果评估等方面加强政策引导和资金支持”。近年来我国有学者先后开展电子文件管理成熟度模型、机构数字保存能力成熟度模型的研究,国家档案局也先后出台了数字档案室、数字档案馆的评价办法,可在此基础上,在数据管理能力评估体系框架下,综合相关成果,开展档案数据管理成熟度模型研究,并推动实施。

3结语

21世纪以来,国际文件档案管理领域开启了从“文件管理(recordsmanagement)”向“文件与信息管理(recordsandinformationmanagement)”再向“信息治理(informationgovernment)”的拓展之路。国际文件管理协会(ARMA)积极顺应时代变化,其定位从文件管理变成信息管理和信息治理的专业协会,认为文件管理是信息治理的组成部分,该协会还提供“信息治理专业人员”的认证。我国档案界没有经受过信息治理的洗礼,就直接跳到大数据时代。

大规模数据的应用对于商业、学术、社会等各领域都产生了强烈的冲击,数据概念开始普及,数据管理与信息管理、数据治理与信息治理伴生且有后来者居上之势,已经到了我们不得不重视的程度。只要数据管理行业的逐渐成形,档案部门只有融入其中,肩负数据治理的职责,才能获得与社会整体发展相匹配的发展。希望业界开始重视高层次数据管理—数据治理,切实提高业务能力,在数据治理中获得新时代的话语权。

参考文献

[1] 俞可平.全球治理引论[J].马克思主义与现实,2002(1):20-32.

[2] 王兆君,王钺,曹朝辉.主数据驱动的数据治理——原理、技术与实践[M].北京:清华大学出版社,2019:3.

猜你喜欢
数据治理创新发展新时代
创新发展背景下的高职本科人才培养对策
基于供给侧改革理念的高职教育创新发展策略研究
我国数据新闻的传统因素及创新策略
群众文化与传统文化的保护传承、创新发展
新时代下会计人员继续教育研究
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理