智慧城市框架中的数字档案资源来源

2016-02-04 00:45
浙江档案 2016年1期
关键词:数据管理档案馆智慧

1 引言

智慧城市的概念最早出现于20世纪90年代,是指以支持城市经济的可持续发展和保证市民高质量的生活为目标,投入人力资本与社会资本、强化覆盖传统与现代通信基础设施,通过参与式治理实现自然资源的智慧化管理[1]。智慧源自对数据的感知和理解,智慧城市的创新依赖于对数据的收集、分析与应用,而智慧城市建设中产生的数据也就是我们所熟知的“大数据”。为融入智慧城市建设、适应档案信息化建设新常态,我国档案学者提出了“智慧档案馆”并开始了相应的实践探索,数字档案资源也成为档案学研究的热点。然而学术界对数字档案资源却一直存在着认知不清、界定不明的问题。有学者认为智慧档案资源仍然由传统档案、数字档案与网络档案资源构成,而有学者认为智慧档案资源来源范围将会扩大,特别是实时的、泛在的数据信息源,还有学者认为大数据时代所保存的信息记录都将成为数字档案资源。本文试从数据管理视角对上述观点做一梳理和评价,并讨论智慧城市中数字档案资源的来源。

2 智慧城市中的数据来源及其特征

智慧城市中的数据来源十分丰富。根据数据形成终端来划分不同,覃雄派等认为主要有传感器数据、网站点击流数据、移动设备数据、射频ID数据[2];巴蒂认为除了与传感技术有关来源外,还包括由人自身与众包产生的数据[3][4];基钦对智慧城市中的大数据来源做了理论抽象,将其分为指令型数据、自动型数据、志愿型数据三种[5]。以数据形成主体不同来划分,卡恩与基亚尼认为智慧城市数据来源有行政管理机构开展的数据收集服务与部署的传感平台、市民通过参与收集的数据和条件传感机制[6]。阿瑞巴斯—比勒将智慧城市数据来源分为由个体携带的移动传感器产生的数据、商业组织的网上活动产生的数据、政府以开放格式发布的政府开放数据三类[7]。智慧城市中的数据具有偶然性、开放性和泛在性[8]。偶然性一方面是指智慧城市中的数据生成具有自在性,是作为人类活动的副产品自然而形成的,另一方面是指数据潜在的价值是偶然间被发现而非事先假定。开放性是指(政府)数据对于研究者、公众、商业组织都是平等开放的,数据的利用不收取任何费用,不设置障碍性的数据开放利用条件。泛在性是指数据无时无刻不在产生,数据无处不在,用户可以在任何时间任何地点利用技术获取数据服务。此外,不同类型的数据来源又有自身的特点,如以基于地理信息服务的社交媒体数据具有移动性、时效性、交互性等特点[9]。

3 基于不同档案属性的数字档案资源观

数字档案资源具有较强的伸缩性、延展性与可扩展性,不同学者对于数字档案资源具有不同的认识,这取决于“档案意象”[10]选取的不同。

3.1 档案文件观关注传统档案和电子文件的资源整合共享

持档案文件观的学者属于传统保守型,他们关注技术因素对于数字化档案资源整合与利用的影响,忽略了对原生数字档案资源的研究,同时对于新的档案现象与档案形态缺乏学术敏感度。杨来青认为智慧档案馆的档案资源包括馆藏传统档案和新型档案的内容信息与载体信息;包括档案馆采取各类技术手段管理档案资源的档案管理信息,如档案馆楼宇智慧管理信息等[11]。傅荣校、施蕊认为智慧档案馆是对原有的数字档案馆“馆藏数字化、传输网络化、管理自动化、资源共享化”的目标进行深化[12]。毕娟认为智慧档案馆的档案资源不仅包括纸质文档,还包括数据库、多媒体等电子形式[13]。开展智慧档案建设工作必须要以一个全新的视角,不能拘泥于传统的方法。杨艳、薛四新等认为智慧档案馆中的档案馆资源的来源范围会逐渐扩大,不仅仅来源于传统档案馆定义的机构和部门内部形成的档案,而且应将范围扩大到云数据中心、社交媒体、电子商务网站等对社会发展有重要推动和影响作用的服务社区或电子商业环境[14]。

3.2 档案记忆观要求建立更为全面的档案资源体系以增进社会包容

大数据时代的到来使得数字信息可以记录人类社会活动的几乎所有细节。杨智勇认信息时代保存的所有信息记录都属于数字档案资源,人们需要通过对记忆的选择来建构“智慧记忆”[15]。张芳霖、唐霜认为目前的社会记忆建构更加注重宏观层面,是一种自上而下的方式,提出构建地域性档案资源以丰富社会记忆[16]。丁宁认为应尊重公民参与馆藏“社会记忆”构建的权利,以社会公共利益为导向优化馆藏结构以协调国家记忆与社会记忆的冲突[17]。数字档案资源生成的社会化及其数据来源的多元化要求对档案资源的界定更具包容性。冯惠玲教授指出“档案资源”的含义大于“档案馆藏”,泛在、实时的数字资源是巨大的信息源,舍弃这部分资源必然造成当代社会活动记录的残缺不全。她倡议档案机构构建一个基于互联网的,以档案数字资源为主体的“中国记忆”数字资源库[18]。徐拥军对此做了进一步构想,但他所建议构建的数字资源库的建设内容仍然局限于对传统文献资源进行鉴定、扫描、数字化的整合[19],这显然偏离了冯惠玲教授所指的泛在实时信息源。

3.3 档案数据观强调档案管理从管理文件到管理数据的转变

智慧城市与大数据、开放数据、传感数据密切相关,得到学者越来越多地关注。刘越男指出随着信息化的发展档案部门需要更多的资源,要想建设智慧档案馆,目前的任务仍然是怎样拥有数据和管好数据[20]。安小米认为大数据是一种重要的公共数字资产,要合理有效开放政府数据。政府数据资源是智慧城市建设信息环境治理的重要组成,提出要创新政府数据管理模式,建立覆盖政府数据生命周期的管理制度[21]。高茂科认为职能部门的业务系统时刻都在运行,这意味着每时每刻都会产生档案数据,同时馆藏实体档案也通过数字化技术如扫描、拍照转为档案数据。他将档案大数据的来源分为系统数据、业务数据、采编数据三种类型[22]。智慧城市的最主要特征是全面感知,一些学者认为基于物联网技术覆盖所形成的传感数据成为档案数据的重要来源。郝伟斌认为可以建立采用物联网技术的档案数据感知系统对用户、档案、档案馆建筑进行数据感知,通过对这些数据进行分析和处理实现对档案管理的预测和智能控制[23]。薛四新认为通过感知技术对于档案馆人、事、物感知所产生的数据均属于数字档案资源。智慧档案馆基础体系架构中技术层保证档案馆对人、建筑、档案、设备设施、装具、环境的智慧感知,传输层将这些感知数据传递到海量数据中心[24]。智慧城市是一个有机系统,档案数据遍布智慧城市各系统。当前我国档案学者习惯采用“自我”而非“他者”的研究视角,仅关注档案馆系统内部形成的数据,缺乏对其他专业领域档案资源的关注。

4 档案数据资源观的提出

4.1 档案数据资源观

数据成为后工业社会新的价值来源,web2.0技术是信息范式转换的主要诱因,这将导致数据管理成为继文献管理、信息资源管理之后图书情报学的又一重要领域[25]。数据管理是一个涉及图情档学科和计算机科学的多学科研究领域,研究内容包括数字资产的生命周期(数据的选择、收集、维护、保存、评估、传播、增值)、工作流、元数据、知识产权。东南大学、武汉大学学者提出考虑借鉴国外高校经验建立数据管理教育专业[26],以满足图情档博机构、政府机构、数据管理机构、高校、科研机构对于数据管理人才的需要。档案数据资源观是基于数据管理视角,从档案的数据属性和数据的生命周期出发,将档案数据以数据管理的方式进行全程管理,并且依托于云平台和内容管理系统进行管理。

档案数据资源观的提出源于开放数据建设,开放数据的建设促使政府数字服务的关注点从管理文件向管理数据转变。2012年,奥巴马签署美国数字政府战略,要求政府工作人员转变数字信息观念,将所有的管理内容看作数据,把非结构化内容转换为结构化数据[27]。此外,还要求政府数字信息服务应实现由文件管理向由数据驱动管理范式转换。我国学者也提出档案部门要做整合开放公共数据资源的积极实践者和数据资源的集中管理者,档案界应积极探索大数据时代档案数据管理的理论、方法、途径,确立大数据、大资源、大平台、大服务理念在档案数据管理中的战略地位,促进档案部门从“管档案”向“管数据”的事业转型和拓展职能[28]。全国人大代表蒋秋桃建议设立国家数据中心来集中统一管理属于国家的数据和其他机构、个人移交捐赠的数据[29]。据悉青岛市档案馆计划将青岛市智慧档案馆建成青岛市档案数据中心,而湖南湘潭已先行一步,出台了数据管理制度,依托国家综合档案馆设置了数据中心。

国外档案学者开始关注数据管理领域也促使档案数据资源观的形成。达夫与亚克力从档案学视角对数据策展做了相关研究,数字策展拓展了档案学界线并有助于推动数字资源保管机构在拓展数字资源方面得到发展[30]。科研数据管理是开放数据和数据策展共同的一个研究方向,亚克力申请的为期三年课题项目“参与共同体以培育数字保护与数字策展见习”以计量社会学家、考古学家、动物学家为研究对象,探索他们在科研数据的保护与策展方面进行决策与行动的影响因素[31][32]。

4.2 档案数据具有大数据的特征

大数据具有数据量大、类型多样、高速存取、范围广、相关性与灵活性的特征,国内学者对于档案是否构成大数据存在争议,也有学者开始使用了“档案大数据”。李泽锋、宋淑琴、周枫等结合大数据的特征认为档案资源符合并具有大数据特征[33][34][35],于英香认为这种概念套概念的做法是一种“牵强附会”,档案资源不具备大数据的特征。档案数字资源更多的是滞后的、静止的、稳定的数据,比如已归档电子文件,档案数字化文件等数据信息[36],无论从电子文件管理实践还是从文件连续体理论来看认为电子文件是滞后的、静止的、稳定的观点是有一定局限性的。

首先,从智慧城市建设对档案领域产生的实际影响来看,档案数据量大大增加。王丽华博士根据数据、信息、知识之间的关系范畴,认为档案信息资源是大数据的观点容易引起概念上混淆和逻辑上的倒退。数据是反映客观事物属性的记录,是信息的具体表现形式。在不同的语用环境中,数据具有不同的语义理解。“档案大数据”中的数据不仅仅是指本身无意义的数据,也包括文件,大数据实质上指的是大规模的信息流或数据流。数据,特别是原始数据也是数字档案资源一种,特别是基于web2.0和传感网络生成的社交数据、行为数据、监控数据和系统数据。其次,文件连续体理论来看,文件的形成具有共时性和连续性,并不是静止的、固定的、不变的。文件连续体理论是一种以过程为中心的文件管理理论,共时性则是指在某个时间点对文件进行管理,这意味着文件始终是一个正在形成中的过程信息。在网络空间环境下,记录信息具有无限可分的连续性[37]。无论是传统的电子文件还是新型的档案数据本身就不是固定的,这些档案数据的生成、维护与更新决定了数据具有实时性、动态性、连续性。

5 未来数字档案资源来源的关键领域

当代档案资源建设最大的机遇和挑战是数字档案资源的崛起,档案机构实体资源收藏范围是基本确定的,而数字资源则没有明确的边界,很大程度上是谁建设谁拥有[38]。开放数据、众包数据、征信数据将成为今后数字档案资源来源应着重关注的领域。

5.1 开放政府数据

开放数据是指任何人都可以访问、使用和共享的公共数据,具有可获取性、机器可读性、免费、不受限制的特点,是经过开放鉴定并且在政府开放许可范围内的,不受著作权、专利权等的限制,可以面向社会公众开放与自由获取。开放数据既是智慧城市建设的要求,也是实现城市智慧治理的资源要素。麦肯锡全球研究院研究表明开放数据现象虽然是近年来才产生的,随着众多技术的进步开放数据将更具有现实意义并越来越盛行,开放数据正在成为“新常态”[39]。我国虽然也开展了开放数据建设,但没有将信息公开与数据开放区分开来,在开放内容、格式、数量、平台、管理、参与度、评估方面与国外存在较大的差距。目前我国的政府信息在公共数据中仅是“冰山一角”,档案部门根据其职能职责,可从整合各类公共数据资源入手,在保障国家安全、商业秘密、知识产权、个人隐私的前提下,全面整合并开放利用各类数字信息资源[40]。

5.2 征信数据

目前我国的社会信用体系还处于初步建设阶段,征信机构为个人和机构建立诚信档案,对于交易行为的监管和投资者权益的保护尤为重要。互联网金融和大数据的出现直接引起金融征信体系的变化,利用社交网络和云计算进行征信数据收集保证社会征信数据的公正性将会创新今后的征信数据收集方式。同时,目前我国尚未建立完整统一的行政管理征信体系。有学者预言,未来一定会在国家层面新成立一个主管机构或由一个政府职能部门出面牵头,建立互联互通的国家级行政管理征信体系[41]。这也将是国家档案事业拓展档案数据管理职能的契机。

5.3 众包数据

众包是互联网用户参与网络内容生成、分类、发展、评估、共享的一种新的合作与生产方式[42]。众包数据正是通过物联网、智能终端,允许普通公众通过移动设备从周围环境中收集多模态数据流并使用通信设施分享数据流,因而是一种自下而上的数据收集方式,这与当前档案资源生成的社会化规律是相符合的,众包数据的特点在于用户本身作为数据源扮演着数据收集者的角色。众包数据感知的对象可以分为人和环境两种,主要是通过移动设备收集用户自身及其周围环境(空气质量、噪声、交通路况)数据;产生领域涉及医疗、社交网络、环境监控、运输等,数据量庞大。众包数据的收集具有完整性的众包数据和选择性的众包数据两种形态,对于档案部门而言一般会选择后者。此外,由于众包数据具有较强的社会性和扩展性,但数据质量难以得到保证,这也将成为档案部门收集众包数据的难题。

注释与参考文献:

[1]Jung Hoon Lee,Robert Phaal,Sang-Ho Lee.An integrated service-device-technology roadmap for smart city development[J].Technological Forecasting &Social Change,2013(80):287.

[2]覃雄派,王会举,杜小勇等.大数据分析——RDBMS与Map Reduce的竞争与共生[J].软件学报,2012,23(1):33.

[3]Michael Batty.Big data,smarties and city planning[J].Dialogues in Human Geography,2013,3(3):276.

[4]Michael F.Goodchild.Citizens as sensors:the world of volunteered geography[J].Geo Journal,2007(69):217-218.

[5]Rob Kitchin.The real-time city? Big data and smart urbanism[J].Geo Journal 2014,79(1):4-5.

[6]Zaheer Khan,Saad Liaquat Kiani.A Cloud-based Architecture for Citizen Services in Smart Cities[C]/2012 IEEE/ACM Fifth International Conference on Utility and Cloud Computing(UCC).Washington DC:IEEE Computer Society,2012:317.

[7][8]Daniel Arribas-Bel.Accidental,open and everywhere:Emerging data sources for the Understanding of cities[J].Applied Geography,2014(49):45-53.

[9]蒋锴.含地理位置信息的社交媒体挖掘及应用[D].合肥:中国科技大学,2014:1-2.

[10]丁华东.档案属性、理论建构与学科形象[J].北京档案,2008(12):18.

[11]杨来青,徐明君,邹杰.档案馆未来发展的新前景:智慧档案馆[J].中国档案,2013(2):68-69.

[12]傅荣校,施蕊.论智慧城市背景下的智慧档案馆建设[J].浙江档案,2015(4):4-17.

[13]毕娟.智慧城市环境下智慧型档案馆建设初探[J].北京档案,2013(2):14.

[14]杨艳,薛四新,徐华等.智慧档案馆技术系统特征分析[J].档案学通讯,2014(4):68.

[15]杨智勇.由原始记忆走向智慧记忆——论档案记忆功能的历史演变及其未来趋势[J].档案学通讯,2014(5):16.

[16]张芳霖,唐霜.社会记忆视域下的地域性档案资源生态研究[J].档案学通讯,2015(3):40-41.

[17]丁宁.论国家档案馆主体权利的二元关系[J].档案,2015(6):7.

[18][38]冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯,2012(3):4-7.

[19]徐拥军.“中国记忆”数字资源库的构想[J].档案学通讯,2012(3):12.

[20]鲁冰莹.聚焦:“智慧档案”建设的前瞻构想[J].浙江档案,2014(3):16.

[21]安小米,毛春阳.大数据时代的政府信息治理[J].中国建设信息,2015(12):58-59.

[22]高茂科.对档案大数据关键环节的认识[J].中国档案,2013(10):72-73.

[23]郝伟斌.面向智慧城市的档案信息化[J].档案管理,2013(4):22.

[24]薛四新,卫化昱,杨艳.智慧档案馆研究思考[J].北京档案,2014(5):29-30.

[25]孟祥保,钱鹏.国外数据管理专业教育实践与研究现状[J].中国图书馆学报,2013(11):71.

[26]黄如花,吉翠芳.伊利诺伊香槟大学数据管理教育现状及启示[J].图书与情报,2015(1):64.

[27]Digital Government:Building a 21st Century Platform to Better Serve The American People[S].Washington:The Federal Government,USA,2012:5.

[28]卷首语.档案大数据:机遇与挑战并存[J].档案时空,2014(6).

[29][40]宁宇龙.“大数据时代,档案部门应勇担重任”——访全国人大代表、农工党湖南省委专职副主委蒋秋桃[N].中国档案报,2014-03-14(001).

[30][32]Milena Dobreva ;Wendy M. Duff.The ever changing face of digital curation: introduction to the special issue on digital curation[J].Archival Science,2015,15(1).

[31]Engaging communities to foster internships for preservation and digital curation[EB/OL].[2015-07-29].https://www.si.umich.edu/node/12710.

[33]刘国华,李泽锋.档案工作中大数据框架构建及应用思考[J].档案管理,2014(2):32.

[34]宋淑琴.大数据视野下档案管理思维方式的转变[J].档案学研究,2015(3):37.

[35]周枫.资源·技术·思维——大数据时代档案馆的三维诠释[J].档案学研究,2013(6):62.

[36]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2):5.

[37]安小米,孙舒扬,白文琳等.21世纪的数字档案资源整合与服务:国外研究及借鉴[J].档案学通讯,2014(2):49.

[39]How government can promote open data and help unleash over $3 trillion in economic value[R].New York:USA.McKinsey Global Institute,2014:23.

[41]吴晶妹.未来中国征信:三大数据体系[J].征信,2013(1):5.

[42]Guesmi,Samy.Open data,big data and crowdsourcing:emergent mobile apps business models[J].Communications &Strategies,2014,96(4):53.

猜你喜欢
数据管理档案馆智慧
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
全省部分档案馆新馆掠影
when与while档案馆
有智慧的羊
智慧派
智慧决定成败