国土规划数字档案资源的数据挖掘及可视化分析

2022-11-06 13:33刘飞飞
兰台内外 2022年32期
关键词:国土规划数字档案数据挖掘

刘飞飞

摘 要:当前,我国科技迎来了突飞猛进的发展,取得了一系列重大突破,大数据作为代表性技术之一,成为很多行业创新的重要驱动力量,这也为我国国土资源方面的改革带来重大机遇。传统的国土规划档案资料管理手段较为单一,很容易出现数据收集、填写错误等情况,信息共享、传输也十分不便。在可视化和数据挖掘下,通过应用自然语言处理光伏识别以及其他技术,能够摆脱传统工作模式中存在的弊端,为该工作的顺利开展提供可靠保障。基于此,本文对国土规划数字档案资源的数据挖掘及可视化进行了分析。

关键词:国土规划;数字档案;数据挖掘;可视化

大数据时代,信息体量爆炸式增长,加大了国土规划数字档案资源管理工作难度。近些年,在我国经济发展进入全新阶段的背景下,不动产业务数量和规模持续扩增,如果依然采用传统工作模式,势必难以满足当前工作需要,检索能力不足、数据处理效率低下等问题日益凸显。为了使该工作更顺利地开展,提升档案资源利用率,充分发挥其价值,可将先进技术应用其中,创新原有工作模式,提升素质档案资源服务质量,为使用者提供更优质的服务。因此,对国土规划素质档案资源的数据挖掘及可视化进行分析具有重要意义。

一、国土规划数字档案管理的形成

当前,科学技术得到广泛应用,自从国土规划档案资料管理朝着信息化、现代化方向发展以来,为该工作的发展、创新提供了强有力的保障,也取得了十分理想的效果。

首先,计算机在我国档案管理中的应用最早开始于21世纪初。利用计算机取代传统的人工操作,大大提升了工作效率,这也是国土规划数字档案管理的基本雏形,为后来技术创新、档案资源管理方式方法的优化奠定了坚实基础。

其次,在2007年左右为高速发展阶段。随着我国矿产资源、土木工程土地调查等各行业的迅猛发展,加快了纸质档案向数字化档案的发展进程,同时也加大了国土管理部门的工作量。信息体量的爆炸式增长,让传统管理办法的缺陷越来越明显,如果依然沿用人工管理模式,必然无法满足工作要求。为此,相关部门充分发挥信息技术的应用优势,打造了互联网管控平台,在数字档案馆、国土规划数字档案数据库等系统的应用下,数据传输更加高效便捷,可显著提升管理水平。不仅如此,当前国家和政府部门对国土资源管理、国土资源规划也越来越重视,加大了资金、人才等各方面的资源投入,为该工作的顺利开展创造了良好条件。

二、国土规划数字档案资源的数据挖掘与可视化发展可行性

1.基于技术角度

在信息体量越来越大的今天,利用先进技术推动其朝着现代化、信息化的方向发展是必然趋势,数据挖掘和可视化技术,将会成为其发展的重要驱动力量。比如,目前应用较为普遍的语义技术,就是数据挖掘可视化技术類型的一种,能够让数据变得更加多样化、层次更为丰富。可在万维网、互联网的海量信息中,根据用户需求来进行深入挖掘。信息可视化能够挖掘数据背后蕴含的信息,并对其进行分类和分析,各种类型数据都得到妥善处理,包括非数值型、非空间的等,而且,可以将其转变为交互式的视觉形式,为使用者提供较大便利。随着我国科学技术的进一步发展,无论是信息可视化技术、数据挖掘还是语义技术,其理论体系正趋于完善,各项技术也在实践中得到印证和创新,在计算机科学、金融、商业等领域都取得了一定成效。

2.基于资源角度

国土规划数字档案资源体量大、种类多,从另一方面说明了我国各类资源十分丰富,如果依然沿用传统的资源管理方式,根本无法保障工作效率,还容易出现统计失误、难以及时查询等多方面问题。在新的时代背景下,国土规划对地理信息获取效率、准确性也提出了更高要求,因此,应该聘请专业技术人员,有针对性地对系统和技术进行研发,根据档案资料管理要求,不断拓宽档案管理储存空间以及数据的广度和深度。国土规划数字档案是以图片、文字、照片、视频、音频等为载体的历史记录,可分为以下几个大类,即:专业档案、科技档案、会计档案、电子档案、声像档案、实物档案和文书档案。在数据挖掘和可视化技术应用的过程中,在面对不同类型的档案时,先进技术的优势可得到充分发挥,解决了传统档案资料管理中存在的局限性。

3.基于思维角度

从以往国土规划档案资源管理工作开展的情况来看,很多档案人员都只将资料进行整理,难以为使用者提供服务,档案利用率不高,无法发挥档案资料的真正作用。在大数据时代背景下,国土规划档案资源体系要随着时代发展而不进行调整,要本着“用户至上,体验为王”的原则,化被动为主动,在传统行为上以双向互动来代替单向交流,打造信息化数据传输平台,加强各部门之间的数据共享。“互联网+”将会成为未来国土规划档案资源管理的必然发展趋势,有关人员的思维模式、服务理念等都要随之发生改变,主动适应经济发展新常态的相关要求,以用户为核心来升级服务体系,为国土规划档案资源管理工作的顺利开展奠定坚实基础。

三、国土规划数字档案资源数据挖掘与可视化的挑战

1.缺失语义数据,信息读取难度大

就目前情况来看,绝大部分国土规划数字档案的格式都是以JPEG图像为基础转换成的PDF文件,信息的真实性和完整性得不到保障,检索起来难度比较大。想要更快速、更准确地查找信息,需要利用到光符识别技术对电子文档、数字文件进行特殊处理,从而获取文本信息。但实际情况是,文本结构信息丢失、识别率不高等问题比较普遍,加大了档案语义加工和知识组织难度。当前我国的国土规划数字档案系统是基于元数据进行文献搜索和加工的,但是深度不够,并未注重文献知识单元之间存在的联系,信息读取难度比较大。

2.领域本体复杂,人工构建困难

语义标注、概念、实例定理、语义梳理等都是不可忽视的重点内容。目前,我国不动产登记业务规模不断扩大,国土规划数字档案的覆盖范围也越来越广,房屋征收、土地管理、测绘管理等都是其主要内容。由于国土规划领域的本体较为复杂,在收集信息或构建本体时,会造成大量资源和资金的消耗。

四、国土规划数字档案资源数据挖掘与可视化实现路径

1.思路与技术路线

技术人员应重点关注基础工作,例如,深入挖掘国土规划中的原始数据信息,做好关联工作,充分发挥空间可视化、信息可视化技术,保证检索结果的公开化。相关人员要准确把握当前国土规划数字档案管理现存的问题以及原因,按照其特点进行问题分类,建立起基于主题分类的典型问题用地案例的形式化描述模型。深入进行数据研究与分析,确保性质不同、来源不同的数据信息能够在空间参照系上实现统一,利用数字化的方式来描述用地案例,为信息使用者提供高质量服务,加强信息共享和传输交流。在系统运行的过程中,有可能出现自动侦测技术使用不当的问题,要分析该问题出现的原因,加强人员培训,让档案资料管理人员、技术人员掌握系统的正确操作方法,并对自动侦测的异常进行合理判断与修正。在信息技术、大数据技术的应用下,能够自动识别国土规划数字档案中存在的各方面问题,精准判断问题类和特征,可对其进行正确分类,便于档案管理人员及时解决,为后续各项工作的顺利开展奠定坚实基础。

从国土规划数据挖掘来看,目前常用的本体检索、本体构建、语义组织等多种方式。国土规划的数据挖掘技术是以上述方式为基础的,可通过系统中语义抽取模块等方式来完善国土规划数字档案管理的相关资源,提升其应用价值。此外,还应深入挖掘信息资源中有价值的数据,利用可视化基础,充分体现国土规划素质的知识化体系,确保能够通过检索平台进行搜索,为使用者提供完善服务,提升档案资源获取效率和速度。

2.平台架构

在设计国土规划数字档案资源管理平台过程中,要明确平台结构,以及各模块的主要功能,确保结构层次的科学性与合理性。首先是数据服务层。要收集国土规划中各方面的数据信息,比如国土空间数据、檔案数据、工作流流转数据等。档案数据指的是日常工作中形成的资料信息,可细分为文书类档案、国土规划专业类档案;工作流数据涵盖了流程定义、流程实例等数据信息;空间数据比较好理解,主要是各类项目的地理数据、工程项目规划数据、国土空间利用信息等。其次是数据接口层。数据接口层主要起到承上启下的作用,在数据服务层收集到各方面信息之后,由数据接口层来查找、挖掘和主题词有关的信息,从而形成完善的信息搜索体系,为下一程序的顺利运行奠定坚实基础。再次是系统服务层,这也是平台中最关键的模块,是应用服务的集成,包括了知识化管理、档案数据挖掘这两个主要系统,功能十分多样,通过关键词搜索即可得到相应的数据信息,可对图像、文本等各类信息进行深入挖掘和补充,并通过可视化技术将知识地图展现出来,在设计过程中要尤为重视。国土规划档案数据挖掘系统和知识化管理系统并非独立的两个模块,而是相辅相成的,只有两者共同作业,才可构建成完整的可视化系统。在该系统中,应用了多方面先进技术,例如,文档知识数组织,以及将自然语言转化为规范化语义的自动化映射,能够直观展现出国土规划数字档案管理的具体流程,让数据可视化方式更加多样。最后就是可视化功能层。可以将可视化功能层理解为展示层,前三道程序运行完毕之后,即可将最终得到的档案文档、档案术语等进行可视化展示,为使用者带来全新的体验。

3.国土规划数字档案资源数据挖掘与可视化功能

(1)档案文件管理。目前,大部分国土规划数字档案资源数据都是PDF格式,部分系统无法识别PDF格式中的相关内容。作为初步的数据处理方式,待其工作完成之后,可为后续文本资源的深入挖掘创造良好条件。档案文件管理十分重要,具有档案资料查询、修改与调整、信息上传、共享传输等多种功能。使用者可参考查询粒度,在搜索栏直接输入关键词和相关信息,系统即可自动显示出包含关键词的所有档案资料。除了关键词之外,还可输入国土规划档案编号、通过OCR技术处理之后的文本等信息,从而得到档案的文档编号、内容、所属行业、应用范围、档案ID等各方面信息。点击进入之后,即可得到所有和档案相关的信息,比如关联地址、发布时间、实施时间、所属行业、文档中文名、其他描述等。

(2)国土规划档案术语管理。术语管理的主要内容为对术语进行修改、查找、增加和删除,为使用者提供和术语有关的上下位关系的可视化图形。例如以“土地初始登记”术语为例,且可视化展示如图1所示:

(3)国土规划档案流程关联。在了解并掌握了业务流程管理之间的逻辑关系和内在联系的基础上,可优化管理流程,建立相应的流程规则库,能够以更快的速度发现流程管理中存在的问题,便于第一时间进行处理,最大化发挥可视化的作用与价值,可随时查找某个节点下的国土规划档案资料,并通过相应的技术完成资料传输。

(4)国土规划档案管理工作本身就具有很强的复杂性、专业性特点,尤其是在先进技术的应用下,对从业人员专业素质提出了更高要求。技术人员和档案工作者要在岗位中不断提升个人能力,强化综合素质,了解数据挖掘和可视化技术的相关原理和理论知识,并将其应用于实践中。有关部门要定期开展教育培训,引进先进工作理念和技术方法,保证信息系统功能多样化的同时,让从业人员能够熟练应用,为国土规划档案管理的顺利开展提供人才保障。

五、结语

总而言之,国土规划档案极具现实价值,和城市规划、土地开发、国土空间利用以及很多行业发展都有着密切联系。在新时代背景下,如何深度开发国土规划档案资源,提升资源利用率,充分发挥数字档案的价值和作用,是需要思考和关注的重点内容。当前,网络环境日益开放,数据挖掘和可视化技术的应用,将会成为国土规划数字档案资源管理创新与改革的主要方向。尤其是在数据体量日益增加、类型越来越多样化的情况下,应牢牢把握先进技术的应用优势。有关部门应加大资金、人才投入力度,重点关注技术和平台开发,打造出具有生态化系统的开放性档案管理模式,保证信息化管理系统功能的多样化,推动我国国土规划数字档案管理工作的顺利开展。

参考文献:

[1]庄淑娜,吴亚玲.国土规划数字档案资源的数据挖掘与可视化[J].华东纸业,2021

[2]姚咏红.基于CNKI的“数字档案建设”可视化分析[J].黑龙江档案,2021

[3]曲春梅,何紫璇.数字人文环境下档案文化价值释放特点与实现方式[J].北京档案,2021

[4]陈海玉,向 前,万小玥.数字人文视域下抗战档案资源的开发策略与路径研究[J].山西档案,2021

[5]魏 歌,吴志杰.数字人文视域下的数字档案馆建设:合理性诠释与策略探讨[J].北京档案,2021

[6]曾 婷,杨 帆,王 恒.国土规划数字档案资源的数据挖掘与可视化[J].兰台世界,2019

[7]张 伟,曾 婷.基于用户需求的国土规划档案信息服务与优化[J].兰台世界,2016

(作者单位:临沂市自然资源和规划局)

猜你喜欢
国土规划数字档案数据挖掘
探讨人工智能与数据挖掘发展趋势
国土规划与生态环境保护之间的关系探究
基于并行计算的大数据挖掘在电网中的应用
《全国国土规划纲要(2016—2030年)》印发
数字档案生态链信息流转效率提升策略研究
研究数字档案信息安全保障体系
一种基于Hadoop的大数据挖掘云服务及应用
浅析国土规划与生态环境保护之间的关系
国土规划可持续发展评估研究
基于GPGPU的离散数据挖掘研究