基于数据挖掘的电力企业数字化档案管理系统

2022-11-03 08:05张景茹
兰台内外 2022年34期
关键词:信息采集功能模块系统设计

摘 要:由于目前大部分电力企业的档案管理模块已不能满足日常工作需求,档案信息数量不断增多并趋于复杂。为提高数字化档案管理的质量与效率,本文提出基于数据挖掘的电力企业数字化档案管理系统(以下简称本文系统),构建整体系统架构与数字化管理功能架构。通过电力档案数字化采集、数据挖掘处理档案数据、建立档案管理模块,实现系统功能运行。经实验论证分析,本文系统功能测试结果良好,经全面测试和bug修复,可满足预期设计目标。在系统性能测试中,系统响应延迟时间平均在2秒以内,吞吐量满足用户需求,CPU频谱正常,说明本文系统具有可靠性。

关键词:数据挖掘;电力企业;数字化档案管理;信息采集;功能模块;系统设计

电力企业的档案信息资源是电力企业发展中极其重要的资源,是电力企业发展的历史沉淀,为电力企业乃至整个电力行业的发展提供了重要的借鉴意义。就电力企业而言,其项目覆盖范围较大,档案管理工作量巨大且繁杂,为档案管理人员带来巨大压力。档案工作的最终目的是通过档案资源的开发与利用,实现电力档案信息资源的最大共享。

因此,挖掘更多的档案信息资源,加强档案服务功能,减轻档案人员重复繁杂的体力劳动,提高档案利用效率,提供优质的档案利用服务是现代化新时期电力企业管理档案的必然选择。

随着科学技术的不断发展,数字化应用给档案信息化工作带来深远影响的同时,仍存在诸多问题有待解决,因此,建立数字化档案管理系统是十分必要的。本文基于数字挖掘技术及相关算法,设计电力企业数字化管理系统,为企业的档案管理发展提供了重要的参考依据,具有深远意义。

一、基于数据挖掘的电力企业数字化档案管理系统架构设计

本文提出的电力企业数字化档案管理系统整体架构分为五层。在整体构架的应用层中,具有档案管理员及普通用户两种角色,档案管理人员对档案进行鉴定与归档分类,将数据录入便于二次利用,并统计系统档案相关数据及数量。

根据电力企业数字化档案管理的需求,本文系统管理功能包括档案管理与服务、资料与系统管理,其中档案服务功能主要应用于档案查询及相关的日常管理工作。档案信息的采集主要实现对企业信息进行收集整理和录入,根据档案的不同类型进行分类整理,具体系统架构如图1所示。

由图1可知,本文系统根据需求分析,构建出硬件层、存储层、服务层、业务层以及应用层。存储层档案类型包括文本、图像及音视频文件,服务层为档案管理人员提供授权服务、档案催还与统计服务,以及普通用户的档案查询等。本文数字化档案管理功能架构如图2所示。

由图2可知,本文系统将档案管理功能进一步细化,在档案保管功能中,将存放位置索引与档案库房温度登记等功能均涉及在内。整个数字化档案管理系统中的模块设计具有延展性,满足信息管理的伸缩性要求,并通过依赖注入模块实现拦截处理,保障系统的安全功能,利用安全模块、加密模块、日志模块,实现系统管理的权值限制、数据加密以及日志保存的功能需求。

二、基于數据挖掘的电力企业数字化档案管理系统软件设计

1.电力企业档案数字化采集

电力企业档案在进行数字化采集过程中,档案数字化质量是核心内容。由于不同档案的介质和幅面具有一定差异,因此,在对纸质档案进行数字化扫描和处理的过程中,应根据不同纸质页面的实际情况,转换不同的图像存储方式。为保证档案在扫描后的清晰度,需对图像的分辨率进行适度调整。

同时,压缩图像数据会严重影响图像画质,为避免出现图像失真的现象,所有图像不进行压缩处理。在进行图像校对以及处理等环节上细化处理指标,在图像扫描结束后,对图像完整性和清晰度进行审核与检验,同时检查图像是否存在倾斜和失真情况,严格控制图像质量,不符合要求的数据图像需进行二次处理。在图像扫描及处理完成后,应保证图像页码是连续的,且页码与文件的顺序与原始档案保持一致,防止出现错页漏页的情况。

此外,统一图像格式,其黑白图像的格式为tiff,其分辨率为200dpi,彩色图像格式为jpg,分辨率为300dpi。待所有档案扫描完成后,将电子数据与录入条目进行对应,将经过检验的正确数据导入管理系统。

2.基于数据挖掘处理档案数据

在档案数据中,大部分数据挖掘是基于数据的一定结构特性所实现的,在档案管理的实际工作中,档案著录包括许多著录项,将其中一部分元数据进行数据挖掘,其分析种类越多,所获得的信息更具有可靠性,因此,需要建立元数据集。数据库的建立是在稳定的应用环境下,通过构造数据库模式进行构建的。通过数据挖掘自动进行数据分类和著录,对元数据及文本数据进行存储,并建立用户信息反馈机制,通过反馈系统将信息传回进行数据挖掘,并根据档案鉴定结果及数据挖掘情况及时更新数据库中的数据。

基于数据挖掘设计档案训练过程,按照数据量2:1:1的比例从样本中堆积抽取数据,根据留控法选取训练集,为保证数据分布的异质性,进行多次重复的分层抽样,取多次平均数,使训练集和测试集的比例保持在3:1左右。通过分类算法,选取权重最高的5个特征向量构建二值矩阵。进行分类参数的计算,分类参数的计算主要通过似然函数,其计算公式如下:

(1)

式中为条件概率,为已知的某个参数,为事件发生的概率,其即为似然度,根据训练所用的二值矩阵计算,得到似然度矩阵,具体如下式:

(2)

式中  为档案类别,其中为部门数量,为文件类别,为权重最高的特征数量。训练过程设计完成后,既实现了对档案电子数据的分类,根据数据提取更新以及关联分析,确定相关数据分类,补全元数据。

3.建立电力企业档案管理模块

在本文档案管理系统中,对电力企业档案的管理主要包括用户管理、归档类别管理等,基于电力数据建立档案管理模块,在用户管理的功能设置上,主要进行用户查询、身份权限验证和密码修改,以及用户的增加和删除。在使用本文系统时,通过输入用户名及密码登录,后台服务器程序接收前台数据后,将进行用户数据验证,验证成功即可登录。档案归档类目通过编辑全宗类别,实现对档案的总体管理,包括全宗类型名称、级别年度以及目录选择。通过归档类目管理功能对所有信息数据进行分类整理,便于系统管理人员以及用户浏览与查找所需文件。根据电力企业信息管理需要,其类别往往由大类包含子类,具有全宗类别和二级类别,用户登录后对所需类别进行操作,查询数据库判断类别是否存在,进行更新操作,并根据数据库查询结果判断更新操作是否成功。在用户进行系统访问时,会产生用户对话请求,通过后台服务器设置用户名片来控制对话,从而避免对数据库的频繁读取操作。

三、实验论证分析

为验证本文电力企业的数字化档案管理系统的有效性,需要进行系统测试。搭建测试环境,具体软件测试环境如下表1所示。

由表1可知总体软件测试环境,接下来将对系统进行测试,包括功能和性能两个方面,以保证系统正常实现功能,验证本文系统功能与性能的正确性和完整性。在本次功能测试中,共修改bug缺陷129个,修改功能缺陷85个,其他设计性问题3个,具体测试内容及汇总情况如表2所示。

从系统功能测试结果可以看出,系统目前功能满足数字化档案管理需求,通过对系统功能的全面测试和bug修复,完善管理功能,其功能管理效果达到预期设计目标。系统性能测试主要从系统响应时间和吞吐量性能两个方面进行检验,系统的相应延迟是系统性能测试的一个重要指标,因此需要对系统的响应延迟进行严格分析与测试,测试系统响应延迟时间是否在1~5秒范围内。设置测试数据800条,共进行6组测试,对上述功能测试中的4个项目進行测试,结果如下图3所示。

由图3可知,其档案查询展示的响应时间最短,平均响应延迟在2秒以下,本文系统功能模块的平均响应延迟时间均在1~2.5秒的范围内,由此可见,本文系统的响应延迟完全满足测试目标。

数字化档案管理系统一般是多人同时使用,为满足多人并发使用的需求,设置使用人数为300人,通过测试进行程序的功能验证,并对系统运行时吞吐量变化进行记录,本文系统的吞吐量测试结果如图4所示。

由图4可知,在人数为300时并发使用系统,在此基础上本文系统的CPU利用率频谱显示正常,其客户端采用双核处理器,在系统稳定的情况下能够保障系统的正常运行,其吞吐量满足用户需求,证明本文系统具有实用性,符合电力企业数字化档案管理的实际应用需要。

四、结语

本文基于数据挖掘技术及相关算法,通过电力企业档案数字化采集、处理档案数据、建立档案管理模块,对数字化档案管理系统进行了软件设计,加以硬件设计完成了整个系统的设计,有效提高了档案管理的质量和效率。由于时间和条件的限制,本文研究还存在着诸多不足,有待于在今后进一步探讨,如工程档案数据较多,可能会出现数据填写错误的情况。未来还应从数据的自动纠错和错误识别角度入手,进行深入研究与设计,不断完善档案管理系统功能,使电力企业档案的数字化管理更加科学与规范。

参考文献:

[1]李 欣.基于数字水印技术的医院电子档案管理系统设计[J].现代电子技术,2020

[2]陈利民,辛后林,袁升飞.文物勘探档案数字化管理与应用——以郑州市文物勘探档案综合管理信息系统为例[J].中国档案,2021

[3]孙洪溥,耿 强.基于二维条码的数字化档案信息自动检索系统设计[J].现代电子技术,2021

[4]宗 诚,李 静.基于数据挖掘技术的B/S模式医院档案管理系统[J].微型电脑应用,2021

[5]赵 俊,蔡勋伟,马 丛,等.泛在电力物联网中数字化服务信息资源挖掘系统设计[J].电子设计工程,2021

[6]韩卓泉,周 璇.基于物联网架构的档案智能化管理系统的分析和设计[J].微型电脑应用,2020

[7]张妍妍.基于物联网体系结构架构档案信息安全网[J].山西档案,2015

[8]刘振宇.基于物联网技术的智能化档案管理路径分析[J].办公室业务,2022

[9]刘娅琛.基于物联网技术的智能化档案管理探讨[J].信息记录材料,2021

[10]齐丽娜.基于物联网的档案智能化管理服务模式研究[J].兰台内外,2019

(作者单位:广东威恒输变电工程有限公司)

作者简介:张景茹(1984—),女,汉族,山西长治人,本科,馆员,研究方向:电力企业档案。

猜你喜欢
信息采集功能模块系统设计
如何提高卷烟零售市场信息采集的有效性
一种基于SATA硬盘阵列的数据存储与控制系统设计研究
基于ASP.NET标准的采购管理系统研究
目标特性测量雷达平台建设构想
输电线路附着物测算系统测算功能模块的研究
M市石油装备公服平台网站主要功能模块设计与实现
功能模块的设计与应用研究