数字模型在档案信息的开放利用中的应用研究

2017-09-23 17:29张琬渝
科学与财富 2017年26期
关键词:数字模型档案信息开放

张琬渝

摘 要:在政府实施信息公开制度之后,档案信息的开放利用程度也越来越大,对于传统的档案信息管理和应用形式来说,已经不能很好地满足人们对档案信息应用的需求。在网络信息普及发展过程中,纸质档案也逐渐被电子档案以及电子文档所替代,数字信息技术以及网络技术在档案信息中已经逐渐被应用,让档案信息管理工作还有开放利用的效率都有所提高,也让档案信息管理工作更加容易。本文主要对数字模型应用于档案信息的开放利用进行简单分析,以供借鉴。

关键词:数字模型;档案信息;应用;开放

档案信息主要是记录了人们在社会中各项活动的一种文档,能够将人们在社会中的各种表现都反映出来,现在档案信息越来越被人们所看重,在开发利用上也加大了力度。现在的档案利用需求要明显高于以前,且档案馆藏数量增加也相当迅速,这就明显突出来档案数化能力比较弱,所以在档案信息开放利用上也要加大力度,争取让档案信息实现数字化,而将数字模型应用于档案信息开放利用中,能更加直观和理性地将档案间的规律都表达出来,更适合当代数字档案信息的发展趋势。

1 引用方法

1.1 MomeCarlo方法

这种方法也可以叫做计算机随机模拟方法,其主要是美国在研制原子弹计划中产生的。近些年,计算机技术发展比较迅速,所以这种方法也成为解决计算机数字技术问题的主要方法之一。

1.2 TOPSIS法

这种方法属于多目标决策分支中的重要方法,主要的原理就是依据检测评价对象的优劣距离做出排序,要是评价的对象是优解的,也是最远离裂解的,那么就是最好的,反之则是最差的。优解的各项指标值都必须达到最优,而最裂解的指标则是最差值的指标。

1.3 术语说明

其一是全宗——年代单元,主要是将档案依照年代和全宗来分类,从而得到的档案类别就是全宗——年代单元。其二是全宗——年代单元编号,就是同一年的档案都将被统一编成一个编号。其三是全宗——年代单元档案卷数,这是主要是同一年档案在该单元中所有的搭档总卷数,表示档案的数量。其四是全宗——年代单元利用卷数,这主要是同一单元中档案信息总的利用卷数是多少。其五是档案价值权重,这只要是指在这个全宗中,档案的价值所占有的比重是多少。其六是成功率,主要是指用户所访问的档案信息达到了数字化的比重和概率。

2 准备工作

2.1 档案利用情况数据

在档案信息利用数据上,可以分解为两点。首先是档案的利用总数是多少,其次是档案利用的数据在全宗--年代单元中的分布情况。第一点主要是利用的线性最小数,并预测未来档案利用的总数是多少,然后再利用直线方程来得出档案利用总数情况。第二点主要是利用今年档案的利用总数,看在不同全宗年代单元分布下,是否对其他的全宗年代单元分布有什么影响。

2.2 档案扫描量和资源的投入

受到地区差异的影响,不同地方物价也有所不同,所以在数字化档案信息上投入的资金也就有所不同,其中也存在一些可变的因素,但总体来看,其扫描量和投入的资金是成正比关系的。而比例系数,主要就是取前些年的总扫描卷数还有总的投入资金比例就可以了。

3 数字模型的建立

3.1 选择模型

首先是目标,档案数字化开放利用需要遵循的原则主要有几点,即实用性原则、价值型原则、开放性原则、时效性原则以及抢救性原则。但是在实践中,档案利用的主体已经逐渐变成工种,所以首先要考虑的就是实用性,所以数字模型建立的主要目标也就是数字化档案访问的成功率是多少。其次是指标:档案利用数据代表了档案的利用率,为了最大化成功率,就得以档案利用数据为指标。最后是分析:由于档案利用数据存在明显的扎堆现象——“二八现象”,即20%全宗的利用卷数之和可能占了总数的80%,20%年份的利用卷数之和可能占了总数的80%。如果盲目或粗放式的制定数字化顺序,那么产生“要用的档案未数字化,已数字化的档案却没有用”现象也就不足为怪了。

3.2 直观选择模型

本模型主要想法是用局部最优来体现整体最优,即选择总利用卷数最高的全宗与总利用卷数最高的年份的组合。步骤如下:求出每个全宗的总利用卷数(所有年份利用卷数之和),按从大到小次序,根据实际情况选取排在前面的部分全宗。求出每个年份的总利用卷数(所有全宗利用卷数之和),按从大到小次序,根据实际情况选取排在前面的部分全宗。按照以上两步所选的全宗与年份组合的全宗——年代单元即为应该先数字化的全宗——年代单元。

3.3 MonteCarlo选择模型

使用MonteCarlo方法来进行优化。其基本思想是每次试验选取一种全宗与年份组合并求出该组合总的利用卷数,从大量的试验中找出总卷数最大的组合。由于涉及组合问题,所有的情况太多,所需进行的试验的卷数必须非常非常大才能够得到较理想的结果。在长春市档案馆的计算中,在不加改进的情况下进行试验,发现即使进行1亿次试验,所得到的结果也不如直观选择模型来得好。这里主要的思想是减少组合的数量,考虑到利用卷数是典型的稀疏矩阵,其中有很多全宗和年份其实是可以先被排除的,结合直观选择模型的方法,我们采用的方法是,先将利用卷数矩阵按照“行和”与“列和”大小从大到小进行排列,根据实际情况选择排在前面所占比例比较大的行和列,然后再利用下面的流程进行计算。

3.4 仿真分析应用

按照仿真分析要求,输入数据:档案卷数矩阵,利用卷数矩阵,全宗--年代单元的排序以及每天平均数字化档案卷数。按照流程,利用MATLAB编程,带入相应数据,即可预测三个模型的数字化方案所带来的成功率变换。

3.5 应用推广

这里具有很强很广的应用性,对于不同的需求可以使用不同的模型來满足。对操作的简易性要求比较高的用户,这里建议采用直观选择模型,该模型简单实用,仅需简单操作即可实现较好的结果。

结束语

现在人们在档案信息的应用和开发上有着更高的需求,传统的档案信息管理以及档案信息利用模式已经不再适用,对档案管理软件统计功能进行升级和完善是亟需解决的。应用数字模型让档案利用统计自动化水平得以提高,也同样是档案管理软件开发以及应用未来的发展趋势。在档案利用情况中有效采用自动统计系统,最终将档案利用情况表现成全宗、年代、卷。同时,应用数字模型还可以设计档案数字化模式,让档案利用和开发更加方便,更在档案数字化成果检验过程中起到了重要作用,所以在档案信息开发利用上有效应用数字模型是值得推广应用的。

参考文献

[1]周彩英.高校档案信息利用服务综合评价探究[J].浙江档案,2011(03).

[2]陈艳红.30年来档案信息资源开发利用研究述评——基于《档案学研究》、《档案学通讯》的论文分析[J].档案学研究,2010(02).

[3]米士刚,刘盈利,刘艳丽.档案馆建设如何践行“低碳”理念[J].中国档案,2010(07).

[4]张宁.思维的“逆行”——电子文件风险管理解析[J].中国档案,2010(07).

[5]孙洪鲁,刘虎.数字化加工档案原件与信息安全的管理[J].中国档案,2010(08).

猜你喜欢
数字模型档案信息开放
数字模型分析在垂直型食物嵌塞治疗中的应用
美国太空部队与工业部门分享内部数字模型
3D打印数字模型的独创性认定
医院病历档案信息管理及应用探析
关于电力企业档案信息现代化管理及对策的探析
我国煤炭物流网络体系优化及政策建议
我国煤炭物流网络体系优化及政策建议
档案信息资源开发利用及图书、情报、档案一体化探析
苹果软件更“开放”更“中国”