浅析科技档案档号的编制规范

2022-02-14 08:21中国工程物理研究院化工材料研究所张光全赵祺
办公室业务 2022年2期
关键词:子集门类代号

文/中国工程物理研究院化工材料研究所 张光全 赵祺

档案工作是一项重要的社会事业,基本点是面向各级组织和社会大众,收集、管理、使用要立足于服务这个主体。如何科学管理海量的档案数据,有效利用这些数据资源推动社会发展、服务公众,是需要深入思考又极具现实意义的问题。随着计算机数据管理在档案管理系统的广泛应用,对海量档案数据的管理和应用带来了极大的便利。目前,全国各地档案馆都在进行档案信息化、数字化和网络化,若想实现档案数据大范围共享,突破数字档案交换与共享的局域性,其中档案数据的有效管理是关键,促使全国各地数字档案组织与设计标准化、规范化,避免各地数字档案数据标准不一,数据存储格式异构、数据安全保障薄弱等问题,实现各地档案数据的共享共用。

要想实现各地数字档案组织与设计标准化、规范化,首先要做到档案数据的组织和设计标准化和规范化,有的同志认为最难于实现的关键环节,在于档案数据信息输入计算机前的预处理工作。为此,我国先后出台了《档案著录规则》和《中国档案机读目录格式》来规范档案目录的标准,其目的就是规范和统一当前档案著录项数据格式和交换格式“千差万别”的状况。有了档案著录数据格式和交换格式的统一,但是全国各行各业的档案馆行业和业务工作采用差异很大的分类法,再加上各地档案馆采用不同公司开发的数字档案管理系统,这又出现了另一个“千差万别”的问题,要做到全国统一的档案数据管理系统几乎不可能。但是,全国各地档案馆使用的管理系统在设计时都要依据一个数学模型来管理这些档案数据,我们可以在档案数据管理的数学模型上做到标准化和规范化,进而统一全国档案档号编制结构,利用规范的档案身份标识——档号来规范档案数据进入馆藏档案数据库前的整理工作。本文简单讨论科技档案档号的编制规范。

一、档号结构和数学意义上的集合

我们在整理档案时,对每一份档案都要编制一个档号,档号是一份档案的唯一身份标识。1994年出台的《档号编制规则》(DA/T13-94)规定了档号的结构、编制原则和方法,该规则确定的唯一性、合理性、稳定性、扩充性、简单性原则以及基本的编制方法作为档号编制的原则被普遍遵循。2015年10月25日,国家档案局出台新修订的《归档文件整理规则》(DA/T 22-2015),对归档文件的分类方法做了详尽的说明,一般采用“全宗号—档案门类代码·年度—保管期限—机构(问题)代码—件号”(图1)和“全宗号—档案门类代码·年度—机构(问题)代码—保管期限—件号”两种分类法为基准确定档号结构,后者与前者相比只是最后两项交换了一下次序,建议使用前者,对按照机构(问题)分类做了明确说明,机构分类法与问题分类法应选择其一,不能同时采用。

图1 文档的档号结构

档案数据库是以档案的本体管理为基础,兼顾数据库设计和应用发展的需要,将包括档案实体信息、管理信息、应用环境信息在内的各种类型数据按照特定数据模型进行组织的数据集合,也就是说,档案数据库就是档案数据的集合。现在全国各地档案馆采用档案管理系统来管理档案数据库,也可以说是对档案数据集合的管理,每一份档案在计算机的档案数据库里都有唯一的身份标识(数据库术语叫ID),档号也是档案的身份标识,同一份档案中,二者在档案管理系统中是相互关联的。

我们在设计档号时,档号结构是有层次的。从数学上来说,一个档案馆的全部档案数据可以看作一个集合,也就是说顶层是一个集合,在档号的结构中,顶层是全宗,这个集合对应图1所示档号结构中的“全宗”,图1中的“门类代码”可看作“全宗”集合的子集,“年度”则可看作“门类代码”子集的子集;把“档案门类代码·年度”当作一个整体,可以看作“全宗”这个集合的子集,从数据库管理来说,可以看作“全宗”这个数据库的数据区块。依次类推,图1中的保管期限可以看作前面“档案门类代码·年度”子集合的子集,从数据库的管理上来说,则可以看作“档案门类代码·年度”数据区块的子数据区块,档号结构中后面的“机构(问题)代码”道理一样,从数学上来说,都可看作上一级子集合的子集,从数据库管理上来说,可看作上一级数据区块的子区块。

其实上面的档号编制只是适用于按“件”整理方法的文档,对于科技档案,国家标准《科技档案案卷构成一般要求》(GB/T11822)提出科技档案档号由全宗号、分类号(或项目代号或目录号)、案卷号组成。项目代号,由所反映的产品、课题、项目、设备仪器等的型号、代字或代号确定。档号结构中没有体现保管期限和年度特征。其中“分类号”具有多样化、个性化、层次多的特点,不像文书档案档号的结构可以整齐划一。这个数学模型对于按“件”整理的文档来说很好理解,但是对于科技档案来说,则需要理清“分类号(或项目代号或目录号)”中的数学集合问题。

科技档案涉及项目代号或目录号,由于特定科研项目不是每年都有,所以就没有“年度”这个特征,所以无法像文档一样用“年度”构造数学意义上“门类代码”子集合的子集。要构造科技档案数学意义上“门类代码”子集合的子集,我们必须用全国不同业务、不同种类科技档案共有的一个属性特征才能做到标准化和规范化。我们知道,全国各地的档案馆要对科技档案进行分类,尽管“分类号”具有多样化、个性化、层次多的特点,不具整齐划一的特征,但是每种分类都有一个顶层分类,我们可以用顶层分类的代码来构建数学意义上“门类代码”子集合的子集,再用项目代号或目录号构建数学意义上“门类代码·顶层分类代码”子集的下一级子集或数据库管理上的下一级子数据区块,这样我们就能得到图2所示科技档案的档号结构。

中国工程物理研究院是以发展国防尖端科学技术为主的集理论、实(试)验、设计、生产为一体的综合性研究院。依据《机关档案管理规定》,中国工程物理研究院的档案管理也像全国众多事业单位一样,分为文书档案(WS)、科技档案(KJ)、财会档案(CK)和人事档案(RS)四类一级门类。科技档案根据分类法分别用KA、KB、KC、KD、KE、KG(基建)、KH(设备仪器)、KJ、KK、KL、KM、KN、KP等顶层分类代码代表顶层分类,顶层分类下面又用1至9的阿拉伯数字进行了二级、三级、四级分类。比如化工材料研究所的全宗号为03,一个代号为CKD的基建项目第一卷的第一份文件依据图2的档号结构可编档号为03-KJ·KG-CKD-0001-01。

图2 科技档案的档号结构

二、科技档案档号结构的说明

上面介绍的科技档案的结构,只是理论上构建的一种可行性的数学模型,或许有人存在疑惑,实际工作中这种档号结构可能会遇到一些具体的问题,下面从本人的理解对一些疑惑和工作中的具体问题做一些说明。

(一)为什么不用分类号代码作为“门类代码”子集的子集。从图1文档档号的结构,我们不难理解档号的结构是有层次的,上层与下层具有包含关系,如果我们不用顶层分类代码,采用可含多层次分类代码作为“门类代码”子集合的子集,这样子集划分过小,形成的包含关系结构不清晰,容易与后面的项目代号或目录代号形成犬牙交错,层次不清。

(二)档号省略第二项时注意跨类档案档号重复的问题。在实际工作中,有些单位档案部门在编制档号时会省略某些项。中国工程物理研究院的文档常会把门类号和保密期限都省略,全宗后紧接着年号和机构(问题)代码;在科技档案编制档号时,有时直接把“门类代码·顶层分类代码”给省略了,比如上面提到CKD基建第一卷的第一份文件的档号就变成了03-CKD-0001-01;但是CKD基建项目也存在设备仪器(KH类)的资料,那么该基建项目设备仪器第一卷的第一份文件就会从03-KJ·KH-CKD-0001-01省略为03-CKD-0001-01,这样就出现了重复档号的现象。为了避免跨类代号出现重复档号的现象,研究院的项目代号不允许跨类重复出现,用CKDS代表CKD基建项目设备仪器的代号(来源设备汉语拼音的第一个字母“S”),这样上面的档号变成了03-CKDS-0001-01,避免档号重复的现象。

(三)子代号的作用。各地的档案管理系统其实就是档案数据库管理系统,数据库可以分为不同的数据区块,不同的数据区块又可以分为不同的子数据区块,不同的子数据区块又可层层下分为更小的子数据区块,从数学上的集合与子集合上去理解,道理也是一样的。为了使档号具有拓展性,我们在档号结构中增设子代码,子代码后还可设下层子代码。比如一个代号为D88型号试验进行一期试验后又进行了二期试验,那么我们可以分别用D88·1和D88·2表示所对应的项目代号。我们还可巧用子代号对大项目档号进行分类流水编制。我们知道基建项目的分类比较简单明确,比如研究院基建项目KG类里分别用了KG1至KG9分别表示项目管理文件、项目准备文件A、项目准备文件B、监理文件、施工文件、建安设备、竣工图、验收文件、声像文件等9个次级分类,当基建项目比较大、文件多时,我们可以用次级分类的数字1~9作为子代号进行分类流水编制档号。如上面提到的CKD基建的第一份监理文件(KG4)的档号就编为03-KJ·KG-CKD·4-0001-01,第一份竣工图(KG7)的档号可编为03-KJ·KG-CKD·7-0001-01。基建项目特别是一些房地产项目,一期建完后还有二期、三期。假如上面提到的CKD项目完成后的两三年突然决定要进行二期科研基建项目的建设,我们就可以用字母A(也可用数字1)表示一期、字母B(也可用数字2)表示二期,这样二期的第一份监理文件(KG4)的档号就可编为03-KJ·KG-CKD·B·4-0001-01。对于一期已经完成的档号编制我们可以统一替换更改,也可不改。从上面的例子就能看出,在档号结构中增设项目代号或目录号的子代号有利于档号结构的拓展性。

(四)文件编写上档号后不要改变文件的属性。档号的结构中含有项目代号或目录号,对于一些保密单位,有些项目代号或目录号可能涉密,如果一份公开或内部的档案在上面标注档号后就改变了档案的涉密属性,有些项目代号或目录号可能还与保管期限相关联,标注档号后就会改变档案的保管期限。因此我们在构设项目代号或目录号及其子代号时,应该避免采用包含可能改变文件属性的敏感字符或数字,这样就可规避这种问题。

三、结语

在信息时代,档案数据内容与实际档案一样具有凭证价值和情报价值,其数据关联、数据挖掘以及数据融合产生的二次价值,在大数据时代,数据关联分析和数据挖掘技术可以直接从档案数据中挖掘出知识甚至智慧。因此,在互联网大数据时代,档案正经历从分散利用向联网共享利用的变革时代,规范化、标准化的整理工作是保障档案信息资源共享平台建设质量的基础性工作,然而各立档单位科技档案档号编制凌乱、规则不统一,为此,有些专家提出各地档案馆应该统领实体档案门类划分及其分类方法。从实际工作来看,全国统领档案门类划分很容易做到,统领科技档案的分类则很难。从科技档案的分类方法来看,各种分类都有一个层次,为此,我们利用顶层分类代码来构建科技档案数据集合的子集合,依据文档档号编制规则,利用“全宗号+门类分类代码·顶层分类代码”可以规范全国科技档案的档号编制规则。如果我们像统一邮政编码一样规范各地档案馆全宗号的编制规则,强制规定的档号中的“门类分类代码·顶层分类代码”不能省略,能够做到科技档案档号编制的规范化。尽管全国各地档案馆分类方法及其分类代码不同,但是《归档文件整理规则》(DA/T 22-2015)指出,立档单位应对归档文件进行科学分类,同一全宗应保持分类方案的一致性和稳定性,这样同一全宗就对应一定的分类方法。顶层分类的稳定性又高于下级各层分类的稳定性,这更有利于科技档案档号结构的稳定和规范。

猜你喜欢
子集门类代号
梁潮印风得意忘象篇
特别提醒
高一上学年期末综合演练
K5;5; p 的点可区别的 IE-全染色(p ?2 028)
李欣:小众门类征集反而更占优势
江苏省淮安市第一山中学活动掠影
扫地
千奇百怪的动物
集合的运算
《耳畔流光:中国历代耳饰》