陈 辉,叶培春,颜祥成,饶春平,许志贵
(解放军31453 部队,沈阳 110031)
随着军队信息化、数字化建设的快速发展,我军作战数据建设稳步推进,数据资源日益充实,数据总量不断扩充。但是,以各业务领域为主的专业化数据管理方式导致的数据资源垄断使用、数据运行体内循环等现象较多,数据跨部门共享利用率较低,在数据融合共享上尚未形成行之有效的机制和渠道;同时,各业务领域在数据建设过程中形成“烟囱式”业务系统,致使指挥员和参谋人员对数据的总体分布、获取和应用情况不了解,制约联合作战指挥链条中数据保障能力发挥,主要存在以下3 个方面的问题:
1)数据“看不到”。缺少统一的数据资源台账清单或数据资源目录,数据分布不明、底数不清,数据权责和世系不清晰。
2)数据“读不懂”。缺少统一的数据描述语言,联合作战指挥员、参谋人员、数据保障人员等各类人员和应用程序及系统对同一数据认识不同,数据认知偏差、重复解释等现象时有发生。
3)数据“共享难”。作战数据模型标准与各业务领域自建系统差异较大,数据格式不一致,跨领域协同共享难,缺乏有效的数据资源传输共享方式。
针对上述问题,王永生等就如何有效组织、管理和维护海量作战数据,基于元数据提出了一种作战大数据资源目录服务技术,在提升作战数据跨域共享交换效率方面作出重要探索,未对构建方法展开详细研究[1];文献[2-9]从政务、油田、公共、审计、医疗、军队卫生等方面,开展了数据资源目录体系构建方法与技术的研究,但均未涉及数据资源目录服务模式相关研究。基于此,本文基于元数据、目录服务等相关技术,开展作战数据资源目录体系构建研究,主要包括概念内涵、体系架构、构建方法和服务模式4 个部分内容,旨在提高作战数据资源利用效率和利用价值,提升作战数据精准保障能力。
作战数据资源元数据是描述作战数据资源特征和属性的数据,可以提供作战数据资源有关信息的结构化描述,用于采集、组织、识别、定位、发现和选择作战数据资源,结合作战数据资源目录,实现对作战数据资源的高效检索、导航定位和共享交换等服务[2]。
基于元数据开展作战数据资源目录体系研究,可以使数据资源的管理架构更加灵活,从而更好地适应数据应用需求。一方面,元数据技术对分布式异构信息资源的组织、挖掘和管理,能够实现数据资源的快速识别、定位和访问,提高数据资源的检索和发现效率;另一方面,通过元数据对数据资源的统一描述,使联合作战指挥员、参谋人员、数据保障人员等各类人员和应用程序及系统对数据资源建立统一的理解标准,避免数据歧义,有利于数据共享和交换。
作战数据资源目录是指依据现有的作战数据分类体系和数据标准体系,对作战数据资源内容和形式特征等进行排序、编码、元数据描述等,形成逻辑上集中、物理上分散、可统一管理和服务的信息资源目录,便于检索、定位与获取作战数据资源。作战数据资源目录的建立,可以有效整合作战数据资源,包括数据范围、数据分类、数据内容、数据质量、数据格式、数据存储信息、数据获取方法、数据使用方法等,实现跨部门、跨领域的数据资源交换共享,提升数据资源共享流转效率[3]。
数据目录是一种层次化、可伸缩的树状结构,具有科学性、系统性、动态性、可扩展性等特性[4],本文数据资源编目采用元数据和目录服务技术,依据数据资源目录以及元数据相关标准和编码规范,以数据分类体系和主键词表为编目控制值域,形成核心元数据,利用元数据对不同类别、不同层次的数据目录进行重新组织和编排,建立数据索引和访问接口,从而形成涵盖数据分类、业务领域、服务模式等多个维度的数据资源目录,并提供数据资源管理、发现、定位、共享等服务。
作战数据资源目录体系总体框架包括三层架构、两大体系,分别是数据层、中间层、应用层、标准规范体系和安全管理体系,如下页图1 所示。
图1 作战数据资源目录体系总体框架Fig.1 Overall framework of operation data resources catalogue system
数据层主要用于数据资源存储并向中间层提供数据支撑,包括数据资源库、共享资源库、核心元数据库,数据资源库、共享资源库由各业务领域技术人员按照现有分类体系梳理的基础数据、业务活动数据、专项活动数据等整合形成,核心元数据库根据元数据模型抽取形成。
中间层主要通过数据封装和服务封装为应用层提供访问接口,主要包括数据目录和服务目录。其中,数据目录包括数据资源目录和共享资源目录,以核心元数据为主要描述方式,通过对数据资源梳理、分类和格式标准化编制形成,提供数据资源的高效检索、准确定位和交换共享服务;服务目录是基于特定的应用场景和应用模式以信息模型、业务模型等形式提供各种服务的目录,例如目录管理服务、目录应用服务等。
应用层主要是面向数据目录用户,提供数据目录使用、维护、管理等功能,主要包括数据目录管理和数据目录应用,数据目录管理由数据编码管理、数据目录生成、数据目录注册发布、数据目录审核校验、数据目录维护、数据筛选规则配置等功能组成,数据目录应用包括数据目录检索、数据目录浏览、数据资源定位、数据资源访问、数据交换共享等功能组成。
标准规范体系主要用于规范统一数据存储、采集整编、抽取转换、集成应用过程中数据的类别、属性、格式、标识代码等元素,包括通用要求、数据资源、集成应用三大类。
安全管理体系主要用于数据存储、计算、传输、应用、处理等环节中的安全管控,包括存储管理、计算管理、传输安全、应用管理、用户管理、权限管理等。
构建数据资源目录体系旨在解决数据资源建设和运用过程中存在的问题,在遵循数据可理解、可搜索、可获取、可管理原则的前提下[5],提升数据资源管理、接入整合、共享分析以及基础支撑能力,目录体系构建的一般流程包括:数据资源分类与编码、核心元数据设计及抽取、目录构建、目录注册、目录审核、目录发布、目录使用、目录管理维护。本文在目前作战数据分类及编码体系基础上,针对作战数据资源核心元数据设计、目录构建方法和目录服务模式展开研究。
作战数据资源核心元数据是元数据中表示数据资源特征和基础属性的最小集合[6],由使用频繁的、具有代表性和广泛适用性的核心元数据元素组成,是作战数据资源目录的重要组成部分,本文基于“有哪些作战数据资源”“作战数据资源在哪里”“如何获取作战数据资源”“作战数据资源的应用与管理”4 个问题,设计作战数据资源核心元数据,包括资源内容、资源表示、资源获取以及资源管理4个维度,如下页表1 所示。
为了准确定义核心元数据,便于核心元数据的采集与抽取,本文通过摘要的形式对核心元数据元素进行描述,主要内容包括元素名称、元素内码、数据类型、填写示例、文本注解,下面以资源内容和资源表示核心元数据元素描述为例,简要表示该描述方法,具体如表2,表3 所示。
表2 资源内容核心元数据元素描述Table 2 The description of core metadata elements of resources content
表3 资源表示核心元数据元素描述Table 3 The description of core metadata elements of resources representation
本文将作战数据资源目录构建路径大致分为4个阶段,分别是资源普查、目录编目、目录审核和结果输出,如下页图2 所示。
图2 作战数据资源目录构建方法Fig.2 Construction methods of operation data resources catalogue
其中,资源普查由各业务领域完成,各部门数据提供者分别从业务流程和业务信息系统入手,根据现有分类标准体系和模板盘点现有数据资源内容,实情进行数据补充采集,调研数据流转关系及数据资源权属,完成普查成果确认;目录编目阶段由目录中心完成,目录创建者基于普查成果和上文核心元数据分类模型及元数据元素描述对数据资源进行整理分析、抽取转换,建立数据资源目录与数据资源关系,形成初始数据资源目录;目录审核同样由目录中心完成,目录管理者对数据资源目录内容格式进行审核校验,反馈审核问题,组织数据提供者调整数据资源目录内容并进行数据确认;结果输出由目录中心完成,主要包括数据资源目录、共享资源目录的发布,数据资源目录的维护和权限管理,数据资源检索订阅、共享交换等服务的发布。
作战数据资源目录体系的服务范围包括3 类角色:数据目录的创建者、数据目录的管理者数据目录的使用者[7]。3 类角色职责分工、数据需求不同,就对于数据资源目录服务的模式提出了更高的要求,一方面各类角色都需要定制化、专业化及方便灵活的数据资源服务,另一方面也需要功能丰富全面的目录应用服务,同时还需要应对数据灵活取用、共享交换带来的数据安全问题。因此,本文针对3 类不同角色设计了3 种作战数据资源目录服务模式,分别是面向目录创建者的目录配置服务、面向目录管理者的目录管理服务、面向目录使用者的目录应用服务。
目录创建者提供数据资源内容,负责数据资源目录的编目、目录内容更新维护、权限设置与目录内容相关联的数据资源定位等工作。面向目录创建者的目录配置服务,可以满足数据分类编码、核心元数据提取、目录编目等基本需求,也支持用户灵活配置数据资源目录,能够按照具体的业务场景、数据的应用模式、数据主题域等类别,构建多视角的数据目录,例如业务目录、数据区域目录、数据安全目录、数据共享目录、主题域目录等,如图3 所示。
图3 面向目录创建者的目录配置服务Fig.3 Catalogue configuration service for catalogue creators
目录管理者实施数据资源目录管理,负责数据资源目录的注册、审核、发布与维护工作,搜集目录使用者数据需求,提供数据目录相关服务,制定相关组织管理制度,保证目录服务稳定持续运行。面向目录管理者的目录管理服务可以满足目录注册、目录审核、目录发布、目录维护等基础服务,也支持结构化和半结构化数据资产管理、数据需求管理、共享权限管理、数据追踪溯源、智能数据探查等服务,保证数据资源的安全性、可靠性、一致性,让数据更权威、全面、可用、易用,如图4 所示。
图4 面向目录管理者的目录管理服务Fig.4 Catalogue management service for catalogue managers
目录使用者按需按权获取数据资源,基于具体的应用场景,针对目录未包括的内容提出数据使用需求,或对于已有的数据资源提交共享申请,或向目录管理者提出对资源目录的编制、建设、管理等合理建议,如图5 所示。面向目录使用者的目录应用服务,可以满足用户数据检索、浏览、定位、访问、共享的需求,也支持数据资源组合封装形成的个性化定制服务,例如数据目录订阅服务、基础数据报表服务、资源数据地图服务、数据智能分析与可视化服务,确保数据业务状态、发展规律及趋势的精准掌握,提升数据利用水平和效率。
图5 面向目录使用者的目录应用服务Fig.5 Catalogue application service for catalogue users
根据我军作战数据资源建设运用现状,基于元数据、目录服务等相关技术,按照目录编制流程方法,从概念内涵、总体框架、构建方法和服务模式4个方面对作战数据资源目录体系展开研究,创新性地设计了作战数据资源核心元数据分类模型及描述方法,有利于数据资源的管理和应用,在此基础之上,提出了作战数据资源目录体系构建方法和服务模式,为全军的作战数据资源目录体系建设提供了有效的技术路径,为推动作战数据资源融合与共享做出了有益的探索。