浅谈空间软件网络构建技术

2020-10-20 06:57葛莹
科学与信息化 2020年22期
关键词:编码

摘 要 在航天器飞行过程中,多传感器输入数据样本点之间,存在复杂的数据传输与计算关系。传统软件定义这些数据为矢量或矩阵的形式。通过软件开发人员人工分析数据之间具有局部联系,这些工作简单枯燥,耗费软件开发人员大量精力。随着空间飞行器任务越来越复杂,数据量成倍数增长,亟待解决的问题就是:为数据找到新的高效的表示和编码方法。本文提出一种基于网络构建技术的方法,为解决空间软件编码问题提供了一种新思路。

关键词 网络构建;空间软件;编码

万维网是以网络格式表示的海量数据的典范,页面可以映射为节点,边就是也页面之间的链接。笔者探索将此种方法引入空间数据处理系统,将传统的以矢量或矩阵形式表示的数据转换成网络表示的形式,解决效率低下的问题。

1空间数据特征

(1)无序数据。例如:位置、速度、角度、角速度、时间信息、轨道信息等。

(2)有序数据:从起飞瞬间开始,执行动作具有顺序特征,且不可逆。

(3)数值数据:例如高度和重量。

网络构建的数据相比以向量表示的数据拥有更多的信息。这些附加信息有几个部分组成,其中最重要的就是样本之间的关系结构或者拓扑信息。网络拓扑结构的优势还有可以用交互的方式进行编码。如何改变非结构化数据?本文引入网络构建技术,作为非结构化数据与结构化数据的桥梁[1]。

首先,处理常用的数据距离定义有:欧氏距离;加权欧式距离;曼哈顿或者城市街区距离;切比雪夫距离闵可夫斯基距离马氏距离等。本文使用马氏距离度量目标软件

接下来处理有序和无序两类数据,本文引入二元属性(出现,不出现)的方法来刻画对象间的相似性。例如:太阳相关数据,地球相关数据,恒星相关数据,飞行器自身产生的数据等。我们定义感兴趣的类别为出现,其他类别为不出现状态。因此,当比较两个向量时,会有四种不同的情况:

M11:表示两个向量同时出现的次数;M10:表示仅第一个向量出现的次数;M01:表示只有第二个向量出现的次数;M00:表示两个向量都不出现的次数

常用的相似度算法有:杰卡德相似度,sorensen相似度,简单匹配相似度等。通过实验对比分析各种相似度匹配算法后,本文使用定义buser相似度算法,

因为在这里引入平方根项,可以消除在其他相似度计算公式(杰卡德相似度)中常见样本大小误差。方法及步骤如下:

假定相似矩阵S 或相异矩阵D,构建网络的最直接方法是在两节点之间建立连边,连边权重通过的倒数的函数获得。这种方法生成的网络通常是完全网络且需要满足以下标准:

(1)为了维持节点之间的相互连接,网络必须包含一个巨大的单元。

(2)为了更好揭示数据节点之间的关系,应尽可能稀疏,这样可以增加数据分类处理的效率,增加准确性和鲁棒性。

在工程实践过程中发现,连边的权重与泛化结果正相关。可以将权重小的连边看作数据通信中的噪声,这些噪声将向算法提供误导性信息。所以,这些带噪声的连边会扭曲最终的网络拓扑结构,删掉这些连边将是提高算法效率的一个重要预处理步骤[2]。

根据以上推理,可以稀疏化相似性和相异性矩阵使用KNN网络,这是一种常用的静态网络构建技术。简单地说是将整个网络剪切成一系列重叠的线性模块,然后将他们粘贴在一起。构建一个有向网络,之间互相连接的边存在的条件是当且仅当两个点是最相似的k个元素之一。计算过程中,我们需要按照相异矩阵的行进行升序排序,一旦排序完成,就可以用统一的方式对待数据关系密集区和稀疏区域中的数据项。当处于稀疏区域时,knn网络被激活。实质上是通过启发式算法完成网络构建。具体而言采用单链路方法,构建连接的稀疏的网络,同时也可以维持原来数据集的簇结构。实验表明当K=3时,对目前中等规模软件网络拓扑效果最优。原因分析为,函数嵌套堆栈最大深度为8层,数据间距离计算结果为1~8之间的球形分布,对软件编码规模和密度非常灵活,实现效果高于传统软件工程师人工分析的正确率。

Knn网络构建技术也可以被描述為优化函数,不需要建立对称矩阵。每个节点的出度与参数K对应,但是节点入度保持变化(至少是K)。这种实验现象的产生可以用非对称特性来解释。另外,优化函数可以通过循环信念传播算法实现。使得本算法可以推广到任意复杂度的软件。只需要选择合适的网络直径d,就可以表征网络代替原有的节点相似性度量。

仿真实验:在某空间软件设计编码的过程中,笔者使用KNN网络构建技术度量数据分类的准确性,所用的核函数均是高斯核,结果表明有4类样本的类间样本用直线连接起来,另一类样本间没有连接。可见目标软件,各类之间的差别是微弱的,本实验算法把输入空间的样本映射到高维特征空间,实现了对软件样本在特征空间的优化的目的。

参考文献

[1] 黄凤岗,宋克欧.模式识别[M].哈尔滨:哈尔滨工程大学出版社, 1998:79.

[2] 沈清,汤霖.模式识别导论[M].北京:国防科技大学出版社,1991:19.

作者简介

葛莹(1983-),女,北京人;学历:硕士,职称:工程师,现就职单位:北京控制工程研究所,研究方向:空间网络软件。

猜你喜欢
编码
分析病案ICD编码中常见的错误因素及干预措施
住院病案首页ICD编码质量在DRG付费中的应用
VB使用Base64编码
影响ICD-10编码准确性的因素分析
VVC视频编码标准QTBT块划分方式
病案编码质量监测与分析
物联网智慧业务地址编码及规则探讨
高效视频编码帧内快速深度决策算法
浅谈H.264视频编码标准的关键技术
不断修缮 建立完善的企业编码管理体系