一种基于XGML的RVIS表示方法

2016-11-18 02:57袁家政

北京联合大学学报 2016年4期

关键词：指令集光栅矢量

邱静，袁家政

(北京联合大学北京市信息服务工程重点实验室，北京 100101)

一种基于XGML的RVIS表示方法

邱静，袁家政

(北京联合大学北京市信息服务工程重点实验室，北京 100101)

提出了一种基于XGML的RVIS表示方法。首先，借鉴XML和SVG语法，设计了一套适合RVIS表示的XGML模型；其次，提取图像特征，转换为XGML模型中的图元数据描述集合；最后，对图像进行区域分裂合并操作，对不同区域进行处理，将得到的区域转换为XGML模型中的图元素描述集合。RVIS方法通过对不同的光栅化矢量图像进行试验，结果表明：此方法能够很好地将光栅化矢量图像表示为半结构化的XGML文档，使其存储容量减小且便于检索。

XGML；半结构化；XML；SVG

0 引言

随着网络应用技术的高速发展，Web页面中出现了大量的光栅化矢量图像。一方面光栅化矢量图像存储容量较大；另一方面光栅化矢量图像是以非结构化数据(无规律、语义不明确)的形式存在，在对其进行检索处理上存在一定的难度。超图形文本标记语言(eXtensible Graphics Markup Language，简称XGML)是可扩展标记语言(Extensible Markup Language，简称XML)和可伸缩矢量图形(Scalable Vector Graphics，简称SVG) 语法，将图像存储为一定格式和结构的文本指令体系集合。光栅化矢量图像半结构化(Vector-Raster image semi-structural，简称RVIS)是指将光栅化矢量图像存储为XGML描述指令格式，使其方便进行检索并且减少存储空间。但是由于图像是由一系列离散不规则的像素点组成的，因此RVIS表示存在一定的难度。

XML[1]是一种可以对文档和数据进行结构化处理的标准格式，它能够实现更加准确的搜索以及更方便的文件传输。同时，XML还可以方便进行数据检索功能、图像压缩以及图像理解。[2-3]XML的出现给将图像使用一定格式和结构进行存储带来先机。[4-5]SVG[6]是W3C组织制定的新一代基于XML语法的面向网络应用的二维矢量图形标准格式，其基于文本的动态图形描述格式，能够很好地实现网络传输与信息检索等。由于SVG自身存在的技术优势，能够满足Web中用户浏览的需要，因此SVG被广泛应用于WebGis[7-8]、3G手机中多媒体数据处理[9-11]、数据统计[12-13]等领域。同时，由SVG研究学者成立的SVG共享资源Web网站，展示了大量的SVG应用研究成果。此外，还有一个商业开发软件VectorEye，可以将图像转换为SVG文档。

本文借鉴XML和SVG语法，设计了一套简单有效的适合描述光栅化矢量图像的XGML模型；然后根据图像内容和人体视觉感知等，提取图像特征，转换成XGML模型中的图元数据描述集合；接着对图像进行区域分裂合并操作，对不同区域进行处理，将得到的区域转换为XGML模型中的图元素描述集合。实验结果表明，提出的方法能够很好地将光栅化矢量图像转换为半结构化的XGML文档，从而达到方便图像检索以及减少图像存储空间的目的。

1 XGML指令体系设计

为了同时保留XML的检索优势与SVG(图1为SVG图像的效果展示图，其中图1a)为SVG展示的Tiger图形，图1b)为Tiger图形的SVG代码展示效果)的图像表示优势，我们设计了一种适合图像半结构化的简洁高效的超文本标记语言——XGML。XGML指令体系包括以下两个指令集：图元数据描述指令集、图元素描述指令集。该指令体系不仅减少图像存储空间，还可以实现图像检索功能。

1.1 图元数据描述指令集

XML语法中对图像描述的指令能够达到方便图像检索的目的。本文的图元数据描述指令集，是基于XML语法，利用图像信息来描述图像语义、内容的规范性指令集。XGML元数据描述指令集分为以下两大类：语义规则集合、内容规则集合。

1) 语义规则集合，来源于图像底层特征和邻域关系，主要描述外观信息和位置信息等。这类集合具体语法有很多，下面主要介绍几种常用的规则。

Title用于描述图像标题信息，为图像标签中内容，以结束。为的子标题，内嵌于中间。

Action用于描述图像中实体事件的动作信息，以结束，“Play”“Hit”“Touch”等都为其内嵌属性。

Size用于描述图像大小的信息，以结束，“height”“width”“coordinate”等为其内嵌属性。

Shape用于描述图像形状的信息，以结束，“sharpen”“smooth”等为其内嵌属性。

2) 内容规则集合，来源于图像上下文及人体视觉感知，主要描述图像场景信息及图像特征信息。下面主要介绍几种常用规则：

_{Subject用于描述图像主体对象，以结束，“target““color”等为其内嵌属性。}

Object用于描述图像客体对象，以结束，“target“、“color”等为其内嵌属性。

Element不同于图像的Subject和Object对象，它主要用于描述图像中非主体、客体信息，以及事件发生的位置、原因等信息。以结束，“target”“color”等为其内嵌属性。

1.2 图元素描述指令集

SVG语法能够使用不同形状描述图像区域，但是SVG语法中的指令过长，加大了存储空间。因此，我们借鉴SVG语法，设计一套既简洁又能清楚表达指令意思的图像描述指令集。我们的图元素描述指令集，主要用于表示转换为不同形状的图像区域。使用图元素描述指令集表示图像，可以减少图像的存储容量。其主要分为以下两类：基本图元素对象、复杂图元素对象。

1) 基本图元素对象，类似于SVG中基本形状，这里主要介绍以下几种常用对象：点、线、多边形。

Point用于描述图像中像素点信息，包括点的坐标“x”、“y”，点的颜色“color”等信息。

Line用于描述图像中不同类型的线段，其中属性“style”用于定义线的类型，例如直线为“Line”、折线为“Polyline”。其中直线包括一个起点(S作为起点标记)和一个终点(E为终点标记)；折线包括一个起点、多个转折点(T为转折点标记)。Line中还包括多种属性，例如颜色、线宽等。

Polygon用于描述图像中不同类型的形状，它使用“points=”来定义每个角的坐标，使用“style=”来定义多边形的属性。

2) 复杂图元素对象，描述的是不能使用基本图元元素描述的比较复杂的对象，主要包括以下几种常用对象：

Gradient描述的是一种颜色到另一种颜色的平滑过渡过程。中包括起始坐标(x1,y1)、结束坐标(x2,y2)、起始颜色(r1,g1,b1)、结束颜色(r2,g2,b2)等等。通过调整这些属性来创建不同的渐变过程，例如，水平渐变、垂直渐变等。

指令类似于HTML语言中的样式表功能，将被重用的样式写入样式表中，XGML文档在表示图像时，可以通过这个样式表来对文档进行格式化。指令通过“type”来定义外联样式表和内联样式表。当多个区域会应用同一个样式时，使用外联样式表的属性“link=”指令，将写好的样式表导入文档内部，从而只需要改变样式表中某一个值，就可以达到并行改变图像多个区域值的目的。当需要对单个区域设置样式时，可以在该区域内部使用内联样式。

2 基于XGML的图像半结构化表示方法

2.1 图元数据提取

图元数据的提取，需要通过计算机自动提取图像的底层视觉特征，而使用用户加入高层语义，达到提取图元数据的目标。对输入的将要进行半结构化的图像，我们通过图像分割，分割出图像中的不同区域，然后提取出图像的颜色、色距、纹理等底层视觉特征。我们提取的底层特征中的颜色特征为RGB颜色；同时，提取的LBP(Local Binary Pattern，局部二值模式)是一种用来描述图像局部纹理特征的算子，它具有旋转不变性和灰度不变性等显著的优点；此外，由于颜色信息主要分布于低阶矩中，所以用一阶矩、二阶矩足以表达图像的颜色分布。而用户提取的高层语义，则是基于视觉感知和主观识别来对不同图像场景进行标注。最后，将计算机提取的底层特征以及用户标注的高层语义转换为XGML模型的图元数据文档。图3为提取图元数据实例，其中图3a)为原始图像，图3b)为对原始图像提取的底层特征和高层语义的数据信息，图3c)为将3b)中的底层特征和高层语义数据转换为图元数据的结果。

2.2 图元素转换

2.2.1 区域分割

图元素转换过程首先需要将图像进行区域分割，图像区域划分分为区域分裂和区域合并，图像的区域分裂合并主要依据区域一致性条件，当图像中某个区域的特征不一致时就将该区域分裂成四个相等的子区域，当相邻子区域满足特征一致性时，则将其合并成为一个大的区域。完成区域分裂合并之后，将区域分解为边缘形状部分和颜色特征部分。具体步骤如下所示：

1) 初始，令R为整幅图像的区域，对R进行区域分裂。具体分裂步骤如下所示：

③ 对4个子区域Rik重复步骤①-②，直到没有区域可以分裂为止。

2.2.2 边缘处理

1) 初始，令当前需要计算的边缘点为i，则ai为从点i-1到i的方向，ai+1为从点i到i+1的方向。

通过计算相邻边缘像素点的方向的变化，来提取图像边缘的特征点，减少了图像边缘的存储空间，且为下一步图元素转换做了铺垫。

2.3 图元素转换

接下来，我们将经过上述操作之后的区域mi，转换为图元素描述集合文档，具体如下所示：

3 实验结果与分析

完全实现了我们的基于XGML的RVIS表示方

法，并且在大量的光栅化矢量图像上面进行了测试。整个实验，以构建XGML模型为基础，实现了将光栅化矢量图转换为半结构化文档的目标。我们的半结构化文档相比较于原始图像而言，能够方便图像检索以及减少图像的存储空间。

图5a)为输入的Butterfly光栅化矢量图像，图5b)为使用我们的方法将Butterfly图进行转换的半结构化XGML文档的一部分代码展示。其中图5a)中不同的区域分别对应图5b)中的XGML半结构化文档中的不同区域(例如图5a)中的region 1对应的是图5b)中的region 1，图5b)中的Metadata为提取的图元数据信息)。

表1、表2中的数据能够进一步说明基于XGML的图像半结构化算法，便于图像检索以及减少了图像存储容量。表1中对于Tiger图像、 Butterfly图像、horse图像、thinking-man图像，比较了原始图像信息数量以及转换成为半结构化的XGML文档之后的图元数据信息数量之后，得到的结果。其中，增加的信息为半结构化文档中的图元数据减去原始图像中的信息得到的结果；增加信息的倍数为半结构化文档中的图元数据除以原始图像中的信息得到的结果。由表1可知，经过我们的方法转换的半结构化文档，要比原始图像更加便于检索。表2中分别比较了Tiger图像、Butterfly图像、horse图像、thinking-man图像的原始存储容量以及转换为XGML半结构化文档之后的存储容量。其中，减少存储容量为XGML文档的存储容量减去原始图像的存储容量的结果，减少的存储容量的百分比为减少的存储容量除以原始图像的存储容量的结果。由表2可知，经过我们的方法转换的半结构化文档，比原始图像的存储容量要小。

4 结束语

我们的方法主要针对的是光栅化的矢量图像，在构建XGML指令体系的基础上，将图像进行半结构化描述。通过对不同的光栅化矢量图像进行试验，结果表明，我们的方法能够方便图像检索以及减少图像的存储容量。当然我们的方法还存在一定的局限性，未来将会继续丰富半结构化的概念，建立更加完善的XGML指令体系。

图像原始图像中的信息/个提出的半结构化XGML文档中的信息/个增加的信息/个增加信息的倍数老虎(Tiger)蝴蝶(Butterfly)马(Horse)思考者(Thinking-man)43437981036471.75323.3

表2 原始图像与半结构化XGML文档的存储容量的对比

[1] Hong S, Nah Y. An Intelligent Image Retrieval System using XML[C]//Multimedia Modelling Conference, 2004. Proceedings. International. 2004:363-363.

[2] Maheswari D, Radha V. Secure layer based compound image compression using XML compression[C]//IEEE International Conference on Computational Intelligence and Computing Research,2011:1-5.

[3] Zhao D Z, Li W, Yang J Z. An XML-based process definition language for medical image understanding[C]//Computer Application and System Modeling (ICCASM), 2010 International Conference on. IEEE, 2010:679-683.

[4] 张苗,惠小强. 一种快速的XML文档验证算法[J]. 计算机技术与发展,2015(8):1-7.

[5] 魏博文,宋坤芳,姜明华. 基于MapReduce的XML编码研究[J]. 电子技术与软件工程,2016(4):247-248.

[6] 李清泉,谢智颖,左小清,等. 基于SVG的空间信息描述与可视化表达[J]. 测绘学报,2005(1):58-63.

[7] Wang P, Dong L Y. Web GIS research and application based on SVG[J]. Applied Mechanics & Materials, 2014(513):2004-2007.

[8] Huang H, Li Y, Gartner G, et al. An SVG-based method to support spatial analysis in XML/GML/SVG-based WebGIS[J]. International Journal of Geographical Information Science, 2011, 25(10): 1561-1574.

[9] Yuan M, Yuan J S, Huan G, et al. The mobile oilfield map based on SVG and inforamtion integration[J]. Advanced Materials Research, 2013(798): 349-352.

[10] Lin F, Guo C. Raster-vector integration based on SVG on mobile GIS platform[C]//Pervasive Computing and Applications (ICPCA), 2011 6th International Conference on. IEEE, 2011:378-383.

[11] Zhao Q, Deng F, Zhang W, et al. The research of mobile GIS power distribution line inspection based on mobile SVG/J2ME[J]. Physics Procedia, 2012(24): 1038-1043.

[12] Molina F, Sweeney B, Willard T, et al. Building cross-browser interfaces for digital libraries with scalable vector graphics (SVG)[C]//ACM/IEEE Joint Conference on Digital Libraries, JCDL 2007, Vancouver, BC, Canada, June 18-23, 2007, Proceedings. 2007:494-494.

[13] Ralf Kunze. Dynamic and interactive visualization of weather data with SVG[C/OL]. SVG Open 2005 Conference and Exhibition, Enschede, Netherlands, August 15-18, 2005.http://www.svgopen.org/2005/papers/Dynamic Interactive Weather Data/index.html.

[14] Canny J. A computational approach to edge detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2010, PAMI-8(6):679-698.

(责任编辑李亚青)

An VRIS Representation Method Based on XGML

QIU Jing, YUAN Jia-zheng

(Beijing Key Laboratory of Information Services, Beijing Union University, Beijing 100101, China)

We have proposed a method of VRIS representation based on XGML. We have designed an imitation XGML model based on SVG and XML grammar to assist our VRIS representation. In the processing of our method, image features are converted into a meta-data descriptor.Then, using a split-and-merge algorithm, transforming image into an element descriptors by utilizing XGML model. The model was applied to an experimental data set which includes various vector images. Experiment results show that our VRIS representation method can efficiently represent raster images which originally were vector image to a semi-structured XGML document, and it successfully reduces storage capacity and increases the speed of image retrieval.

XGML; Semi-structured; XML; SVG

10.16255/j.cnki.ldxbz.2016.04.006

2016-03-03

国家自然科学基金项目(61372148； 61271369)，国家科技支撑课题(2015BAH55F03)，北京联合大学“人才强校项目”(BPHR2014A04；BPHR2014E02)。

邱静(1990—)，女，湖北黄冈人，北京联合大学北京市信息服务工程重点实验室硕士研究生，主要研究方向为数字图像处理。

袁家政(1971—)，男，北京市人，北京联合大学教授，主要研究方向为数字图像处理、导航定位。 E-mail: xxtjiazheng@buu.edu.cn

TP 391

1005- 0310(2016)04- 0033- 08