基于HSV空间颜色特征的图像内容检索及应用

2011-02-17 07:28汤慧唐朝晖彭铁光
中国科技信息 2011年12期
关键词:查全率查准率监狱

汤慧 唐朝晖 彭铁光

1.中南大学信息科学与工程学院,长沙 410083

2.湖南司法警官职业学院管理系,长沙 410131

3.湖南外贸职业学院教务处,长沙 413400

基于HSV空间颜色特征的图像内容检索及应用

汤慧1,2唐朝晖1彭铁光3

1.中南大学信息科学与工程学院,长沙 410083

2.湖南司法警官职业学院管理系,长沙 410131

3.湖南外贸职业学院教务处,长沙 413400

监狱信息安全是数字化监狱的基本要求,随着电子监狱资料库中多元资料的日益增多,自动识别出数字监狱库中图像资料的内容是否涉密成为司法信息安全防范研究的焦点。颜色特征是图像资料的最基本的视觉特征之一,在图像内容检索上具有举足轻重的地位。为了实现监狱图像资料的自动检索与内容感知,本文提出基于HSV空间的22色非均匀颜色特征的图像内容检索方法。实验结果表明,该方法与基于RGB颜色空间的颜色特征检索算法相比,有效降低了时间和空间复杂度,图像查全率、查准率高,实际应用效果明显。

图像内容检索;颜色量化;监狱

引言

监狱本身是一个涉密场所,在信息安全防范上不但要保证网络运行安全,还要确保涉密信息在产生、存储、传递和处理过程中的保密、完整、可用和抗抵赖。特别是对记载国家秘密信息的文字、图像、数据等电子载体进行严格管理防泄密。数字监狱资料库中内容的日益增多、类型的多元化,自动识别出图像内容是否涉密成为司法信息安全防范研究的焦点。

1 数字监狱资料库中图像要求

图像来源于数码相机记录相关文件、会议、活动等拍摄动态视频或静态图像或监狱内安防设备抓拍到的图像。图像保存为BMP格式(24位)色彩、图像分辨率600 dpi以上;尺寸不大于10寸。

2 颜色特征分析

图像内容的检索可从颜色特征入手。颜色特征是图像中最基本的视觉特征,对图像的平移、尺度、旋转等变化不敏感,具有很强的稳定性,且计算简单。图像检索含颜色直方图[1]、颜色矩[2]、颜色集[3]、颜色分布特征[4]、中心矩法等多种表征方法。

2.1 CBIR技术

对图像内容语义进行分析和检索,包括图像本身客观属性,如颜色、纹理、形状等。检索技术的应用方向多为收集图像后进行合理加工(对比度、高度等),提取颜色特征的方法。根据颜色量化,结合相似度算法,提取基于HSV空间查准率、查全率具体的值。

2.2 颜色空间选取

RGB颜色空间有不均匀和不直观的缺点,选择HSV空间合适的原因,一是其三分量相对独立,易通过设定不同权值将其转换成一维进行测量,计算量小;二是色调分量对彩色的描述与人类视觉接近,容易区分。

2.3 HSV空间颜色量化

将三分量进行非等间隔的量化工作。理论上当V<0.152,颜色接近黑色,可忽略H的影响。当S<0.1时,颜色接近灰色图,可忽略H的影响。即把分量H、S、V各分成9份、2份和1份,并根据色彩的不同范围进行量化,合成为一维特征矢量公式l=HQsQv+SQv+V。其中:Qs和Qv分别是分量S、V的量化级数,当取Qs=2,Qv=1时进行细化。l取值范围为[0,21],获得22柄的一维直方图。

3 基于颜色特征的内容检索模型设计

监狱信息图像与其他图像在内容有明显的行业特征,本文更多的是关心图像中的目标的颜色特征,如监舍、劳动改造区、狱警办公区等。如图1中C类执勤服图像的颜色特征集中体现在衣服和软肩章,这些重点目标区域所特有颜色。建立基于图像内容检索的模型分:图像预处理、颜色特征的提取、建数据库与搜索引擎、人机交互界面四大部分。

3.1 监狱图像预处理

在进行图像分析处理前,需对图像进行灰度化、图像增强和降低并减少图像的噪声等预处理,突出有用的信息,为后续颜色特征的图像内容检索工作做准备。

3.2 颜色特征的提取

完成任务区域或涉密区域的选取后,保存为二级图像,并与原始图像建立关联。根据上述颜色量化公式、提取算法对区域图像进行颜色、纹理等特征提取,组建特征库。

3.3 建库与搜索引擎

监狱图像数据库由特征库、图像库、实验子库组成。按照图像颜色相似的原则,即图像颜色数量相当,颜色相近;对应主要颜色面积相当;图像内主要颜色的相似性,本文采用实验子库中五类主题。包括:

A类含9张监狱物理防逃钢网墙,明显特色特征是钢丝呈现银灰色;

B类含8张监舍图,明显特色特征是粉红色被子,床单上有XX监狱的黑色字样;

C类含10张执勤服图,明显特色特征是衣服颜色偏紫或者偏蓝;软肩章用反光线织成,在阳光下发黄;

D类含6张囚服图,明显特色特征是灰蓝为主,上衣的前胸和后背上有白灰相间的条纹,囚裤两侧缝有蓝白条;

E类含10张警车图,明显特色特征是整车藏蓝色和白色为基本色调,辅以黄色。

算法采用衡量搜索引擎的性能的查全率(recall)和查准率(precision)作为评价标准。根据各种特征自动提取出的重点目标区域的特征数据,并建立多维索引结构。

另外,人机交互界面为操作人员提供图像基于内容检索的接口、参数。

4 实验结果与分析

验证实验环境是VC++6.0,用实验子库为操作对象。先人工筛选出43张图像与样图颜色相类似的图像,按22柄的HSV颜色直方图图像颜色相似进行实验,可得A类到E类在RGB空间等间隔的查全率、查准率分别是0.778、0.75、0.7、1.0、0.9;在HSV空间非等间隔的查全率、查准率分别是0.889、0.875、0.9、1.0、1.0,不难看出新算法均高于原算法,检索效果明显增强。

小结

为了实现监狱敏感图像资料的自动检索与内容感知,本文提出了一种新的基于HSV空间的22色非均匀颜色特征的图像内容检索方法。后续工作是构建图像安全管理单元,全程实现涉密图像的可控、在控和可审计的安全防护工作,即涉密计算机上禁止打印/屏幕拷贝图像;禁止涉密图像通过可编程的对象连接与嵌入接口等途径对权限、属性的修改;并当U盘等外设插入时自动报警,有望从信息安全防范的角度有效解决泄密问题。

[1] Swain M J, Ballard D H.Color indexing[J].International Journal of Computer Vision,1991.7 (1):11-32

[2] Pass G, Zabih R.Histogram refinement for content-based image retrieval[A].IEEE Workshop on Applications of Computer Vision[C].1996,96-102

[3] Mlsna P A, Rodriguez JJ.Efficient indexing of multi-color sets for content-based image retrieval[A].4th IEEE Southwest Symposium,2000.116-120

[4] Heckbert P.Color image quantization for frame buffer display[J].Comput Graphics,1982, 16:297-307

TP391.41

10.3969/j.issn.1001-8972.2011.12.054

猜你喜欢
查全率查准率监狱
论监狱企业立法
诞生在监狱中的牙刷
欢迎你到监狱来
海量图书馆档案信息的快速检索方法
基于数据挖掘技术的网络信息过滤系统设计
基于词嵌入语义的精准检索式构建方法
大数据环境下的文本信息挖掘方法
面对聪明的罪犯,监狱还关的住吗?
基于深度特征分析的双线性图像相似度匹配算法
基于Web的概念属性抽取的研究