中图分类号: TN711.73?34 文献标识码: A 文章编号: 1004?373X(2014)03?0073?03
Image automatic annotation based on Matlab
ZHANG Xuan, ZANG Miao, LI Jin?quan
(North China University of Technology, Beijing 100041, China)
Abstract: Automatic image annotation plays a key role in retrieving large amounts of digital images, which can transform the visual characteristics of image into annotation word information and brings great convenience for users in retrieving. The automatic image semantic annotation method is researched, and the automatic image annotation system based on Matlab is designed and implemented, which can extract image color and texture features, and make similarity measure between labeled images and mark out the image semantic keywords.
Keywords: Matlab; automatic annotation; visual characteristics; image retrieval
0 引 言
近年来,随着多媒体技术和互联网的快速发展,世界范围内数字图像的容量正以惊人的速度增长。为了有效地组织、查询与浏览如此大规模的图像资源,图像检索技术应运而生, 已成为一个研究热点。
在早期的基于内容的图像检索中,人们利用传统的文本检索技术,为图像做出文字化的注释,以诠释图像的内容。主要做法是从内容方面对图像进行手工标注,然后根据标注信息利用文本检索技术对图像进行检索。人工标注虽然可以较为准确的对图像进行检索,但这项工作耗时费力,尤其面对大规模的图像时,显然它已经无法胜任。因此,如何快速、有效地实现对图像的自动语义标注,变得十分有意义。
目前,图像自动标注技术已经得到了广泛研究,这些方法有着各自不同的出发点和解决方案。本文所实现的图像语义自动标注,就是为了自动获取图像的语义信息,并对待标注图像予以关键字标注,对标注的关键字进行存储,从而对检索做出支持。本文主要研究了图像语义自动标注基本流程、基本原理,基于Matlab通过GUI界面实现了图像标注与简单检索系统,完成图像底层特征的提取、特征匹配相似度测量、图像标注并研究对标注结果进行存储和管理的方法。
1 系统设计
本系统共有三个模块,即图像特征提取模块、图像特征匹配模块、自动标注和相似图像输出模块。系统设计方框图如图1所示。由图可见,系统首先将标准图像库中的图像进行颜色、纹理特征的提取,存储成图像特征库。其中已标注图像构成训练集,利用其图像特征和标注关键词的关系对待标注图像进行自动标注。通过计算待标注图像与训练集中所有图像对应的特征矢量之间的欧氏距离,把欧氏距离最小、即相似度最高的图像的关键字标注给该待标注图像,同时排序输出相似度最高的三幅图像,并存储关键词。
图1 系统概要设计方框图
2 图像特征提取
图像的视觉特征主要包括颜色、纹理、形状和空间关系等。颜色特征是被广泛使用的视觉特征,主要原因在于颜色特征的定义比较明确,特征提取方法比较简单,并且颜色特征能较好地体现出图像中所包含的物体或场景。纹理特征是一种不依赖于亮度或颜色的反映图像中物质现象的视觉特征。此特征包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。
2.1 颜色特征提取
对颜色特征的研究,必须在图像的特定色彩空间中进行,常用的色彩空间有RGB、HSI、HSV等。其中HSI和HSV色彩空间很适合人眼的分辨,能较好地反映人对颜色的感知和鉴别能力。因此本文采用HSI颜色空间。通过式(1)~(3),图像可以从RGB色彩空间转换到HSI色彩空间[1]。
[H=arccosR-G+R-B2R-GR-G+R-BG-B, R≠G或R≠B2π-arccosR-G+R-B2R-GR-G+R-BG-B, B>G](1)
[S = MAX(R,G,B)-MIN(R,G,B)] (2)
[I= R+G+B3] (3)
为了使HSI颜色模型能够更好地符合人眼的视觉特性,首先将图像中每一像素的红、绿、蓝分量值R,G,B转化为色调、饱和度和强度分量值H、S、I(h[0,360],[s [0,1],][v[0,1]]),然后根据HSI颜色空间中颜色特征进行非等间隔量化,见公式(4)~(6)所示:
[H=0,h∈(315,20]1,h∈(20,40]2,h∈(40,75]3,h∈(75,155]4,h∈(155,190]5,h∈(190,270]6,h∈(270,295]7,h∈(295,315]] (4)
[S=0,s∈[0,0.2)1,s∈[0.2,0.7)2,s∈[0.7,1)] (5)
[I=0,i∈0,0.21,i∈0.2,0.72,i∈0.7,1] (6)
对HSI空间进行量化后,[H]的取值范围为[0,1,…,7],[S]的取值范围为[0,1,2],[I]的取值范围为[0,1,2]。通过公式(7)将 HSI 合成为一维特征矢量,则[B]的取值范围为[0,71],是一个72柄的一维直方图,再对特征矢量[B]构造直方图作为图形的颜色特征。
[B=9H+3S+I] (7)
2.2 纹理特征提取
本文采用小波分解提取图形的纹理特征,首先通过Daubechies4小波对图像进行分解,然后提取一层分解的4个频带小波系数的均值和方差作为图像的纹理特征。一幅图像的4个频带分布图示如图2所示。
[[ILL]\&[ILH]\&[IHL]\&[IHH]\&]
图2 频带分布图
进行一层变换后,[(i,j)]点的小波系数为[Cij,]则任一频带的均值和方差计算公式分别为式(8),式(9):
[μ=1MNi=1Mj=1NCi,j] (8)
[D=i=1Mj=1N(Ci,j-μ)2MN] (9)
纹理特征向量表示为:[T=[μLL,DLL,μHL,DHL,μLH,DLH,][μHH,DHH],]小波分解提取纹理特征的方法适用于纹理特征比较复杂的图像。
2.3 图像特征相似性度量以及自动标注
图像特征的相似性度量有很多方法,如欧氏距离法、绝对值距离、切比雪夫距离、马氏距离、兰氏距离等。本文采用的是欧氏距离法。计算公式如(10)所示,欧氏距离越小,两幅图像越匹配,欧氏距离越大,两幅图像越不匹配。因此选择与已标注图像集中欧氏距离最小的图像的标注关键词作为待标注图像的语义关键词。两个[n]维向量[a(x11,x12,…,x1n)]与[b(x21,x22,…,x2n)]间的欧氏距离: (责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)