导航菜单

基于区域的图像检索算法

裴志松 唐昌华

(长春工业大学人文信息学院,吉林 长春 130122)

【摘 要】本论文主要针对现在日益增长的多媒体信息检索需求,以及目前国内外现有的基于区域的图像检索算法的局限性,深入地探讨了基于区域的图像检索的通用技术问题,提出了解决方案,着重于新的图像特征描述方法,相似度检测、特征提取与快速检索算法等方面的研究,构建了一个基于区域的图像检索通用模型,通过大量实验,验证了方案的合理性。

教育期刊网 http://www.jyqkw.com
关键词 基于区域的图像检索;特征提取与匹配;图像分割方法

※基金项目:吉教科合字【2014】第641号。

作者简介:裴志松(1978—),男,吉林长春人,副教授,研究方向为人工智能、仿生学算法、计算机应用技术等。

0 引言

基于区域的图像检索技术是一门被广泛研究的信息检索技术。该项检索技术由系统对图像进行提取与识别,解决了传统的基于教育期刊网 http://www.jyqkw.com
关键词 检索中的各种问题。特别是随着网络技术与多媒体技术、数据库技术相互融合,检索系统开发需求的不断扩大,是一个颇具生命力的研究方向,针对这一方向深入研究,将具有很大的理论价值和广泛的应用前景。

1 基于区域图像检索综述

常用的图像检索技术大致可以分为基于边界检测和基于区域两种方法。包括:边界检测分割法和区域检测法。边界法先检测出图像中的边缘点,然后按照一定的策略把这些边缘点连接成轮廓,封闭边界所包围的像素就组成了相应的区域。

基于区域的方法是把图像中的各个像素依据一定的规则分到各个区域中,这些区域的外围像素就会构成了区域的边界,所以关键是如何确定像素分类的规则。实际规则中应用的区域分割技术主要有两种:一种是阈值化算法,另一种是特征空间聚类。特征空间聚类的方法是对阈值分割的一种推广方式。它采用特征空间点来表示图像空间中的元素,通过将特征空间的点聚集成团,然后再将它们映射回原图像空间,来达到取得分割的结果。通常在高维特征空间的聚类,如果只用一个特征往往不能解决的问题,所以,特征空间聚类通常采用多个特征。通常采用的方法有K-均值、模糊聚类、ISODATA聚类、概率聚类等。区域分割技术有两种基本形式,一种是根据单个像素,逐渐合并以形成所需的分割区域,另一种是从全局的出发,逐渐分裂切割到所需的分割区域,对应的两种典型算法分别是区域生长和分裂合并。

2 基于区域的图像特征的提取

在众多提取参数中,可以选择颜色特征作为K-均值聚类的中心,根据每一个小的区域的颜色的均值和标准差的平均值,可以计算出它的纹理特征,进而对图像进行提取,计算的步骤如下:

(1)在图像中,选择一个点作为提取点,然后将其他点都设置为黑色。

(2)通过转换,将图像的颜色模式转变成灰度图像。

(3)在刚才的灰度图像上,根据算法,作四层小波变换。

(4)在变换后的每个高频子带上,计算他们的平均能量,如公式1所示。

(5)做四层小波变换后,获得的12个能量值,用合适的比例,组成一个纹理特征向量。

E=■■■X(i,j)(1)

式中,X(i,j)表示纹理图像,E表示能量,M、N是纹理图像的维数。

每一个单体特征可以定义为,如公式2所示:

rij=[rij1,rij2,…,rijk,…,rijK](2)

式中,rij表示在区域j特征i的向量,维数为K。

图像的特征定义为,如公式3所示:

R=(rij)(3)

3 基于区域的图像特征的相似性检测

在进行图像匹配的时候,可以获得各种不同的特征值,但是对于图像检索的共享大小不同,所以我们需要对他们进行进一步的归一化处理,规定相似度S都在0到1之间,并且在某个特征rij内部进行。并且,在计算S之前,同时要求将特征向量的各分量rijk(表示第i种方法,第j个区域,第k个分量)统一进行归一化操作,否则采用S的线性组合来计算总体相似度S就变得没有意义。把这种对rijk的归一化称为特征内的归一化。

特征内部的归一化可以使特征向量rij与的各分量与rijk具有同等的重要性。因为特征向量的不同分量,都具有不太相同的含义,所以,经过归一化之后,它们各自的变化幅度也可能有很大不同,如果直接用来计算相似度就会引起很大偏差。所以必须要将特征向量的各分量,都统一的归一化到一定的范围中去。所以,我们定义特征向量V=rij,则每一特征向量rij的归一化过程可以如下:

假设数据库中共M幅素材,而m为素材的索引值,可以这样定义,如公式4所示:

V=Vm=[Vm,1,Vm,2,…,Vm,k,…,Vm,K](4)

表示第m幅素材的特征向量,而K是特征向量V=rij的维数。如果我们将所有素材的Vm累积在一起,就能获得维数为M×K的矩阵,如公式5所示:

v=[vm,k] m=1,2,…,M, k=1,2,…,K(5)

其中vm,k是特征向量Vm(对应于第m幅素材)的第k个分量。为了保证个分量能有相同的重要性,矩阵的第k列是维数为M的一个列向量,记为vk。最终将每列中的元索,都统一归一化到指定的值域标准内,这样就可以保证在计算两个向量之间的相似度。

根据以上计算,如果能够融合高斯归一化方法,可以获得更好的结果。假设列向量vk是一个高斯数列,可以首先计算该数列的标准方差σk和平均值声μk,然后式6来实现高斯归一化,公式定义如公式6所示:

vm,k?坩■(6)

通过结果分析,将公式6的分母部分,都替换为经过σk单独归一化后,数列中的某个值位于区间[-1,1]范围中的概率大约为68%。如果用式6,则根据高斯归化后,其数值在区间[-1,1]范围中的概率已经达到了99%。所以可以认为数列,通过该方法所有值都己经在[-1,1]范围中了,高斯归一化方法的优点在于,即便是数列中存在一些异常的数值,比如过大或者过小,在计算向量间的相似度时,也不会导致分量rijk重要性有所偏差,达到了预期的效果。

4 结束语

通过使用的图像库SIMPLIcity系统提供的测试集。它是从Corel图像库中抽取的500幅图像,分为:人、医疗器械、建筑物、老虎、山峰、食物等,每类一百幅。分别是使用基于区域的方法对其进行检索,结果均达到了理想的要求。

教育期刊网 http://www.jyqkw.com
参考文献

[1]吕英华,唐昌华,孔俊,等.A Content-Based Image Retrieval System Using RBF Neural Network[C]//DCDIS国际会议.2007,10.

[2]章毓晋.图象工程——图象理解与计算机视觉[M].北京:清华大学出版社,2000.

[3]WY Ma and B Manjunath. Netra: A Toolbox for Navigating Large Image Databases[C]//Proc. IEEE Int’l Conf. Image Processing. 2012:568-571.

[责任编辑:汤静]

下载文本