基于Nystr¨o m低阶近似的半监督流形排序图像检索
傅向华1李坚强1王志强1杜文峰1
摘要实际图像检索过程中,用户提供的相关反馈有限,但存在大量未标记图像数据.本文在前期半监督流形图像检索工作的基础上,提出一种基于Nystr¨o m低阶近似的半监督流形排序图像检索方法.通过采用半监督的流形正则化框架,将图像数据嵌入到低维流形结构中进行分类排序,以充分利用大量未标记数据,并兼顾分类误差、数据分布的几何结构以及分类函数的复杂性.针对半监督学习速度缓慢的问题,基于Nystr¨o m低阶近似对学习过程进行加速.在较大规模的Corel图像数据集上进行了检索实验,实验结果表明该方法能获得较好的效果.
关键词图像检索,流形学习,Nystr¨o m近似,半监督学习
DOI10.3724/SP.J.1004.2011.00787
Semi-supervised Manifold-ranking-based Image Retrieval with
Low-rank Nystr¨o m Approximation
FU Xiang-Hua1LI Jian-Qiang1WANG Zhi-Qiang1DU Wen-Feng1
Abstract In the real image retrieval process,there are abundant unlabeled images whereas there only exist few labeled images.To address this issue,based on our previous work of semi-supervised manifold image retrieval,this paper proposed a novel learning method named semi-supervised manifold ranking based image retrieval(S2MRBIR).The images are assumed always embedded in low-dimensional sub-manifolds.In particular,S2MRBIR adopts the manifold regularization framework to rank the retrieved images while regarding the relevant feedback process of image retrieval as an online learning process and treating the image retrieval as a classification problem.The manifold regularization framework is capable of taking account of both labeled and unlabeled data,the classification performance,the geometric structures of the data distribution,and the complexity of the classifier.Moreover,an accelerating algorithm based on Low-rank Nystr¨o m approximation was proposed to improve the computing procedure of S2MRBIR(NA-S2MRBIR).Experimental results on Corel image database demonstrated the effectiveness of S2MRBIR.
Key words Image retrieval,manifold learning,Nystr¨o m approximation,semi-supervised learning
基于内容的图像检索(Content based image retrieval,CBIR)是图像检索的主要方法,其通过提取图像的颜色、纹理、形状以及对象的空间关系等低层视觉特征进行相似查询和检索[1−2].然而,由于图像低层视觉特征与高层检索语义之间存在着较大的“语义鸿沟”,使得CBIR检索精度受限.为解决这一问题,近年来一些研究人员或者通过提取高层语义特征进行基于语义的图像检索[3],或者在图像检索过程中整合用户的相关反馈[4].相关反馈可视为监督学习问题,要获得较好的性能,则需提供较多的训练样例进行学习,而实际图像检索过程中,用户所能提供的相关反馈样例有限,因此研究人员考虑
收稿日期2010-01-21录用日期2010-11-24
Manuscript received January21,2010;accepted November24, 2010
国家自然科学基金(60903114,61003271),广东省自然科学基金(7301329),深圳市科技计划项目(JC201005280463A)资助Supported by National Natural Science Foundation of China (60903114,61003271),Natural Science Foundation of Guang-dong(7301329),and Science and Technology Foundation of Shenzhen City(JC201005280463A)
1.深圳大学计算机与软件学院深圳518060
1.College of Computer Science and Software Engineering, Shenzhen University,Shenzhen518060将半监督学习引入到图像检索中,以利用大量未标记的样例来改善监督学习的分类性能,如Zhou等将半监督学习和主动学习整合到相关反馈中,利用大量未标记图像来提高相关反馈的性能[5].
此外,由于图像数据维度很高,检索过程中一般需进行维数约简.研究结果表明在表示数据时,基于局部几何特性的流形结构比基于全局特性的欧几里德结构更具表现力[6].因此一些研究人员将流形学习方法用于图像检索,其假设内蕴图像空间为嵌入在特征空间之中的低维流形,通过在图像流形中计算图像间的相似度,对检索的图像进行排序.流形排序(Manifold rank)算法的思想最早由Zhou 等[7]提出,随后被用于图像检索,如He等提出一种基于流形排序的图像检索(Manifold ranking based image retrieval,MRBIR)方法,其根据内蕴流形结构计算待查询图像与查询图像的相似度,以此对数据库中的图像进行排序,结果表明该方法优于主成分分析(Principal component analysis,PCA)等线性维数约简的方法[8];Wang等提出利用核最大间隔投影来发现图像的局部流形结构,然后通过将图像投
788自动化学报37卷
影到低维子空间以改善图像检索的性能[9].Lin 等提出的增量关系嵌入(Augmented relation embed-ding,ARE)提出学习考虑用户喜好的语义流形,其构造三个关系图,一个描述相似关系,另两个通过使用用户提供的相关反馈编码有关和无关关系[10];李杰等在流形排序的基础上,提出区域匹配图的方法[11].
与此不同的是,本文作者前期提出基于流形正则化框架的半监督图像检索方法[12],但该方法在半监督学习过程中计算量较大.针对这一问题,本文进一步提出基于Nystr¨o m 低阶近似的半监督流形排序图像检索,对其进行加速.
1CBIR 中的相关反馈
在带相关反馈的图像检索中,相关反馈过程可
视为监督学习过程[4−5].设查询图像为q ,待检索的图像数据集合为X ={x 1,x 2,···,x n },图像检索则为确定能反映任意图像x 和查询q 之间相关关系的函数f (·),一般采用某种距离度量或相似性度量,定义为:f (x ,q )=sim(x ,q ),其中sim(·)为相似度函数.但如果从监督学习的视角,f (·)可看作一个分类函数,即:若x 与q 相关,则f (x )>0,否则f (x )<0.而检索过程中,用户所提供反馈样例可用作训练样本,对分类函数f (·)进行训练.
若检索过程中用户所提供的反馈样本集合为{(x i ,y i )}l i =1,其中y i 为x i 的标签,定义如下:
y i =
1,when x i is relevant with q
−1,when x i is irrelevant with q 那么,可利用反馈样本集合作为训练数据进行监督学习,以确定函数f (·),使得损失函数L (·)取得最小值.损失函数一般采用平方误差和,即:L (x ,f (x ),
y )= l
i =1(f (x i )−y i )2.从而自动分类的训练问题转换为式(1)的最优化问题:
arg min f
L (x ,f (x ),y )=
l i =1
(f (x i )−y i )2
(1)
通过求解式(1),可得最优分类函数f ∗(·).该分类函数可用于判断任意图像x 是否与查询图像q 相关.
2基于流形正则化的半监督图像检索
2.1半监督的流形正则化学习框架
给定数据集X ={x 1,x 2,···,x l ,x l +1,···,x n }⊂R D ,标签集合Y ={1,···,c },其中X 前l 个数据点X l ={x 1,x 2,···,x l }具有标签{y 1,···,y l }∈Y ,后u 个数据点X u ={x l +1,x l +2,···,x l +u }(其中l +u =n )没有标签.为利用未标注数据,Belkin 等[13]利用图拉普拉斯矩阵作为数据内蕴流形结构
的近似,并将其作为惩罚项与核学习的正则化框架相结合,提出半监督的拉普拉斯流形正则化框架.该框架可转化为式(2)的最优化问题:
f ∗
=arg min f ∈H K 1l
l
i =1
L i (x i ,y i ,f )+γA f 2K +γI
(u +l )2l +u i,j =1
(f (x i )−f (x j ))2W ij
(2)
其中,L i (x i ,y i ,f )为样本(x i ,y i )导致的损失,H K 为与某个Mercer 核K :X ×X →R 相关的可再生希尔伯特空间(RPHS), f K 表示H K 上定义的范数,表征分类函数的复杂性,决定分类函数f 的泛化能力,γA 为正则化因子;W ij 为由所有数据点组成的数据邻接图中边的权值,而(f (x i )−f (x j ))2为数据点x i 和x j 的标签之间的差异,显然,若原始特征空间中邻近的点的标签相差很大,那么(f (x i )−f (x j ))2W ij 会变得很大,因此, l +u
i,j =1(f (x i )−f (x j ))2
W ij 可理解为保持数据几何结构的一致性,即原始特征空间中邻近的点,经f 分类后,应具有相似的标签.
若令f =[f (x 1),f (x 2),···,f (x l +u )]T ,L =D
−W ,D 为对角矩阵,且D ii = l +u
j =1W ij ,那么式(2)可写为
f ∗
=arg min f ∈H k 1l l
i =1
L i (x i ,y i ,f )+γA f 2K +γI (u +l )2
f T
Lf
f (3)
根据表示定理,式(3)的最优化问题的解形式为:
f ∗(x )= l +u
i =1αi K (x i ,x ),其中K (·)为RPHS 中的核函数.若样本(x i ,y i )的损失取L i (x i ,y i ,f (x i ))=(y i −f (x i ))2,可得最小二乘正则化(LapRLS)算法;若样本(x i ,y i )的损失取L i (x i ,y i ,f (x i ))=max(0,1−y i f (x i )),可得支持向量机的正则化(LapSVM)算法[13].
2.2基于流形正则化的半监督流形排序图像检索
考虑将上述基于流形正则化的半监督学习框架用于图像检索,以对待查询的任意图像x 进行分类排序.由于分类排序基于图像的内蕴流形结构进行,故称其为流形排序图像检索.
流形排序图像检索在特征提取预处理之后,进行两次排序,如图1所示.第一次排序时,对于给定的查询图像q 和待查询图像集合X ,首先根据L1距离度量计算X 中的图像数据与查询图像q 的相似度,并根据相似度值进行排序,返回排序结果.第二次排序时,首先由用户从第一次排序结果中选择部分
7期傅向华等:基于Nystr¨o m 低阶近似的半监督流形排序图像检索
7
图1
半监督流形排序图像检索过程
Fig.1
Image retrieval process based on semi-supervised manifold ranking
图像作为反馈样例;然后将反馈样例作为已标注样
本,X 中的其他图像作为未标注样本,基于流形正则化框架进行半监督学习,计算最优参数α∗和分类函
数f ∗(x )= l +u i =1α∗
i
K (x i ,x );最后根据训练好的分类函数f ∗(·)对X 中的图像x 再次进行分类排序.
该检索过程可以分为嵌套的两部分:1)为图1中的虚线框部分,其基于流形正则化框架,利用已标记的反馈图像和大量未标记的数据库图像进行半监督学习,训练可用于对图像数据库中的图像进行分类排序的分类模型;2)为给定查询,返回结果图像的整个图像检索过程,其需调用式(1)中的半监督学习过程.分别用基于流形正则化的半监督学习算法(MRBS 2L)[13]和半监督流形排序图像检索算法(S 2MRBIR)进行描述:
1)基于流形正则化的半监督学习算法(MRBS 2L)
输入.l 个已标注图像数据{(x i ,y i )}l i =1,u 个
无标注图像数据{x j }l +u
j =l +1,正则化参数γA 和γI .
输出.分类函数f ∗:R n →R .
步骤1.利用l +u 个数据结点,构建数据邻接图G ,图G 中边的权值W ij 采用热核权值,即若i =j ,则W ij =exp(− x i −x j 2/2σ2),否则,W ii =0;
步骤2.选择某个核函数K (·),计算l +u 个图像数据的Gram 矩阵K ij =K (x i ,x j );
步骤3.计算邻接图G 的拉普拉斯矩阵:L =D −W ,其中D 为对角矩阵,其对角元素D ii = l +u
j =1W ij ;
步骤4.利用LapRLS 或LapSVM 计算α∗;
步骤5.输出函数f ∗(x )= l +u i =1α∗
i K (x i ,x ).在用户进行相关反馈之前,用于分类排序的分类器尚未进行训练.因此,流形排序图像检索中,需要进行两次排序:1)对于提交的查询图像q ,首先根据L1距离计算图像集合X 中的图像与q 的相似度,对X 中的图像进行排序并返回结果,由用户从返回的图像中选择l 个图像进行相关反馈;2)将用户反馈的l 个图像作为半监督学习算法的已标注样本数据,并利用数据库中其他未标注的图像进行半监督
学习训练,然后再利用训练好的半监督分类器对图像数据进行分类排序,返回查询结果.整个半监督流形排序图像检索算法(S 2MRBIR)算法描述如下:
2)流形排序图像检索算法(S 2MRBIR)输入.查询图像q ,图像集合X .输出.检索结果集合.
步骤1.对查询图像q 和待查询图像集合X 进行特征提取,计算q 与X 的特征空间;
步骤2.基于L1距离度量,计算q 与X 中图像的相似度,根据相似度结果由大到小返回k 个图像;
步骤3.由用户从返回的结果图像中选择l 个图像,对其进行标记,形成反馈样例集合;
步骤4.选择X 中剩余的n −l 个未标记图像,形成未标记的图像集合;
步骤5.调用MRBS 2L 算法,训练分类函数f ∗;步骤6.根据分类函数f ∗,对X 中的图像进行分类排序,返回结果集合.
其中,半监督学习过程耗时较多.MRBS 2L 算法中,涉及到Gram 矩阵的求逆,其时间复杂度为O((l +u )3),即O(n 3).而S 2MRBIR 算法的时间复杂度由MRBS 2L 算法决定,故其时间复杂度亦为O(n 3).
3基于Nystr¨o m 方法的核低阶近似
上述MRBS 2L 和S 2MRBIR 算法中,当数据集规模增大时,会导致核矩阵K 增加,从而使训练时间大大增加.为改进半监督学习的计算过程,以加快流形排序图像检索的速度,采用改进的Nystr¨o m 方法对核矩阵进行低阶近似[14].
对由样本集合X ={x 1,x 2,···,x n }构成的核矩阵K 进行特征分解,则:
K =ΦX ΛX ΦT X
(4)
其中,ΛX =diag {λ(F )
i }i ,λ(F )
1≥λ(F )
2≥ 0
ΦX 为正规化矩阵.Nystr¨o m 方法从样本集合X 中随机选择包含m 个样本的子集Z ={z i }m i =1,利用其来近似核矩阵K ,则式(4)的特征系统可表示为
ΦX
m
n
EΦZΛ−1
Z
,ΛX n
mΛZ
(5)
其中,E∈R n×m,E ij=K(x i,z j),而ΦZ,ΛZ∈R m×m包含了H∈R m×m的特征向量和特征值,其中H ij=K(z i,z j).将式(5)代入式(4),则得到核矩阵K的Nystr¨o m低阶近似基本公式:
K (
m
n
EΦZΛ−1
Z
)(
n
m
ΛZ)(
m
n
EΦZΛ−1
Z
)T=
EH−1E T=˜K(6)
并且,式(6)的近似误差可表示为K与其近似值差值的Frobenius范数,则
ε=
K−EH−1E T
F
(7)
根据式(7),显然误差值越小,近似值越准确.对于常用的核,影响近似质量的最重要因素是:X中每个采样点与Z中离其最近的界标(Landmark)点之间的量化误差.如果这一量化误差为0,那么对核矩阵的Nystr¨o m低阶近似是完全准确的.而由于K-means聚类可获得量化误差的局部最小值,因此可以采用K-means聚类所获得的中心点作为界标点,设m为样本子集Z所期望的界标点数目,则m 越大,Nystr¨o m近似越精确,然而计算量也会越大.
上述基于K-means的Nystr¨o m核矩阵低阶近似算法[14]描述如下:
输入.样本集合X,界标点数m.
输出.低阶近似矩阵˜K.
步骤1.对样本集合X运行K-means聚类算法,获得m个聚类中心点;
步骤2.将m个中心点作为样本子集Z,根据样本集合X和样本子集Z,计算矩阵E;
步骤3.计算m个中心点确定的核矩阵H和逆阵H−1;
步骤4.根据公式˜K=EH−1E T计算核近似矩阵˜K.
在该近似算法中,步骤1聚类的时间复杂度为O(tmn),t为迭代的次数;步骤2计算矩阵E 的时间复杂度为O(mn);步骤3计算核矩阵H 的时间复杂度为O(m2),计算逆阵H−1的时间复杂度为O(m3);步骤4计算˜K的时间复杂度为O(mn).由于一般m n,t n,故基于K-means 的Nystr¨o m核矩阵低阶近似算法的时间复杂度为O(mn).
可以利用近似核˜K代替第2.2节中MRBS2L 算法的核矩阵K,以加速整个半监督流形排序图像检索的处理过程,本文称其为基于Nystr¨o m低阶近似的半监督流形排序图像检索(NA-S2MRBIR),其对应的时间复杂度为O(mn2).
4实验结果与分析
实验对本文所提的NA-S2MRBIR,S2MRBIR 方法与MRBIR,SVM以及L1距离法进行比较.为验证本文算法的有效性,选择在较大规模的Corel图像数据库中进行仿真实验.实验环境为CPU Pen-tium43.00GHz,内存1G,操作系统为Windows XP.
4.1实验设置与评价指标
实验所采用的Corel图像数据库共包括9908张图片,包含96个类别,涉及自然景观、动植物、历史建筑、城市生活等多个方面,每个类别包含85∼120个图像,每幅图像大小为128像素×85像素或128像素×96像素.实验分为两部分,首先在Corel图像子集上验证本文所提半监督流形排序方法的有效性,然后在整个Corel图像数据库上验证Nystr¨o m低阶近似中m取值对查准率的影响.
实验时,每次从待测图像集合中任意选择一幅图像作为查询图像,剩余的其他图像作为待查询图像,然后对检索结果进行统计评价.检索性能的评价指标采用查准率范围曲线(Precision-scope curve)[15],其中范围表示由用户指定的在检索返回结果中排在最前面的图像数目N,而查准率表示用户指定的范围N中相关图像的比率.查准率范围曲线描述了不同范围时的查准率,可以用于评价算法的整体性能.考虑到实际应用,并方便与已有的其他检索方法比较,实验中在选择图像特征时只考虑颜色、纹理等全局特征,各特征及维数如表1所示.
表1实验所采用的图像特征及维数
Table1Image features and dimensions used in
the experiments
名称描述维数
颜色相关图HSV空间,144维
颜色直方图HSV空间,32维
颜色矩HSV空间,9维
Tamura纹理特征粗糙度、对比度、方向度,20维金字塔结构的小波纹理特征24维
4.2实验结果及分析
实验过程分成两部分,首先验证本文所提半监督流形排序方法的有效性.该部分实验中,将NA-S2MRBIR,S2MRBIR,MRBIR,SVM以及L1距离法进行比较.由于计算量很大,参考已有研究文7期傅向华等:基于Nystr¨o m低阶近似的半监督流形排序图像检索791
献的实验设置情况,每次选择Corel图像数据库的子集进行实验.整个实验分4组进行,每组实验从Corel图像数据库中选择10个特征比较明显的类别,每个类别包含具有相同内容的100幅图像,共1000幅图像,形成一个Corel图像子集.其中一组子集每个类别的典型图像如图2所示
.
图2图像数据库中10类图像的典型图像
Fig.2Typical images of ten categories in
Corel image database
相关反馈中,用户标记10幅图像,即l=10.参照文献[13−14]中的实验结果,MRBIR方法的参数分别设为:k=200,α=0.99,σl=0.05,迭代次数设为50次.而S2MRBIR方法中,邻接图的边权值W ij采用热核权值,经过多次实验,正则化参数设置为γA l=γI l/(u+l)2=0.005.NA-S2MRBIR 的参数m取值200,其他参数取值与S2MRBIR方法相同.SVM的参数采用自动优化确定的参数.分别对4组Corel图像子集进行无标记数据的无相关反馈实验和有部分标记的有相关反馈实验,并计算相同参数时4组Corel图像子集上的实验结果平均值,得到无相关反馈时的实验结果如图3所示,有相关反馈的实验结果如图4所示.
图3的结果表明,在无相关反馈情况下,虽然NA-S2MRBIR,S2MRBIR,MRBIR方法的结果优于L1方法,但检索准确度提高不是很大,在Scope 为10时的准确率约为42%,在Scope为20时的准确度约为35%,而随着返回结果的增多,准确度下降.与图3相比,图4中有反馈的图像检索准确度明显改善,在Scope为10时的准确率均达到67%以上,在Scope为20时NA-S2MRBIR,S2MRBIR, MRBIR方法均达到58%以上的准确度,说明相关反馈对于改善图像检索准确度很有效;并且,从图4也可以看出,采用流形排序的NA-S2MRBIR, S2MRBIR,MRBIR的方法要明显优于SVM方法,而本文所提出的采用半监督学习的NA-S2MRBIR, S2MRBIR方法结果又要稍优于MRBIR方法,说明利用大量未标记数据集可以改善检索结果
.
图3无相关反馈时的图像检索实验结果
Fig.3Retrieval experiment results without
relevance
feedback
图4带相关反馈的图像检索实验结果
Fig.4Retrieval experiment results with
relevance feedback
不同方法在4组Corel图像子集上的平均运行时间如表2所示,包括无反馈时的图像检索时间和反馈的时间.由表2可以看出,在所有的方法中,L1距离法的处理时间最快,其次为SVM方法,而基于流形的方法(MRBIR,S2MRBIR,NA-S2MRBIR)由于计算量较大,处理时间都相对较长,尤其是S2MRBIR方法,因为增加了半监督学习过程,处理时间远大于其他方法;而采用Nystr¨o m低阶近似后的NA-S2MRBIR方法相对于S2MRBIR 方法,无论是无反馈还是有反馈,处理时间都大大减少,即使与MRBIR方法相比时间也少很多.综合图3和图4的实验结果,说明NA-S2MRBIR方法能够在几乎不影响检索准确度的情况下,有效提升图像检索的处理速度.792自动化学报37卷
第二部分实验是验证Nystr¨o m低阶近似中,m 取值对查准率的影响.实验中分别选择m=10, 20,50,100,200,500,1000,在由所有图像组成的Corel数据库中进行实验,实验结果如图5所示.从实验结果可以看出,当m较小时,增加m的值,会提高查准率;但当m到一定的值以后,如m=200和m=500,m=1000的查准率相比,差别并不大,这说明,m并不需取很大的值,就可以采用基于K-means聚类的Nystr¨o m低阶近似方法较好地近似原来的Gram矩阵,从而提高原问题的处理速度.
表2不同方法的平均处理时间
Table2Comparison of average processing time
时间(s)L1MRBIR SVM S2MRBIR NA-S2MRBIR 无反馈0.0120.768– 1.6350.276
反馈–0.7830.087 1.627
0.282
图5NA-S2MRBIR方法m取不同值时的实验结果比较Fig.5Experiment results of the NA-S2MRBIR method
with different m values
5结论
本文在前期半监督流形图像检索工作的基础上,提出一种基于Nystr¨o m低阶近似的半监督流形排序图像检索方法,通过采用半监督的流形正则化框架对检索图像进行分类排序,充分利用未标记数据,并基于Nystr¨o m低阶近似对计算过程进行加速.该方法既支持无反馈的图像检索,也支持有反馈的图像检索.在Corel图像数据集上的实验结果表明,该方法能获得较好的效果.
不过,由于用户提供的相关反馈经常动态变化的,因此如何使流形正则化算法能够利用已有的学习结果进行增量学习,值得进一步研究.而且,对于半监督学习过程的加速,也可以考虑其他基于采样的近似计算方法.
References
1Smeulders A W M,Worring M,Santini S,Gupta A,Jain R.Content-based image retrieval at the end of the early years.IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(12):1349−1380
2Liu Qing,Xu Lu-Ping,Ma Yi-De,Wang Yong.Image NMI feature extraction and retrieval method based on pulse cou-pled neural networks.Acta Automatica Sinica,2010,36(7): 931−938
(刘勍,许录平,马义德,王勇.基于脉冲耦合神经网络的图像NMI 特征提取及检索方法.自动化学报,2010,36(7):931−938)
3Liu Y,Zhang D S,Lu G J,Ma W Y.A survey of content-based image retrieval with high-level semantics.Pattern Recognition,2007,40(1):262−282
4Arevalillo-Herraez M,Ferri F J,Domingo J.A naive rel-evance feedback model for content-based image retrieval using multiple similarity measures.Pattern Recognition, 43(3):619−629
5Zhou Z H,Chen K J,Dai H B.Enhancing relevance feedback in image retrieval using unlabeled data.ACM Transactions on Information Systems,2006,24(2):219−244
6Luo Si-Wei,Zhao Lian-Wei.Manifold learning algorithms based on spectral graph theory.Journal of Computer Re-search and Development,2006,43(7):1173−1179
(罗四维,赵连伟.基于谱图理论的流形学习算法.计算机研究与发展,2006,43(7):1173−1179)
7Zhou D Y,Weston J,Gretton A,Bousquet O,Scholkopf B.
Ranking on data manifolds.Advances in Neural Informa-tion Processing Systems.Cambridge:The MIT Press,2004.
169−176
8He J R,Li M J,Zhang H J,Tong H H,Zhang C S.Gener-alized manifold-ranking-based image retrieval.IEEE Trans-actions on Image Processing,2006,15(10):3170−3177
9Wang C,Zhao J,He X F,Chen C,Bu J J.Image retrieval us-ing nonlinear manifold embedding.Neurocomputing,2009, 72(16−18):3922−3929
10Lin Y Y,Liu T L,Chen H T.Semantic manifold learning for image retrieval.In:Proceedings of the13th Annual ACM International Conference on Multimedia.New York,USA: ACM,2005.249−258
11Li Jie,Cheng Yi-Min,Ge Shi-Ming,Zhang Ling.Inte-grated manifold ranking and region matching for image re-trieval.Journal of Chinese Computer Systems,2008,29(3): 511−515
(李杰,程义民,葛仕明,张玲.结合流形排序和区域匹配的图像检索.小型微型计算机系统,2008,29(3):511−515)
7期傅向华等:基于Nystr¨o m低阶近似的半监督流形排序图像检索793
12Wang Zhi-Qiang,Fu Xiang-Hua,Zhao Liang-Hui,Du Wen-Feng.Manifold based semi-supervised learning for content-based image retrieval.Geomatics and Information Science of Wuhan University,2009,34(8):928−931,935
(王志强,傅向华,赵良辉,杜文峰.基于内容的半监督流体图像检索.武汉大学学报信息科学版,2009,34(8):928−931,935)
13Belkin M,Niyogi P,Sindhwani V.Manifold regularization:
a geometric framework for learning from labeled and unla-
beled examples.The Journal of Machine Learning Research, 2006,7:2399−2434
14Zhang K,Tsang I W,Kwok J T.Improved Nystr¨o m low-rank approximation and error analysis.In:Proceedings of the25th International Conference on Machine Learning.
New York,USA:ACM,2008.1232−1239
15Huijsmans D P,Sebe N.How to complete performance graphs in content-based image retrieval:add generality and normalize scope.IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(2):245−251
傅向华深圳大学计算机与软件学院副
教授.2005年获西安交通大学电信学院
计算机系博士学位.主要研究方向为数
据挖掘,信息检索.本文通信作者.
E-mail:fuxh@szu.edu.cn
(FU Xiang-Hua Associate profes-
sor at the College of Computer Sci-
ence and Software Engineering,Shen-zhen University.He received his Ph.D.degree from Xi an Jiaotong University in2005.His research interest covers data mining and information retrieval.Corresponding au-thor of this paper.)
李坚强深圳大学计算机与软件学院讲
师.2008年获华南理工大学自动化学院
博士学位.主要研究方向为自动化控制
和机器人.E-mail:lijq@szu.edu.cn
(LI Jian-Qiang Lecturer at the Col-
lege of Computer Science and Software
Engineering,Shenzhen University.He
received his Ph.D.degree from South China University of Technology in2008.His research in-terest covers automatic control and robots.)
王志强深圳大学计算机与软件学院教
授.1992年获湖北工业大学工学硕士学
位.主要研究方向为多媒体信息处理.
E-mail:wangzq@szu.edu.cn
(W ANG Zhi-Qiang Professor at
the College of Computer Science and
Software Engineering,Shenzhen Uni-
versity.He received his master degree from Hubei University of Technology in1992.His main research interest is multimedia information processing.)
杜文峰深圳大学计算机与软件学院讲
师.2007年获华中南大学计算机学院博
士学位.主要研究方向为无线网络.
E-mail:duwf@szu.edu.cn
(DU Wen-Feng Lecturer at the
College of Computer Science and Soft-
ware Engineering,Shenzhen University.
He received his Ph.D.degree from Cen-tral South University in2007.His main research interest is wireless network.)下载本文