本文共 1229 字,大约阅读时间需要 4 分钟。
颜色特征在图像检索中的应用是多种视觉特征中最为广泛使用的,主要原因在于颜色不仅能够有效地反映图像所包含的物体或场景,还具有较高的鲁棒性。与尺寸、方向、视角等因素密切相关的特征相比,颜色特征对图像的整体特征描述具有较强的适应性。然而,如何有效地提取和表达颜色特征并构建图像间的相似度模型,仍然是图像检索领域中需要深入探讨的问题。
颜色直方图是图像检索系统中最为常用的颜色特征之一。这种特征描述了图像中不同颜色占据的比例,但并未关注颜色所处的具体位置。因此,颜色直方图特别适用于那些难以进行自动分割的图像。然而,颜色直方图的表达方式会受到颜色空间和量化方法的影响。传统的RGB颜色空间虽然常用,但其结构与人类对颜色相似性的主观认知存在差异。因此,研究人员提出了HSV、Luv和Lab等颜色空间的颜色直方图,这些空间更能反映人类对颜色的感知。
在颜色量化过程中,需要将颜色空间划分为多个小区间(称为bin),以便对颜色分布进行统计。常用的方法包括向量量化、聚类算法和神经网络方法。均匀划分颜色空间各个分量是一种简单且有效的方法,但聚类算法能够更好地考虑颜色分布的实际情况,从而减少某些bin中像素稀疏的问题。为了提高颜色直方图的相似度计算,部分研究采用了二次式距离或对颜色直方图进行平滑过滤的方法,以减少颜色间的错位影响。
选择颜色直方图的bin数目需要权衡性能和效率。bin数目越多,颜色分辨能力越强,但这也会增加计算负担。研究发现,仅选择数值最大的bin进行构造可以有效降低噪声对检索效果的干扰,同时仍能保持较高的检索性能。
颜色矩是一种简洁而有效的颜色特征表示方法。由Stricker和Orengo提出的颜色矩基于图像中颜色的分布,可以通过低阶矩(如均值、方差和偏度)来描述颜色特征。颜色矩的优势在于其计算简单且无需向量化处理,仅需9个分量即可表达。然而,由于低阶矩的分辨能力有限,颜色矩通常与其他特征结合使用,以提高检索效果。
为了更好地表达颜色特征的空间信息,Smith和Chang提出了颜色集特征。这种方法先将RGB颜色空间转化为视觉均衡的颜色空间(如HSV),然后通过颜色自动分割技术将图像分为若干区域,每个区域用量化后的颜色分量进行索引。颜色集表达为二进制向量,便于构建二分查找树,显著提升了大规模图像库中的检索效率。
颜色聚合向量是对颜色直方图的进一步优化。通过对每个bin中的像素进行聚合处理,颜色聚合向量不仅保留了颜色分布的比例信息,还包含了颜色分布的空间信息,从而提升了检索效果。Pass提出的颜色聚合向量通过设定聚合像素的连续区域面积阈值,增强了颜色特征的表达能力。
颜色相关图是另一种颜色特征表达方式,它不仅反映了颜色分布的比例,还刻画了不同颜色像素之间的空间相关性。这种特征在查询空间关系一致的图像时表现出较高的检索效率。为了降低颜色相关图的空间复杂度,研究人员提出了颜色自动相关图,其仅考察同色像素的空间关系,显著降低了计算复杂度。
转载地址:http://yarfk.baihongyu.com/