«上一篇 下一篇»
  计算机工程  2022, Vol. 48 Issue (10): 238-244  DOI: 10.19678/j.issn.1000-3428.0062899
0

引用本文  

张智豪, 范九伦. 基于S分量指数加权H分量的圆形直方图阈值法[J]. 计算机工程, 2022, 48(10), 238-244. DOI: 10.19678/j.issn.1000-3428.0062899.
ZHANG Zhihao, FAN Jiulun. Circular Histogram Thresholding Method Based on S-component Exponential Weighted H-component[J]. Computer Engineering, 2022, 48(10), 238-244. DOI: 10.19678/j.issn.1000-3428.0062899.

基金项目

国家自然科学基金(62071378)

作者简介

张智豪(1996—),男,硕士研究生,主研方向为图像分割;
范九伦,教授、博士、博士生导师

文章历史

收稿日期:2021-10-11
修回日期:2021-11-16
基于S分量指数加权H分量的圆形直方图阈值法
张智豪 , 范九伦     
西安邮电大学 通信与信息工程学院, 西安 710021
摘要:HSI颜色空间可以用三维空间下的圆锥模型进行解释,基于HSI颜色空间的H分量圆形直方图实现彩色图像分割具有可行性。针对HSI颜色空间的H分量圆形直方图毛刺较多以及相关阈值选取准则分割精度较低的问题,给出S分量指数加权H分量的直方图公式,利用S分量信息对H分量直方图的毛刺进行平滑处理,并通过分析给出指数加权因子的最优取值。在此基础上,提出一种圆形直方图阈值分割法,通过对整个圆形直方图进行整体角均值计算而得出新的阈值选取准则。实验结果表明,该圆形直方图阈值分割法具有有效性,在测试数据集上,与3个圆形最大熵阈值分割法以及2个阈值分割准则相比,所提方法的像素精度值平均提高3.2%,结构相似度值平均提高2.5%。
关键词HSI颜色空间    S分量    H分量    圆形直方图    阈值分割    
Circular Histogram Thresholding Method Based on S-component Exponential Weighted H-component
ZHANG Zhihao , FAN Jiulun     
School of Communication and Information Engineering, Xi'an University of Posts and Telecommunications, Xi'an 710021, China
Abstract: Hue-Saturation-Intensity(HSI) color space can be explained by cone model in three-dimensional space. It is feasible to realize color image segmentation based on the H-component circular histogram of HSI color space. Aimed at the problems of more burrs in the H-component circular histogram in the HSI color space and the low segmentation accuracy of the relevant threshold selection criteria, the histogram formula of the S-component exponential weighted H-component is presented. The burrs of the H-component histogram are smoothed by using S-component information, and the optimal value of the exponential weighting factor is determined. On this basis, a threshold segmentation method of the circular histogram is proposed, and a new threshold selection criterion is obtained by calculating the overall angular mean of the circular histogram. The experimental results show that the circular histogram threshold segmentation method is effective. On the test data set, compared with the three circular maximum entropy threshold segmentation methods and the two threshold segmentation criteria, the proposed method improves pixel accuracy and structural similarity on average by 3.2% and 2.5%, respectively.
Key words: HSI color space    S-component    H-component    circular histogram    threshold segmentation    

开放科学(资源服务)标志码(OSID):

0 概述

彩色图像分割是图像分析、图像理解和计算机视觉领域的一个重要课题[1-3]。然而,使用最广泛的RGB颜色空间[4]并不适合彩色图像分割任务,原因是R(红)、G(绿)、B(蓝)3个分量具有高度相关性。对于HSI颜色空间而言,H(色调)、S(饱和度)和I(强度)是线性无关的,H和S分量反映了颜色属性,I分量是对光线强度的描述。HSI模型[5-6]的3个分量能够准确量化像素点的颜色信息,在以色彩为主要特征的图像分割任务中[7-9]具有较大优势。

HSI颜色空间可以用一个圆锥模型来表示,像素的色调(H)值由该点到圆面上圆心的直线与水平线所形成的圆心角表示,饱和度(S)大小可以由像素点与所在圆面的圆心之间的距离表示,且其随距离的增大而增大,亮度(I)大小可以由像素点所在圆面与圆锥顶部之间的距离表示,且其随距离的增大而增大。H分量通常被用来在宏观上区分某一种颜色,每种颜色对应特定的波长,其反映了颜色的“质量”。S分量指颜色的纯度,即颜色的深浅程度,表示一种纯色被白光稀释的程度,在通常情况下,颜色越鲜艳,饱和度越高。

H分量具有周期(循环)特性,用直方图表示时是一个圆形直方图。基于H分量的圆形直方图可以实现彩色图像的图像检索[10-11]和阈值分割[12-14]。然而,仅使用H分量的圆形直方图在进行图像检索或阈值选取时,饱和度(S)低的像素会导致色调(H)直方图出现大量的“毛刺”,使得直方图看起来参差不齐,不够平滑,不易理解与分析,图像分析效果受这些无意义“毛刺”的影响很大。为此,HANBURY[15]提出构建S分量加权H分量的直方图,并将其应用于数据库中的图像检索,其基本思想是:色彩更丰富(饱和程度更高)的像素在色调(H)直方图中获得的权重比色彩更少(饱和度更低)的像素高。通过计算S分量加权H分量的直方图,可以减小像素对标准色调(H)直方图的影响。然而,在实际的彩色图像分析中,仅对彩色图像的色调(H)分量进行大小为饱和度(S)自身的加权,往往不能得到易于分析的直方图,尤其在对图像进行分割处理时,直方图的好坏对最佳阈值选取尤为重要。为此,本文在HANBURY研究成果的基础上,引入可变的指数加权因子$ \alpha $,提出S分量指数加权H分量的直方图公式,该公式将H分量直方图、S分量加权H分量的直方图作为特例。线性直方图上的Otsu法和最大熵法是2个经典的阈值分割方法[16-17],本文提出圆形直方图上的最大熵法并给出递推公式[12-14]。LAI等[18]基于线性Otsu法给出2个圆形Otsu版本,本文给出另一种圆形Otsu法的表述,并以最优指数加权因子的饱和度指数加权色调直方图作为预处理,通过对圆形最大熵法、LAI等[18]所提2个圆形Otsu版本进行对比实验,以验证本文方法的有效性。

1 S分量指数加权H分量的直方图

传统的线性直方图通过统计像素点在整幅图像中出现的次数来反映一幅图像的像素分布,而圆形直方图不同于线性直方图,其直方图的起点和终点是相连接的,如图 1所示。相较RGB颜色图像,HSI颜色图像更能匹配人眼的颜色感知,这在一些光照不均匀的情况下能够发挥优势,因此,许多研究人员在图像分割中使用HSI颜色空间模型[5-6]。H分量是颜色“质量”的反映,每种颜色都有相应的波长和色相。因为色调独立于高光和阴影,所以色调对于区分不同颜色的物体非常有效,充分利用彩色图像的色调分量信息,可以使图像分割达到期望结果。彩色图像的色调值是在$ [ $0°,360°$ ) $区间内周期性变化的,色调H分量的频率直方图通过首尾连接而形成圆形直方图,因此,圆形直方图能够体现色调值呈周期性变化这一性质。

Download:
图 1 H分量直方图 Fig. 1 H-component histogram

本文用$ H(x, y) $表示色调(H)分量通道尺寸为$ M\times N $的彩色图像中任意像素的色调(H)值,将H分量在每一个色调$ \theta $上的出现频率记为$ h\left(\theta \right) $,表示式如下:

$ h\left(\theta \right)=\frac{\sum\limits _{x=1}^{M}\sum\limits _{y=1}^{N}\delta \left(H\right(x, y)-\theta )}{MN} $ (1)

其中:$ \theta \in $$ [ $0°,⋯,360°$ ) $表示H分量直方图的取值;$ \delta $表示kronecker符号函数。

如前文所述,用H分量直方图进行处理具有局限性,为此,HANBURY[15]提出通过S分量加权H分量直方图的方式来改善直方图,具体公式如下:

$ \mathrm{H}\mathrm{i}\mathrm{s}{\mathrm{t}}_{\theta }^{sw}=\sum\limits _{p}{s}_{p}\delta (\theta , {h}_{p}) $ (2)

其中:$ \delta (\theta , {h}_{p})=\left\{\begin{array}{l}1, \theta ={h}_{p}\\ 0, \mathrm{其}\mathrm{他}\end{array}\right. $$ {s}_{p} $$ {h}_{p} $分别是HSI颜色空间中像素p处的饱和度(S)和色调(H)值。

在HSI颜色空间中,H分量表示颜色种类,S分量表示颜色的鲜艳程度。为了进一步增强H分量的表示效果,本文通过引入指数加权因子$ \alpha $来增强或削弱饱和度(S)的影响。S分量指数加权H分量的直方图定义如下:

$ \mathrm{H}\mathrm{i}\mathrm{s}{\mathrm{t}}_{\theta }^{sw}\left(\alpha \right)=\sum\limits _{p}{s}_{p}^{\alpha }\delta (\theta , {h}_{p}) $ (3)

其中:指数加权因子$ \alpha $可以为任意非负值。

当指数加权因子$ \alpha =0 $时,式(3)仅表示原来的H分量直方图(式(1));当指数加权因子$ \alpha =1 $时,式(3)即为HANBURY[15]给出的表述(式(2))。可以看出,式(3)具有一般性。如何确定合适的$ \alpha $值,下文将在实验部分进行讨论。

2 圆形直方图上的阈值法

圆形直方图的阈值化方式不同于传统的线性直方图阈值化方式。线性直方图的2类阈值只需要找到一个介于灰度直方图区域$ [\mathrm{0, 1}, \cdots , N-1] $内的阈值点,然后将线性直方图分成2个部分,而圆形直方图的0点和$ N-1 $点首尾相连,2类阈值需要找到2个阈值点,然后将圆形直方图分成2个部分。借鉴灰度直方图阈值中的Otsu法,LAI等[18]给出圆形直方图上的2种阈值选取准则。

对于圆形直方图$ \left\{h\left(t\right)\right\} $$ t\in \mathit{\Omega} =\left[\mathrm{0, 1}, \cdots , N-1\right] $$ N-1 $和0这2个元素相邻,需要找到2个阈值$ {t}_{0} $$ {t}_{1} $(沿逆时针方向寻找阈值,$ {t}_{0}\in \mathit{\Omega} $$ {t}_{0}\prec {t}_{1} $,“$ \prec $”代表逆时针方向),其中,第一个阈值作为圆形直方图的起点,另外一个阈值将圆形直方图分为2个部分。参考LAI等[18]所给的定义,如果$ {t}_{0}\le {t}_{1} $,则$ {t}_{0} $$ {t}_{1} $的部分记为$ {t}_{0}\cdots {t}_{1} $;如果$ {t}_{0} > {t}_{1} $,则$ {t}_{0} $$ {t}_{1} $的部分记为$ {t}_{0}\cdots N-1\bigcup $ $ 0\cdots {t}_{1} $。将循环和定义为$ \sum\limits _{}^{\mathrm{o}}{}_{t={t}_{0}}^{{t}_{1}} $

$ \sum\limits _{}^{\mathrm{o}}{}_{t={t}_{0}}^{{t}_{1}}=\left\{\begin{array}{l}\sum\limits _{t={t}_{0}}^{{t}_{1}}, {t}_{0}\le {t}_{1}\\ \sum\limits _{t={t}_{0}}^{N-1}+\sum\limits _{t=0}^{{t}_{1}}, {t}_{0} > {t}_{1}\end{array}\right. $ (4)

$ {t}_{0}\cdots {t}_{1}-1 $$ {t}_{1}\cdots {t}_{0}-1 $(逆时针方向)2个部分的概率分别记为:

$ {P}_{0}({t}_{0}, {t}_{1})=\sum\limits _{}^\mathrm{o}{}_{t={t}_{0}}^{{t}_{1}-1}h\left(t\right)\\{P}_{1}({t}_{0}, {t}_{1})=\sum\limits _{}^\mathrm{o}{}_{t={t}_{1}}^{{t}_{0}-1}h\left(t\right) $ (5)

阈值对$ ({t}_{0}, {t}_{1}) $将圆形直方图分成2个部分,记$ {\theta }_{t}=\frac{2\mathrm{\pi }t}{N} $$ t $点的角度。圆形直方图上2个部分的角均值的三角矩定义如下:

$ {C}_{0}({t}_{0}, {t}_{1})=\sum\limits _{}^{\mathrm{o}}{}_{t={t}_{0}}^{{t}_{1}-1}h\left(t\right)\mathrm{c}\mathrm{o}\mathrm{s}{\theta }_{t}\\ {C}_{1}({t}_{0}, {t}_{1})=\sum\limits _{}^{\mathrm{o}}{}_{t={t}_{1}}^{{t}_{0}-1}h\left(t\right)\mathrm{c}\mathrm{o}\mathrm{s}{\theta }_{t} $ (6)
$ {S}_{0}({t}_{0}, {t}_{1})=\sum\limits _{}^{\mathrm{o}}{}_{t={t}_{1}}^{{t}_{0}-1}h\left(t\right)\mathrm{s}\mathrm{i}\mathrm{n}{\theta }_{t}\\ {S}_{1}({t}_{0}, {t}_{1})=\sum\limits _{}^{\mathrm{o}}{}_{t={t}_{0}}^{{t}_{1}-1}h\left(t\right)\mathrm{s}\mathrm{i}\mathrm{n}{\theta }_{t} $ (7)

圆上2个部分的角均值$ {\mu }_{0}({t}_{0}, {t}_{1}) $$ {\mu }_{1}({t}_{0}, {t}_{1}) $定义为:

$ {\mu }_{i}({t}_{0}, {t}_{1})=\left\{\begin{array}{l}{\mu }_{i}^{\prime}({t}_{0}, {t}_{1}), {S}_{i}({t}_{0}, {t}_{1})\ge 0, {C}_{i}({t}_{0}, {t}_{1}) > 0\\ {\mu }_{i}^{\prime}({t}_{0}, {t}_{1})+\mathrm{\pi }, {C}_{i}({t}_{0}, {t}_{1}) < 0\\ {\mu }_{i}^{\prime}({t}_{0}, {t}_{1})+2\mathrm{\pi }, {S}_{i}({t}_{0}, {t}_{1}) < 0, {C}_{i}({t}_{0}, {t}_{1}) > 0\\ \mathrm{\pi }/2, {S}_{i}({t}_{0}, {t}_{1}) > 0, {C}_{i}({t}_{0}, {t}_{1})=0\\ 3\mathrm{\pi }/2, {S}_{i}({t}_{0}, {t}_{1}) < 0, {C}_{i}({t}_{0}, {t}_{1})=0\\ \mathrm{无}\mathrm{意}\mathrm{义}, {S}_{i}({t}_{0}, {t}_{1})=0, {C}_{i}({t}_{0}, {t}_{1})=0\end{array}\right.\\ i=\mathrm{0, 1} $ (8)

其中:$ {\mu }_{0}^{\prime}({t}_{0}, {t}_{1})=\mathrm{t}\mathrm{a}{\mathrm{n}}^{-1}\frac{{S}_{0}({t}_{0}, {t}_{1})}{{C}_{0}({t}_{0}, {t}_{1})} $$ {\mu }_{1}^{\prime}({t}_{0}, {t}_{1})=\mathrm{t}\mathrm{a}{\mathrm{n}}^{-1}\frac{{S}_{1}({t}_{0}, {t}_{1})}{{C}_{1}({t}_{0}, {t}_{1})} $

圆上2个部分的方差$ {\sigma }_{0}({t}_{0}, {t}_{1}) $$ {\sigma }_{1}({t}_{0}, {t}_{1}) $分别定义为:

$ {\sigma }_{0}({t}_{0}, {t}_{1})=1-{R}_{0}({t}_{0}, {t}_{1})\\ {\sigma }_{1}({t}_{0}, {t}_{1})=1-{R}_{1}({t}_{0}, {t}_{1}) $ (9)

其中:$ {R}_{0}({t}_{0}, {t}_{1})=\sqrt{{S}_{0}^{2}({t}_{0}, {t}_{1})+{C}_{0}^{2}({t}_{0}, {t}_{1})} $$ {R}_{1}({t}_{0}, {t}_{1})=\sqrt{{S}_{1}^{2}({t}_{0}, {t}_{1})+{C}_{1}^{2}({t}_{0}, {t}_{1})} $

模仿线性直方图的Otsu法[16, 19],LAI等[18]给出的2个阈值选取准则分别为:

$ {\sigma }_{W}^{2}({t}_{0}, {t}_{1})={P}_{0}({t}_{0}, {t}_{1}){\sigma }_{0}^{2}({t}_{0}, {t}_{1})+{P}_{1}({t}_{0}, {t}_{1}){\sigma }_{1}^{2}({t}_{0}, {t}_{1}) $ (10)
$ {\sigma }_{B}^{2}({t}_{0}, {t}_{1})={P}_{0}({t}_{0}, {t}_{1}){P}_{1}({t}_{0}, {t}_{1})\left({\mu }_{0}\right({t}_{0}, {t}_{1}\left)\mathrm{\Theta }{\mu }_{1}\right({t}_{0}, {t}_{1}{\left)\right)}^{2} $ (11)

其中:$ {\mu }_{0}\mathrm{\Theta }{\mu }_{1}=\mathrm{m}\mathrm{i}\mathrm{n}\left(\left|{\mu }_{0}-{\mu }_{1}\right|, 2\mathrm{\pi }-\left|{\mu }_{0}-{\mu }_{1}\right|\right) $。式(10)和式(11)在线性直方图情形下是等价的,但在圆形直方图情形下不等价[18]

最佳阈值$ ({t}_{0}^{\mathrm{*}}, {t}_{1}^{\mathrm{*}}) $通过最小化$ {\sigma }_{W}^{2}({t}_{0}, {t}_{1}) $或最大化$ {\sigma }_{B}^{2}({t}_{0}, {t}_{1}) $得到,即:

$ ({t}_{0}^{\mathrm{*}}, {t}_{1}^{\mathrm{*}})=\underset{{t}_{0}\prec {t}_{1}}{\mathrm{m}\mathrm{i}\mathrm{n}}\;{\sigma }_{W}^{2}({t}_{0}, {t}_{1})=\underset{{t}_{0}\prec {t}_{1}}{\mathrm{m}\mathrm{i}\mathrm{n}}\;{P}_{0}({t}_{0}, {t}_{1}){\sigma }_{0}^{2}({t}_{0}, {t}_{1})+\\ \;\;\;\;\;\;\;\;\;\;\;\;\;{P}_{1}({t}_{0}, {t}_{1}){\sigma }_{1}^{2}({t}_{0}, {t}_{1}) $ (12)
$ \begin{array}{l}({t}_{0}^{\mathrm{*}}, {t}_{1}^{\mathrm{*}})=\underset{{t}_{0}\prec {t}_{1}}{\mathrm{m}\mathrm{a}\mathrm{x}}\;{\sigma }_{B}^{2}({t}_{0}, {t}_{1})=\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\underset{{t}_{0}\prec {t}_{1}}{\mathrm{m}\mathrm{a}\mathrm{x}}\;{P}_{0}({t}_{0}, {t}_{1}){P}_{1}({t}_{0}, {t}_{1})\cdot \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\left({\mu }_{0}\right({t}_{0}, {t}_{1}\left)\mathrm{\Theta }{\mu }_{1}\right({t}_{0}, {t}_{1}{\left)\right)}^{2}\end{array} $ (13)

在线性直方图上,针对最大类间法的Otsu有3个等价描述[16, 19]。LAI等[18]给出上述2个阈值选取准则。作为对比,本文提出另一个阈值选取准则。圆形直方图的整体角均值的三角矩定义如下:

$ C=\sum\limits _{t=0}^{L-1}h\left(t\right)\mathrm{c}\mathrm{o}\mathrm{s}\;{\theta }_{t} \text{,} S=\sum\limits _{t=0}^{L-1}h\left(t\right)\mathrm{s}\mathrm{i}\mathrm{n}\;{\theta }_{t} $ (14)

整体角均值$ {\mu }_{L} $定义为:

$ {\mu }_{L}=\left\{\begin{array}{l}\mu^{\prime}, S\ge 0, C > 0\\ \mu^{\prime}+\mathrm{\pi }, C < 0\\ \mu^{\prime}+2\mathrm{\pi }, S < 0, C > 0\\ \mathrm{\pi }/2, S > 0, C=0\\ 3\mathrm{\pi }/2, S < 0, C=0\\ \mathrm{无}\mathrm{意}\mathrm{义}, S=0, C=0\end{array}\right. $ (15)

其中:$ \mu^{\prime}=\mathrm{t}\mathrm{a}{\mathrm{n}}^{-1}\frac{S}{C} $。参考线性直方图Otsu法的类间方差公式,可定义:

$ {\sigma }_{B^{\prime}}^{2}\left(t\right)={P}_{0}({t}_{0}, {t}_{1})\left({\mu }_{0}\right({t}_{0}, {t}_{1})\mathrm{\Theta }{\mu }_{L}{)}^{2}+\\ \;\;\;\;\;\;\;\;\;\;\;\;\;{P}_{1}({t}_{0}, {t}_{1}\left)\right({\mu }_{1}({t}_{0}, {t}_{1})\mathrm{\Theta }{\mu }_{L}{)}^{2} $ (16)

则本文新的阈值选取准则为:

$ ({t}_{0}^{\mathrm{*}}, {t}_{1}^{\mathrm{*}})=\underset{{t}_{0}\prec {t}_{1}}{\mathrm{m}\mathrm{a}\mathrm{x}}\;{\sigma }_{B^{\prime}}^{2}({t}_{0}, {t}_{1})=\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\underset{{t}_{0}\prec {t}_{1}}{\mathrm{m}\mathrm{a}\mathrm{x}}\;{P}_{0}({t}_{0}, {t}_{1})\left({\mu }_{0}\right({t}_{0}, {t}_{1})\mathrm{\Theta }{\mu }_{L}{)}^{2}+\\ \;\;\;\;\;\;\;\;\;\;\;\;\;{P}_{1}({t}_{0}, {t}_{1}\left)\right({\mu }_{1}({t}_{0}, {t}_{1})\mathrm{\Theta }{\mu }_{L}{)}^{2} $ (17)

圆形统计[20-22]与线性统计存在差异,因此,与LAI等[18]的讨论结果相同,式(17)与式(10)、式(11)并不等价。

3 实验结果与分析 3.1 指数加权值确定

图 2(a)是一幅实际采集的图片,图 2(b)图 2(a)在HSI空间下的图像,图 2(c)图 2(d)分别为图 2(a)的色调(H)、饱和度(S)通道。在检查色调(H)图像时,可以看到,对于低饱和度(黑色或白色)区域,色调(H)可以有一个很大范围的取值,这并不对应于彩色图像中任何显著的颜色差异。简单的H分量直方图只计算每个色调(H)值在色调通道中出现的次数,如图 3(a)所示。这个直方图最值得注意的特性是存在等间距的尖峰,这些峰值是由于在离散网格上使用极坐标系统引入的离散误差所造成的,KENDER[23]首先指出了这一点,它们的高度在包含大量灰度像素的图像中被放大。S分量指数加权H分量的直方图如图 3(b)~图 3(d)所示,可以看出,峰值的振幅大幅减少,且随着加权因子$ \alpha $的不断增大,峰值振幅下降幅度也增大,从而得到一个更容易解释的直方图。

Download:
图 2 车牌图 Fig. 2 License plate map
Download:
图 3 图 2(c)在不同指数$ \mathit{\alpha } $加权后的直方图 Fig. 3 Fig. 2(c) histogram after different index $ \mathit{\alpha } $ weighting

本文提取了色调(H)图像中像素数目最多的色调值,图 4中提取图 2(a)在155~165范围内的H分量值,可以看到,这些峰值对应图像中饱和程度最高的区域颜色,但是,这些峰值在简单的H分量直方图上并不容易识别。通过结合H阈值和S阈值,可以很容易地去除由这些阈值提取的附加背景像素。图 5显示利用圆形直方图上的最大熵法[12-14]对由不同指数加权因子得到的直方图进行阈值选取分割后的图像,可以看出,当加权因子$ \alpha =2 $时,分割出的车牌相较其他加权因子值时效果更优。

Download:
图 4 图 2(a)在155~165范围内的色调分量值 Fig. 4 Fig. 2(a) H-component values between 155 and 165
Download:
图 5 不同指数加权后的最大熵分割图 Fig. 5 Maximum entropy segmentation graph weighted by different indexes

图 3(a)~图 3(d)验证了利用S分量对H分量直方图进行加权处理后可以得到更平滑、更易于解释的直方图,有助于后续分割过程中对阈值进行选取。如何确定合适的加权因子值是应用的关键,为此,本文以1为加权因子值的临界点,对大于1(实验中只取到5)和0~1之间的不同加权因子值,以0.1为步长进行测试,从而得到最合适的加权因子值。经过对Berkeley等图像数据库中图片的大量测试后发现:在区间[0.1,0.8]范围内的饱和度加权色调直方图分割后的图像基本上没有变化,因此,不失一般性地,选取$ \alpha =0.5 $作为该区间范围内的代表值;在区间[0.9,1.8]范围内的饱和度加权色调直方图分割后的图像变化不大,因此,不失一般性地,选取$ \alpha =1 $作为该区间范围内的代表值;在区间[1.9,5.0]范围内的饱和度加权色调直方图分割后图像变化不大,因此,不失一般性地,选取$ \alpha =2 $作为该区间范围内的代表值。基于图 5实验以及对公开图像数据库的测试结果,本文最终将$ \alpha =2 $作为指数加权值。

3.2 圆形阈值法比较

为了测试本文所提方法的性能,在PC机上用MATLAB(2018版)在H组件上进行实验。在实验之前,先对H分量进行S分量指数加权预处理,然后比较LAI等[18]给出的式(12)、式(13)和本文提出的新阈值准则式(17),此外,还使用文献[12-14]中不同的圆形最大熵阈值法作为对比。其中:文献[12]通过在圆形直方图中引入累积分布函数,然后利用累积分布函数的最优熵,沿顺时针或逆时针方向将圆形直方图扩展为线性直方图;文献[13]将洛伦兹曲线引入圆形直方图,通过洛伦兹曲线的最佳索引,将圆形直方图沿顺时针或逆时针方向扩展成线性直方图,最后通过对线性化圆形直方图采用熵阈值得到彩色图像的目标;文献[14]是在圆形直方图上直接进行阈值选取,提出一种基于圆形直方图的最大熵阈值递归方法,使得在2类或多类阈值的圆形直方图上搜素最优阈值的运行时间大幅缩减,提高了分割效率。通过分析可以发现,本文所提方法与文献[12-13]方法的区别主要在于对H分量直方图的预处理和最佳阈值的选取方式上,本文通过式(17)选取最佳阈值对,而文献[12-13]先选取最佳断点将圆形直方图线性化后再利用阈值准则选取最佳阈值;本文所提方法与文献[14]方法的主要区别在于对H分量直方图的预处理以及圆上阈值对选取准则的不同,文献[14]主要针对圆上最大熵法的时间复杂度进行优化,而没有提升分割结果的其他评估指标。综上,本文方法的优势在于对H分量直方图的预处理,以及利用圆形统计提高圆形直方图阈值选取的一般性和适用性。

图 6所示为Berkeley图像数据库中的6幅RGB原图,图 7所示为图 6对应的H分量圆形直方图,图 8所示为图 6对应的指数加权因子$ \alpha =2 $时的S分量加权H分量圆形直方图,图 9中从左到右分别为利用式(12)、式(13)、文献[12-14]中的圆形最大熵阈值法以及式(17)所得的2类分割结果图,最后一列为基准分割结果。以基准分割图作为参考,通过对比可以看出,相较LAI等[18]给出的式(12)、式(13)以及圆形最大熵阈值法[12-14],本文提出的圆上阈值分割准则分割结果更好,目标区域更加明显,与基准图更为相近。

Download:
图 6 RGB原图 Fig. 6 RGB original images
Download:
图 7 图 6对应的H分量圆形直方图 Fig. 7 H-component circular histograms of the fig. 6
Download:
图 8 图 6对应的S分量加权H分量圆形直方图 Fig. 8 S-component weighted H-component circular histograms of the fig. 6
Download:
图 9 不同方法的分割结果对比 Fig. 9 Comparison of segmentation results of different methods

为了定量比较不同阈值分割准则的分割性能,使用图像分割质量评价指标[24-25]对分割效果进行评估。表 1所示为6种阈值化方法的所有分割结果的时间平均值(运行15次)、平均像素精度(PA)值[24]和平均结构相似度(SSIM)值[25]。从表 1可以看出,相较LAI等[18]给出的式(12)、式(13)以及文献[12-14]中的圆形最大熵阈值法,本文提出的新的阈值分割准则具有最高的PA值和SSIM值,更接近于基准图。对于PA和SSIM这2个指标,式(12)、式(13)可能存在分割色调值的问题,而本文方法可以修改式(12)、式(13)对色调的分割结果。

下载CSV 表 1 6种分割方法的性能对比结果 Table 1 Performance comparison results of six segmentation methods
4 结束语

H分量圆形直方图中存在较多毛刺,不利于阈值选取,为此,本文给出一种S分量指数加权H分量的直方图公式,并通过大量实验得出指数加权因子的最优取值,在此基础上,提出一种新的圆形直方图阈值分割法。该方法以S分量指数加权H分量的直方图作为预处理,将其与文献[12-14]所提圆形最大熵阈值分割法、文献[18]给出的2个圆形直方图阈值分割准则进行实验对比,结果表明,本文圆形直方图阈值分割法具有有效性。下一步将在本文方法的基础上将2类阈值扩展为多类阈值,以实现对多类复杂情景的目标分割。

参考文献
[1]
SHARMA N, MISHRA M, SHRIVASTAVA M. Colour image segmentation techniques and issues: an approach[J]. International Journal of Scientific & Technology Research, 2012, 1(4): 9-12.
[2]
GARCIA-LAMONT F, CERVANTES J, LÓPEZ A, et al. Segmentation of images by color features: a survey[J]. Neurocomputing, 2018, 292: 1-27. DOI:10.1016/j.neucom.2018.01.091
[3]
GOTHWAL R, GUPTA S, GUPTA D, et al. Color image segmentation algorithm based on RGB channels[C]//Proceedings of the 3rd International Conference on Reliability, Infocom Technologies and Optimization. Washington D. C., USA: IEEE Press, 2014: 1-5.
[4]
[5]
JAU U L, TEH C S, NG G W. A comparison of RGB and HSI color segmentation in real-time video images: a preliminary study on road sign detection[C]//Proceedings of International Symposium on Information Technology. Washington D. C., USA: IEEE Press, 2008: 1-6.
[6]
NOR HAZLYNA H, MASHOR M Y, MOKHTAR N R, et al. Comparison of acute leukemia image segmentation using HSI and RGB color space[C]//Proceedings of the 10th International Conference on Information Science, Signal Processing and Their Applications. Washington D. C., USA: IEEE Press, 2010: 749-752.
[7]
KUMAR N, THAKUR N, RANOUT N. Improved color image segmentation based on RGB and HIS[J]. International Journal of Engineering Development and Research, 2015, 3(2): 969-988.
[8]
BHOYAR K K, KAKDE O G. Color image segmentation based on JND color histogram[J]. International Journal of Image Processing, 2010, 3(6): 282-293.
[9]
LI Z Y, YU Z C, LIU W X, et al. Tongue image segmentation via color decomposition and thresholding[C]//Proceedings of the 4th International Conference on Information Science and Control Engineering. Washington D. C., USA: IEEE Press, 2017: 752-755.
[10]
邹彬, 潘志斌, 乔瑞萍, 等. 基于感知颜色特征、子图像分割和多重Bitmap的彩色图像检索方法[J]. 微电子学与计算机, 2011, 28(5): 4-10.
ZOU B, PAN Z B, QIAO R P, et al. Color image retrieval method based on perceptual color features, sub-image partition and multi-level Bitmap features[J]. Microelectronics & Computer, 2011, 28(5): 4-10. (in Chinese)
[11]
陈景伟. 基于内容的彩色图像检索理论与方法研究[D]. 大连: 辽宁师范大学, 2011.
CHEN J W. Theory and method research on content based color image retrieval[D]. Dalian: Liaoning Normal University, 2011. (in Chinese)
[12]
KANG C, WU C M, FAN J L. Entropy-based circular histogram thresholding for color image segmentation[J]. Signal, Image and Video Processing, 2021, 15(1): 129-138. DOI:10.1007/s11760-020-01723-2
[13]
KANG C, WU C M, FAN J L. Lorenz curve-based entropy thresholding on circular histogram[J]. IEEE Access, 2020, 8: 17025-17038. DOI:10.1109/ACCESS.2020.2964335
[14]
YANG G F, FAN J L, WANG D. Recursive algorithms of maximum entropy thresholding on circular histogram[J]. Mathematical Problems in Engineering, 2021, 5: 1-13.
[15]
HANBURY A. Circular statistics applied to colour images[J]. Computer Vision Winter Workshop, 2003, 91(1/2): 53-71.
[16]
OTSU N. A threshold selection method from gray-level histograms[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1979, 9(1): 62-66. DOI:10.1109/TSMC.1979.4310076
[17]
KAPUR J N, SAHOO P K, WONG A K C. A new method for gray-level picture thresholding using the entropy of the histogram[J]. Computer Vision, Graphics, and Image Processing, 1985, 29(3): 273-285. DOI:10.1016/0734-189X(85)90125-2
[18]
LAI Y K, ROSIN P L. Efficient circular thresholding[J]. IEEE Transactions on Image Processing, 2014, 23(3): 992-1001. DOI:10.1109/TIP.2013.2297014
[19]
范九伦. 灰度图像阈值分割法[M]. 北京: 科学出版社, 2019.
FAN J L. Gray image threshold segmentation methods[M]. Beijing: Science Press, 2019. (in Chinese)
[20]
GLIMM E. FISHER N I. Statistical analysis of circular data[M]. Cambridge, UK: Cambridge University Press, 1995.
[21]
MARDIA K V, JUPP P E. Directional statistics[M]. Hoboken, USA: John Wiley & Sons, Inc., 1999.
[22]
PEWSEY A,NEUHÄUSER M,RUXTON G D. Circular statistics in R [EB/OL]. [2021-09-05]. https://www.researchgate.net/publication/283866998_Circular_Statistics_in_R.
[23]
KENDER J R. Saturation, hue, and normalized color: calculation, digitization effects, and use[EB/OL]. [2021-09-05]. https://searchworks.stanford.edu/view/4588735.
[24]
FOODY G M. Status of land cover classification accuracy assessment[J]. Remote Sensing of Environment, 2002, 80(1): 185-201. DOI:10.1016/S0034-4257(01)00295-4
[25]
WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612. DOI:10.1109/TIP.2003.819861