发布时间: 2016-10-25
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.20161005
2016 | Volumn 21 | Number 10

图像处理和编码

模糊熵的区域合并和图割的快速矿岩分割

尹诗白¹, 王一斌², 李大鹏¹, 邓箴³, 王玥¹

1. 西南财经大学经济信息工程学院, 成都 611130;

2. 西北工业大学自动化学院, 西安 710072;

3. 宁夏大学信息工程学院, 银川 750021

收稿日期: 2016-03-21; 修回日期: 2016-05-24

基金项目: 国家自然科学基金项目（91218301，61502396）；西南财经大学中央高校基本科研业务费专项基金项目（JBK150503）；西南财经大学中央高校基本科研业务费青年教师成长项目（JBK160135）；宁夏自然科学基金项目（NZ15054）；互联网金融创新及监管四川省协同创新中心资助

第一作者简介: 尹诗白(1984-),女,讲师,硕士生导师,2013年于长安大学获交通信息工程及控制专业工学博士学位,研究方向为机器视觉、图像处理。E-mail:shibai.yin@gmail.com

中图法分类号: TP391.4

文献标识码: A

文章编号: 1006-8961(2016)10-1307-09

摘要

目的针对现有区域合并和图割的结合算法没有考虑矿岩图像模糊特性，导致分割精度和运行效率较低，模糊边缘无法有效分割的问题，利用快速递推计算的最大模糊2-划熵信息设置以区域为顶点的图割模型似然能来解决。方法首先利用双边滤波器和分水岭算法对矿岩图像进行预处理，并将其划分为若干一致性较好的区域；然后利用图像在计算最大模糊2-划分熵时，目标和背景的模糊隶属度函数来设计图割能量函数似然能，使得能量函数更接近模糊图像的真实情况，期间为了提高最大模糊2-划分熵值的搜索效率，提出了时间复杂度为O（n²）的递推算法将模糊熵的计算转化为递推过程，并保留不重复的递推结果用于后续的穷举搜索；最后利用设计的图割算法对区域进行标号，以完成分割。结果本文算法的分割精度较其他区域合并和图割结合算法提高了约23%，分割后矿岩颗粒个数的统计结果相对于人工统计结果，其误差率约为2%，运行时间较其他算法缩短了约60%。结论本文算法确保精度同时，有效提高矿岩图像的分割效率，为自动化矿岩图像高效分割的工程实践提供重要指导依据。

关键词

矿岩图像; 图像分割; 模糊划分熵; 递推算法; 图割

Fast rock particle segmentation based on region merging and graph cut of fuzzy entropy

Yin Shibai¹, Wang Yibin², Li Dapeng¹, Deng Zhen³, Wang Yue¹

1. School of Economic Information Engineering, Southwestern University of Finance and Economics, Chengdu 611130, China;

2. School of Automation, Northestern Polytechnical University, Xi'an 710072, China;

3. School of Information Engineering, Ningxia University, Yinchuan 750021, China

Supported by: National Natural Science Foundation of China (91218301, 61502396);Natural Science Foundation of Ninxia Province, China (NZ15054)

Abstract

Objective Low efficiency, low-segmentation precision, and invalid blurry-edge segmentation are due to disregarding fuzzy image features when combining region-merging and graph-cut (GC) algorithms. To solve these problems, we propose a method that uses information of maximum fuzzy two-partition entropy. The information is acquired by recursive computation to design the likelihood item of energy function in GC, in which the model is built based on the region as vertex. Method First, bilateral filter and watershed algorithm are used to pre-process the image to oversegment the input image into small regions. Second, based on maximum fuzzy 2-partition entropy of rock particle, corresponding membership functions can be used for setting the GC likelihood item. This way, more real energy functions can be acquired. Meanwhile, to improve the efficiency search of maximum fuzzy 2-partition entropy, a recursive algorithm with time complexity O(n²) is presented to convert the fuzzy entropy computation to a recursive process; and non-repetitive results of processing moments are stored for the succeeding exhaustive optimization. Finally, designed-region merging and GC are used to assign region labels and complete segmentation. Results Experimental results indicate that the segmentation precision of the proposed algorithm improves by about 23%, and running time is 60% shorter than those of compared region-merging and GC algorithms. Relative error of our statistical results is 2%, with respect to those of artificial statistical results. Conclusion Our proposed method can improve segmentation efficiency while ensuring segmentation precision. The results provide an important reference for engineering practice of automatic and efficient rock particle segmentation.

Key words

rock particle image; image segmentation; fuzzy partition entropy; recursive algorithm; graph cut

0 引言

目前机器视觉技术在建筑工程领域的应用越来越广，它能代替人类视觉建立一个工业生产线上的计算机视觉测量系统，加快生产自动化的步伐。通常的做法是将取像系统安装在传输带的上方或是传输带的下方，采集传输带上传送或降落的矿岩颗粒图像，实时分割并统计颗粒的尺寸和形状等信息，自动地评估爆破的矿岩颗粒质量^[1]。其中图像分割是机器视觉技术的关键，它直接影响后续的统计结果，然而传输带上采集的图像受高粉尘，光照不一的影响，具有噪声严重，目标和背景灰度交叉重叠，对比度低的模糊特性，且传输带上平铺或降落的矿岩颗粒虽没有颗粒遮挡或重叠情况，但仍然有个别颗粒边缘轻微碰触的问题，因而如何快速地分割颗粒目标是一项具有挑战性的工作。

区域合并和图割（GC）相结合算法是目前分割矿岩颗粒图像的一类有效方法^[2-3]，该算法能利用分水岭算法将图像划分若干一致性较好的区域，再利用图论原理计算区域的空间约束信息，最后通过图割算法对区域进行标号，合并区域完成分割。算法的核心在于构造一个能量函数，并映射为加权图，再利用网络流理论将区域的标号问题转化为对应加权图的最大流/最小割问题^[4]。其中构建能够体现矿岩图像模糊特性的能量函数是算法的关键，Gong等人^[5]仅将区域的灰度值与已知的目标和背景模型相对比，就用于计算图割中能量函数的似然能，没有考虑图像的模糊特性，对比度低的模糊边缘分割效果较差，无法分割边缘碰触的粘连矿岩。Gracias^[6]和王开义^[7]等人针对实际应用中区域似然能不一致的情况，改进图割的似然能函数使其在全局上具有一致性，从而提高分割精度，但该算法的改进策略没有从图像本身的模糊特性出发，对于噪声较大的模糊图像来说，难以取得满意的分割结果。另一方面，Zhou等人^[8]另辟蹊径，提出了基于模糊理论的区域合并算法，它利用模糊C-均值聚类算法设计区域间的模糊灰度关系，通过模糊关系来进行区域合并。该算法虽充分考虑了区域间的模糊灰度信息，但相比于区域合并和图割算法而言，忽略了区域间的空间位置信息，分割精度不高，且聚类算法效率较低，无法应用于自动化矿岩图像高效分割。

受此启发，本文提出了一种基于模糊熵的区域合并和图割算法，可快速实现矿岩图像分割。主要思路是利用分水岭算法将矿岩图像划分成若干一致性较好的区域，然后利用图像在最大模糊2-划分时目标和背景的模糊隶属度函数来设计以区域为顶点的图割似然能，以实施图割。其中模糊2-划分熵算法^[9]是通过搜索图像的最大模糊熵值来确定划分目标和背景阈值的方法，它充分考虑了模糊图像中目标和背景灰度交叉重叠的模糊特性，本文将模糊2-划分熵算法的灰度级信息和图割算法的空间相关性信息相结合，不但考虑了目标和背景的灰度接近程度还考虑了空间相关性，使得图割的似然能更接近矿岩图像真实的模糊特性，从而有效地分割模糊区域。为提高算法效率，最大模糊熵值的搜索是关键，它直接决定着模糊2-划分时目标和背景隶属度函数的形状及算法效率。目前常用的搜索策略是种群寻优算法，如遗传算法^[10]、人工蜂群算法^[11]等，虽具有较好的搜索能力，但种群的个体适应度存在重复的计算，且随着搜索参数的增加，计算量呈指数上涨。Tang等人^[12]进一步提出的递推模糊2-划分熵算法，保存模糊熵计算时的瞬间递推值用于后续的种群寻优，减少了个体适应度的重复计算，大幅度提高搜索效率，但递推项之间存在嵌套循环，时间复杂度为O(n³)，无法应用于矿岩图像的实时处理。为此，本文采用递推项独立的递推方式，提出时间复杂度为O(n²)的模糊熵递推算法来解决问题。

综上，为了实现矿岩图像的有效分割，提出了快速模糊熵的区域合并和图割算法。其主要贡献包含两点：其一是利用矿岩图像在最大模糊2-划分时的隶属度函数来设置以区域为顶点的图割能量函数似然能，将区域间的灰度信息和空间信息相结合，充分考虑了图像的模糊特性，提高了分割精度；其二是提出了一种时间复杂度为O(n²)的递推模糊2-划分熵计算方法，应用于最大模糊2-划分熵搜索，有效地提高了运算效率。

1 基本思路

结合模糊划分熵的灰度级信息和图割的空间相关性信息，提出了一种基于模糊熵的区域合并和图割算法，该算法利用图像在模糊2-划分时目标和背景的隶属度函数来设计图割能量函数的似然能，使能量函数接近真实情况，有效地提高分割精度。

图 1为算法流程图。以矿岩图像为输入，主要包括矿岩图像的预处理、矿岩图像模糊熵的区域合并和图割算法两个部分。

图 1 算法流程图

Fig. 1 Algorithm flow chart

各步骤的概要说明如下：

1) 矿岩图像预处理。在图像的预处理阶段，考虑到矿岩图像具有噪声严重，边缘模糊等特性，利用双边滤波器^[13]对矿岩图像进行增强处理，达到保持边缘去除噪声的目的，随后利用分水岭分割^[14]将其划分若干一致性较好的区域，以此映射为后续以区域为顶点的图割模型加权图。

2) 矿岩图像模糊熵的区域合并和图割。为充分考虑图像的模糊特性，设计合理的模糊熵图割的似然能，利用最大模糊2-划分时目标和背景的隶属度函数来设计能量函数似然能，使其更接近矿岩图像的模糊特性，提高分割精度。期间为了快速搜索图像的最大模糊2-划分熵值，还提出复杂度为O(n²)的递推算法将模糊熵的计算转化为递推过程，并保留不重复的递推结果，用于最大熵值穷举搜索。

2 基于模糊熵的区域合并和图割的快速矿岩图像分割

2.1 矿岩图像预处理

受粉尘，光照，周围环境的影响，传输带上采集的矿岩图像存在噪声严重，对比度低，目标和背景灰度交叉重叠，颗粒边缘轻微碰触等模糊等问题，需对图像进行增强处理。双波滤波器作为一种非线性滤波器，不但结合空域信息和灰度信息，还对像素进行非线性组合以处理邻域像素，保持矿岩图像边缘的同时又去除噪声，双边滤波器为

$f(q)=\frac{1}{{{w}_{\operatorname{H}}}}\sum\limits_{p\in \Omega }{{{w}_{s}}}(p){{w}_{r}}(p)I(p)$

(1)

p和q为像素点；f为滤波后的矿岩图像；w_H为归一化的参数；Ω为像素点q处的邻域范围；w_s(p)为点空间权重；w_r(p)为p点值域权重，即

${{w}_{s}}(p)=\exp \left[ \frac{{{\left\| p-q \right\|}^{2}}}{2\sigma _{s}^{2}} \right]$

(2)

${{w}_{r}}(p)=\exp \left[ -\frac{{{\left\| I(p)-I(q) \right\|}^{2}}}{2\sigma _{r}^{2}} \right]$

(3)

${{w}_{H}}=\sum\limits_{p\in \Omega }{{{w}_{s}}(p){{w}_{r}}(p)}$

(4)

式中，I(p)为p点像素值，σ_s和σ_r分别是空间方差和灰度方差。

本文通过大量实验验证，设置滤波器邻域窗口大小为5，σ_s为3，σ_r为0.1。随后计算滤波图像的梯度，并在此基础上实施3×3结构元的形态学开闭操作减少噪声。最后实施标准的分水岭算法^[14]，将图像划分为若干一致性较好的区域，并利用区域构建图割模型。

2.2 矿岩图像模糊熵的区域合并和图割

2.2.1 矿岩图像最大模糊2-划分熵的快速递推计算

为了充分考虑图像的模糊特性，利用矿岩图像在模糊2-划分时目标和背景的模糊隶属度函数来设计图割模型中能量函数的似然能，使其更接近模糊图像的真实情况。首先将需计算最大模糊2-划分熵图像的灰度直方图信息映射到模糊域中，由于矿岩图像的目标和背景具有灰度分布不均匀、边缘模糊、对比度较低的模糊特性，选择带有3个参数的S函数及其反函数来分别定义目标和背景模糊子集^[15]D_o，D_b的隶属度函数M_o，M_b利用S函数定义M_o函数，

${{M}_{o}}(k,u,v,w)=\left\{ \begin{matrix} 1 & k\le u \\ 1-\frac{{{(k-u)}^{2}}}{(w-u)\times (v-u)} & u\le k\le v \\ \frac{{{(k-w)}^{2}}}{(w-u)\times (w-v)} & v＜k\le w \\ 0 & k>w \\ \end{matrix} \right.$

(5)

则M_b=1-M_o。式中，k为矿岩图像各像素的灰度级；u、v、w为决定隶属度函数形状的参数变量，且满足模糊集合D_o和D_b的划分概率T_o，T_b为

$\left\{ \begin{align} & {{T}_{o}}=\sum\limits_{k=0}^{255}{h(k)}\times {{M}_{o}}(k,u,v,w) \\ & {{T}_{b}}=\sum\limits_{k=0}^{255}{h(k)}\times {{M}_{b}}(k,u,v,w) \\ \end{align} \right.$

(6)

式中，h(k)=n_k/(M×N),k=0,1,…,255，n_k为矿岩图像中灰度级为k的像素个数，M×N为矿岩图像的大小。基于T_o，T_b划分的矿岩图像总模糊熵

$H(u,v,w)=-{{T}_{o}}\log ({{T}_{o}})-{{T}_{b}}\log ({{T}_{b}})$

(7)

由式(6)可知，T_o为矿岩图像灰度级k取0到255时，灰度概率h(k)值由已知矿岩图像的灰度概率分布确定，而隶属度函数M_o(k,u,v,w)的值则由形状参量u、v、w决定，故T_o的取值大小仅受形状参量u、v、w取值而变化。由于M_b(k,u,v,w)是M_o(k,u,v,w)的反函数，由式（6）同理可知T_b的取值也只受形状参量u、v、w影响。根据经典模糊划分熵分割理论^[15]，构建图像模糊熵的隶属度函数M_o和M_b，其形状参量u、v、w均需满足的限制条件，因此要获得H的最大值，只用穷举搜索u、v、w在限制条件下T_o和T_b值，并计算此时式(7) 的值,确定出使H最大T_o和T_b的值及其对应的M_o和M_b，M_o和M_b为矿岩图像模糊2-划分时D_o和D_b的隶属度函数分布，利用该函可设计图割能量函数的似然能。

然而搜索最大H值并不是一个简单的工作，常用的种群寻优策略^[11]，虽具有较好的搜索性能，但不能避免参数组合(u，v，w)从(0，1，2) 到(253，254，255) 的重复计算，已有的递推算法^[12]虽保存了模糊熵计算时的瞬间递推值用于后续的搜索操作，减少了重复计算，但由于递推项的嵌套递推方式，时间复杂度为O(n³)，为此本文将模糊熵的计算转化为3个求和项，且各项的递推过程相互独立，时间复杂度仅为O(n²)，递推过程如下：

首先将式(5) 的M_o带入式(6) 中的T_o得到

$\begin{align} & {{T}_{o}}=\frac{1}{(u-v)(u-w)}\sum\limits_{k=v+1}^{w}{{{(k-w)}^{2}}}h(k)- \\ & \frac{1}{(w-u)(v-u)}\sum\limits_{k=u+1}^{v}{{{(k-u)}^{2}}h(k)+\sum\limits_{k=0}^{v}{h(k)}} \\ \end{align}$

(8)

同理将式(5) 的反函数M_b带入式(6) 中的T_b得到

$\begin{align} & {{T}_{b}}=\frac{1}{(w-u)(v-u)}\sum\limits_{k=u+1}^{v}{{{(k-u)}^{2}}}h(k)- \\ & \frac{1}{(w-u)(w-v)}\sum\limits_{k=v+1}^{w}{{{(k-w)}^{2}}h(k)+\sum\limits_{k=v+1}^{255}{h(k)}} \\ \end{align}$

(9)

T_o和T_b中包含3个相同求和项，令$Q(u,v)=\sum\limits_{k=u\text{+}1}^{v}{{{(k-u)}^{2}}h(k)}$，$S(u,v)=\sum\limits_{k=u}^{v}{h(k)}$，$R(u,v)=\sum\limits_{k=u+1}^{v}{{{(k-v)}^{2}}h(k)}$则T_o和T_b表示为

${{T}_{o}}=\frac{R(v,w)}{(u-v)(u-w)}-\frac{Q(u,v)}{(w-u)(w-u)}+S(0,v)$

(10)

${{T}_{b}}=\frac{Q(u,v)}{(w-u)(v-u)}-\frac{R(v,w)}{(w-u)(w-v)}+S(v+1,255)$

(11)

对Q(u,v)、R(u,v)、S(u,v)分别进行递推计算，并保留瞬间的递推值用于最大熵H的穷举搜索，能大大减少时间复杂度，提高运算效率。对于Q(u,v)，其递推计算随变量v而变化，可表示为

$\begin{align} & Q(u,v)=\sum\limits_{k=u+1}^{v}{{{(k-u)}^{2}}}h(k)=\sum\limits_{k=u+1}^{v-1}{(}k-u{{)}^{2}}h(k)+ \\ & {{(v-u)}^{2}}h(v)=Q(u,v-1)+{{(v-u)}^{2}}h(v) \\ \end{align}$

(12)

故递推计算公式为

$\left\{ \begin{align} & Q(u,v)=Q(u,v-1)+{{(v-u)}^{2}}h(v) \\ & Q(u,u+1)=h(u+1),v=u+2,\cdots ,255 \\ \end{align} \right.$

(13)

同理的递推计算随变量u变化，即

$\begin{align} & G(u,v)=\sum\limits_{k=u+1}^{v}{{{(k-u)}^{2}}}h(k)=\sum\limits_{k=(u+1)+1}^{v}{(}k-v{{)}^{2}}h(k)+ \\ & {{(u-v+1)}^{2}}h(u+1)=G(u+1,v)+{{(u-v+1)}^{2}}h(u+1) \\ \end{align}$

(14)

递推公式为

$\left\{ \begin{align} & G(u,v)=G(u+1,v)+{{(u-v+1)}^{2}}h(u+1) \\ & G(v-1,v)=0,u=0,\cdots ,v-2 \\ \end{align} \right.$

(15)

S(u,v)递推公式为

$S(u,v)=\sum\limits_{k=u}^{v}{h(k)=S(u,v-1)+h(v)}$

(16)

Q(u,v)、R(u,v)、S(u,v)的递推过程相互独立，存储所有的瞬间递推值，用于后续的穷举搜索，以确定参数组合(u，v，w)从(0，1，2) 到(253，254，255) 变化下最大熵值H，即获得矿岩图像模糊2-划分时目标和背景的隶属度函数M_o和M_b。

2.2.2 最大熵信息的模糊图割设计和实施

获得矿岩图像模糊2-划分时的隶属度函数就可以进一步设置以区域为顶点的图割能量函数，由经典图割算法^[2]，能量函数E设计为

$E=\lambda B({{l}_{R}})+F({{l}_{R}},{{l}_{R'}})$

(17)

式中，B(l_R)为似然能即数据项，表示分水岭预分割后矿岩图像区域R标记为l_R的代价，强调数据的一致性；F(l_R,l_R′)为先验能即平滑项，表示相邻区域R和R′标记为l_R,l_R′的代价，强调解的平滑性；标号l_R值为目标“o”或背景“b”；λ是似然能与先验能间的重要因子，决定各项对能量函数影响，默认为1。

为了使图割能量函数的设计更接近矿岩图像的模糊特性，采用2.2.1节中获得的M_o和M_b的隶属度函数来设置能量函数的似然能，即

$\left\{ \begin{align} & B({{l}_{R}}=''o'')=-\log \sum\limits_{k=0}^{255}{{{h}_{R}}(k){{M}_{o}}} \\ & B({{l}_{R}}=''b'')=-\log \sum\limits_{k=0}^{255}{{{h}_{R}}(k){{M}_{b}}} \\ \end{align} \right.$

(18)

l_R是区域R的标号；h_R(k)是区域R内像素灰度的归一化直方图。

为了确保区域的平滑性，F(l_R,l_R′)的设置利用Boykov在文献^[2]中图割能量函数先验能的定义为

$\left\{ \begin{align} & F({{l}_{R}},{{l}_{R'}})=\delta ({{l}_{R}},{{l}_{R'}})\times \frac{(\exp (-\frac{{{(I(R)-I(R'))}^{2}}}{2{{\varphi }^{2}}})}{\left\| R-R' \right\|} \\ & \delta ({{l}_{R}},{{l}_{R'}})=1,{{l}_{R}}\ne {{l}_{R'}};\delta ({{l}_{R}},{{l}_{R'}})=0,{{l}_{R}}={{l}_{R'}} \\ \end{align} \right.$

(19)

式中，I(R)和I(R′)是相邻的区域R和R′的平均灰度值；R－R′是区域R和区域R′的灰度欧氏距离；参数φ为归一化因子，用来衡量相似灰度区域之间的不连续性惩罚。φ取值范围为[0,1]，本文默认为0.9；δ(l_R,l_R′)衡量区域R的标号l_R和区域R′的标号l_R′是否相等，相等为0否则为1。

将式(17)的能量函数映射为对应的加权图，同时也是将矿岩图像映射为一个具有双极点加权图的过程，该图包含一系列的节点和连接它们的权值边，节点对应于分水岭分割后的区域和称作为极点的附加点：源极点source，汇极点sin k。另外，权值边有两种类型：n-link和t-link。其中n-link连接相邻的区域，对应能量函数式(18)中的λB(l_R)；而t-link连接区域与极点，对应能量函数式(19)的F(l_R,l_R′)，边权值设置如表 1所示。

表 1 图割模型边的权值
Table 1 The weights of edges in the GC model

下载CSV

边	权值	节点
n-link∶{R,R′}	F(l_R,l_R′)	R,R′
	λB(l_R="o")	R∉seed_o
t-link∶{R,source}	+∞	R∈seed_o
	0	R∈seed_b
	λB(l_R="b")	R∉seed_o
t-link∶{R,sin k}	0	R∈seed_o
	+∞	R∈seed_b

这里为了能更好的引导图割的分割方向，我们选取分水岭划分后区域灰度方差小于10，且区域内的像素在最大模糊2-划分后，属于同一模糊子集D_o或D_b的区域分别对应的目标种子点seed_o和背景种子点seed_b。这样能量函数就被映射成了加权图，再利用网络流的最大流/最小割原理^[4]，对加权图进行全局最小割运算实现能量函数最小化，进而实现矿岩图像分割。

3 实验结果与分析

为了验证模糊熵的区域合并和图割算法性能，选用了传输带上运输的岩石和矿石图像及传输带下降落的金刚石图像进行不同分割算法结果对比。

所有算法均在2.3 GHz CPU，8 G内存的条件下，使用Matlab R2014a编程实现。图像分割效果分别采用视觉评价和量化指标来衡量。视觉评价衡量算法是否正确地分割出目标区域，并抑制背景区域对目标区域的误导。量化指标包括：

1) 运行时间。时间越短，算法效率越高。

2) F (F-measure)。由Gong提出的无参数分割测量标准，能充分地对错分区域加大惩罚，对分割精度的测量准确度逼近视觉结果^[16]。F值越小，分割效果越好。F为

$F=\frac{{{10}^{-6}}\sqrt{C}}{M\times N}\times \sum\limits_{R=1}^{C}{\frac{\left\| R-\overset{\hat{\ }}{\mathop{R}}\, \right\|}{\sqrt{{{A}_{R}}}}}\sqrt{2}$

(20)

式中，C是矿岩图像分割后联通区域个数；A_R是区域R的面积;$\overset{\hat{\ }}{\mathop{R}}\,$是区域R分割后的对应区域，$\left\| R-\overset{\hat{\ }}{\mathop{R}}\, \right\|$是R与$\overset{\hat{\ }}{\mathop{R}}\,$的灰度欧氏距离。

3) 峰值信噪比（PSNR）。基于误差敏感的图像分割质量评价标准。PSNR越大分割精度越高。

$PSNR=20\log (\frac{255}{MSE})$

(21)

式中，MSE(mean square error)是分割前矿岩图像和分割后矿岩图像的灰度均方误差，其为

$MSE=\sqrt{\sum\limits_{i=1}^{M}{\sum\limits_{j=1}^{N}{\frac{{{(I(i,j)-\overset{\hat{\ }}{\mathop{I}}\,(i,j))}^{2}}}{M\times N}}}}$

(22)

式中，I(i,j)和$\hat{I}(i,j)$分别为矿岩图像分割前后i行j列处对应的像素灰度值。

4) 颗粒计数的相对误差RE (relative error)。

反映了矿岩图像分割后颗粒目标的个数与图像中真实颗粒目标个数的相对误差率。相对误差越低，越能有效分割边缘碰触的颗粒，定义为

$RE=\frac{\left| {{C}_{h}}-{{C}_{a}} \right|}{\left| {{C}_{a}} \right|}$

(23)

式中，C_h是图像中的真实颗粒个数，由人工识别的方法来获得，本文选取的岩石图像、矿石图像、金刚石图像的C_h值分别为52、186、82。C_a是本文算法分割后自动统计的颗粒目标个数。

3.1 与其他区域合并和图割算法的分割结果对比

为了验证本文算法的有效性，选取了文献^[5-6]提出结合区域合并和图割的颗粒分割算法与本文算法结果进行对比。其中文献^[5]结合多尺度分析和图割算法对岩石颗粒图像进行分割，相比于传统的最小生成树算法和聚类法、基于先验知识的轮廓提取法，有效地提高了分割精度。文献^[6]针对图割算法，从区域全局一致性的角度改进其能量函数的似然能，对低对比度的模糊边缘有较好的分割效果。由于两类方法都是区域合并和图割的结合算法，为公平起见，区域的划分策略采用2.1节中提出的预处理方案，图割算法参数与本文一致，λ=1，φ=0.9，图割模型边权值与文献中设置一致。各算法视觉分割的结果，本文算法双边滤波器结果及分水岭预分割结果如图 2。

图 2 不同区域合并和图割算法对比

Fig. 2 Comparison of different region merging and GC methods ( (a) original images; (b) result of bilateral filter; (c) result of watershed algorithm ; (d) our result; (e) result of reference^[5]; (f) result of reference^[6])

从图 2可见，文献^[5]方法对目标和背景灰度重叠的区域产生误分及欠分割，它不但将部分背景误分为目标，还存在严重的颗粒粘连现象，如图 2(e)中对应的岩石图像分割结果，矩形框显示标出的区域，部分岩石颗粒被误分为背景。图 2(e)对应的矿石和金刚石图像分割结果中，矩形框标出的区域中也可看出该算法不能对边缘模糊的矿岩颗粒准确分割，造成目标粘连严重，这主要是由于文献^[5]的方法采用固定参数设置图割能量函数的似然能，没有考虑不同背景下矿岩图像目标和背景灰度交叉的模糊特性，导致误分。

文献^[6]的方法虽能改进图割似然能的条件概率，有效地分离边缘模糊的矿岩，但仍存在误分，从图 2(f)可见，相比于文献^[5]的分割结果图 2(e)，矿岩颗粒目标相互粘连的情况明显减少，但仍有矿岩目标被误分为背景，如岩石图像分割结果中矩形框标出的区域，矿石图像分割结果中矩形框标出的区域丢失矿岩目标，金刚石分割结果中矩形框标出的矿岩颗粒中间存在明显的空洞，从而导致目标区域不完整。这是由于文献^[6]中图割似然能的改进策略主要着眼于全局一致性，虽能有效分割边缘模糊的区域，但因没有考虑到目标区域的灰度与背景灰度交叉重叠的模糊特性，导致目标被误分为背景。相比而言，本文算法能将颗粒目标从背景中有效地分割出来，如图 2(d)所示，不但模糊边缘部分有效分割，矿岩颗粒也分割完整。

表 2中相应的列出了上述算法的F，PSNR，C_a，RE值，其中本文算法测得的C_a分别为51、182、80接近C_h人工统计结果52、186、82，误分率RE最低，约为2%左右，而文献^[5]和文献^[6]的算法得到的C_a均小于各图像对应的C_h。此外，表 2中本算法的F值最低，较文献^[5]的F结果降低了约23%，较文献^[6]的F结果降低了约27%。F值越低图割结果越好，分割精度越高。同时，本文算法结果具有最高PSNR值，较文献^[5]和文献^[6]的PSNR值提高了约10%和4%。综上表明，本文算法较其他基于区域合并和图割算法而言，具有更较高的分割精度，这主要是由于本文算法利用矿岩图像在最大模糊2-划分时的隶属度函数来设置以区域为顶点的图割能量函数的似然能，将区域间的灰度信息和空间信息相结合，充分考虑了图像的模糊特性。

表 2 不同区域合并和图割算法的F，PSNR和RE值对比
Table 2 Comparison of F,PSNR,RE values by different region merging and GC methods

下载CSV

图像	文献^[5]				文献^[6]				本文
图像	F	PSNR/dB	C_a	RE/%	F	PSNR/dB	C_a	RE/%	F	PSNR/dB	C_a	RE/%
岩石	8.487	27.156	44	15.3	9.626	28.601	53	1.92	7.786	29.681	51	1.92
矿石	11.124	26.837	149	19.8	12.647	28.647	158	15.0	8.079	30.342	182	2.15
金刚石	10.854	28.982	68	17.1	9.663	27.570	77	6.10	6.289	29.219	80	2.43

3.2 与其他区域合并和图割算法的运行时间对比

为验证本文算法的效率，将本文算法的运行时间与其他区域合并和图割算法的运行时间相对比，如表 3所示，相比于文献^[5]和文献^[6]而言，本文算法的运行时间缩短了约70%和60%，且针对不同的矿岩颗粒图像，本文算法的运行时间仅差10^-2个数量级，具有较高的分割效率。这主要是由算法的时间复杂度决定，算法共包括二个部分：第1部分是矿岩图像的预处理，其运行时间由图像的双边滤波器增强和分水岭预分割两部分时间构成，由于这两种算法较成熟，目前已广泛应用于图像处理的实际工程中，运行时间约0.2秒；第2部分是模糊熵图割实施，其运行时间主要是矿岩图像的最大模糊2-划分熵的搜索及图割模型的求解时间。为提高最大模糊熵的搜索效率，本文提出的递推策略将最大模糊熵的计算转换为带有2个参数的3个独立求和项的递推过程，各求和项的递推过程均为2重循环，故时间复杂度为O(n²)，运行时间约为0.4 s。随后利用高效的最大流/最小割算法实时地对图割模型求解，时间约0.2 s。

表 3 不同算法的运行时间比较
Table 3 Comparison of running time by different methods

下载CSV

图像	运行时间/s			模糊熵搜索时间/s
图像	文献^[5]	文献^[6]	本文	文献^[12]	本文
岩石	3.532	2.327	0.945	0.832	0.482
矿石	2.490	2.532	0.918	0.911	0.526
金刚石	3.781	2.639	0.831	0.875	0.459

为验证本文递推策略的高效性，针对不同的矿岩图像，在最大模糊熵寻优环节，选用时间复杂度为O(n³)的最大模糊熵递推搜索算法^[12]与本文递推策略时间相对比，如表 3所示，本文递推策略的优势较为明显，仅为文献^[12]运行时间的50%，充分说明，本文的递推策略具有较高的搜索效率，可确保模糊熵的区域合并和图割算法高效实施。

3.3 更多矿岩图像的分割结果验证

为了进一步验证本文算法的优越性，课题组从已有矿岩图像中选取了100幅传输带上运输或降落的矿岩图像进行分割测试，图 3给出了不同算法的F值和本文算法的运行时间曲线，可见本文算法的F值最小，约为7左右，而文献^[5]和文献^[6]的F值约为10和11左右，F值越小，分割精度越高，且本文算法运行时间稳定，约为0.8 s左右。

图 3 不同算法分割结果F值和运行时间曲线

Fig. 3 The F values of segmentation results and running time curves of different methods

4 结论

针对现有区域合并和图割的结合算法没有考虑矿岩图像模糊特性，导致分割精度和运行效率较低，边缘模糊的区域无法有效分割的问题，提出了基于模糊熵的区域合并和图割的快速矿岩图像分割算法。该算法首先利用双边滤波器将矿岩图像增强，并用分水岭算法将其划分为若干一致性较好的区域，然后用基于模糊熵的区域合并和图割算法对分水岭划分的区域进行标号，以完成分割。与常用的区域合并和图割结合算法相比，测量指标F值至少降低了23%，PSNR至少提高了4%，运行时间缩短了60%，确保精度的同时，有效地提高了分割效率。但本文算法目前只适用于传输带上平铺或降落的矿岩颗粒图像分割，这类图像颗粒间重叠遮挡的情况较少，对于矿场矿岩堆中采集的图像，即当颗粒重叠严重及障碍物遮挡明显，本文算法并不完全适用，今后将对该类图像的分割做进一步研究。

参考文献

[1] Gui W H, Yang C H, Xu D G, et al. Machine-vision-based online measuring and controlling technologies for mineral flotation-a review[J]. Acta Automatica Sinica , 2013, 39 (11) : 1879–1888. [ 桂卫华, 阳春华, 徐德刚, 等. 基于机器视觉的矿物浮选过程监控技术研究进展[J]. 自动化学报 , 2013, 39 (11) : 1879–1888. DOI:10.3724/SP.J.1004.2013.01879 ]

[2] Boykov Y, Veksler O, Zabih R. Fast approximate energy minimization via graph cuts[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence , 2001, 23 (11) : 1222–1239. DOI:10.1109/34.969114]

[3] Peng B, Zhang L, Zhang D, et al. Image segmentation by iterated region merging with localized graph cuts[J]. Pattern Recognition , 2011, 44 (10-11) : 2527–2538. DOI:10.1016/j.patcog.2011.03.024]

[4] Boykov Y, Kolmogorov V. An experimental comparison of min-cut/max-flow algorithms for energy minimization in vision[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence , 2004, 26 (9) : 1124–1137. DOI:10.1109/TPAMI.2004.60]

[5] Gong X J, Liu J L. Rock detection via superpixel graph cuts[C]//Proceedings of the 19th IEEE International Conference on Image Processing. Orlando, FL: IEEE, 2012: 2149-2152.[DOI: 10.1109/ICIP.2012.6467318]

[6] Gracias N, Mahoor M, Negahdaripour S, et al. Fast image blending using watersheds and graph cuts[J]. Image and Vision Computing , 2009, 27 (5) : 597–607. DOI:10.1016/j.imavis.2008.04.014]

[7] Wang K Y, Zhang S F, Yang F, et al. Online segmentation of clustering diced-potatoes using watershed and improved MRF algorithm[J]. Transactions of the Chinese Society for Agricultural Machinery , 2013, 44 (9) : 187–192. [ 王开义, 张水发, 杨锋, 等. 基于分水岭和改进MRF的马铃薯丁粘连图像在线分割[J]. 农业机械学报 , 2013, 44 (9) : 187–192. DOI:10.6041/j.issn.1000-1298.2013.09.033 ]

[8] Zhou K J, Yang C H, Gui W H, et al. Clustering-driven watershed adaptive segmentation of bubble image[J]. Journal of Central South University of Technology , 2010, 17 (5) : 1049–1057. DOI:10.1007/s11771-010-0597-y]

[9] Avci E, Avci D. An expert system based on fuzzy entropy for automatic threshold selection in image processing[J]. Expert Systems with Applications , 2009, 36 (2) : 3077–3085. DOI:10.1016/j.eswa.2008.01.027]

[10] Zheng Y, Zheng P. Dual thresholding method using fuzzy entropy and genetic algorithm[J]. Journal of Applied Sciences , 2014, 32 (4) : 427–433. [ 郑毅, 郑苹. 结合模糊熵和遗传算法的双阈值图像分割[J]. 应用科学学报 , 2014, 32 (4) : 427–433. DOI:10.3969/j.issn.0255-8297.2014.04.014 ]

[11] Liu S Y, Zhang P, Zhu M M. Artificial bee colony algorithm based on local search[J]. Control and Decision , 2014, 29 (1) : 123–128. [ 刘三阳, 张平, 朱明敏. 基于局部搜索的人工蜂群算法[J]. 控制与决策 , 2014, 29 (1) : 123–128. DOI:10.13195/j.kzyjc.2012.1301 ]

[12] Tang Y G, Mu W W, Zhang Y, et al. A fast recursive algorithm based on fuzzy 2-partition entropy approach for threshold selection[J]. Neurocomputing , 2011, 74 (17) : 3072–3078. DOI:10.1016/j.neucom.2011.04.010]

[13] Tomasi C, Manduchi R. Bilateral filtering for gray and color images[C]//Proceedings of the 6th International Conference on Computer Vision. Bombay, India: IEEE, 1998: 839-846.[DOI: 10.1109/ICCV.1998.710815]

[14] Zhou Y C, Ren H. Segmentation method for rock particles image based on improved watershed algorithm[C]//Proceedings of International Conference on Computer Science & Service System. Nanjing: IEEE, 2012: 347-349.[DOI: 10.1109/CSSS.2012.94]

[15] Yu H Y, Zhi X B, Fan J L. Image segmentation based on weak fuzzy partition entropy[J]. Neurocomputing , 2015, 168 : 994–1010. DOI:10.1016/j.neucom.2015.05.025]

[16] Gong M L, Yang Y H. Genetic-based multiresolution color image segmentation[C]//Vision Interface. Ottawa, Ontario, Canada: Canadian Image Processing and Pattern Recognition Society, 2001: 141-148.