基于局部马尔科夫随机场的模型校准嘴唇分割方法

鲁远耀; 周腾鹤; 闫捷

doi:10.3969/j.issn.1001-0548.2018.03.017

基于局部马尔科夫随机场的模型校准嘴唇分割方法

doi: 10.3969/j.issn.1001-0548.2018.03.017

北方工业大学电子信息工程学院北京石景山区 100144

基金项目:

国家自然科学基金 61571013

北京市自然科学基金 4143061

详细信息

作者简介:
鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究

中图分类号: TP391.4

A Local MRF Model Based Lip Segmentation Method with Model Calibration

School of Electronic and Information Engineering, North China University of Technology Shijingshan Beijing 100144

摘要: 为了有效挖掘人说话时的唇动特征，提出了一种综合局部区域马尔科夫随机场（Markov random field，MRF）特性和模型校准的嘴唇分割方法。将嘴唇区域图像从RGB转换到LUX色彩空间，并利用对数化色彩分量U实现初始化轮廓的确定。沿轮廓选取固定半径的圆形窗口函数界定局部区域，再利用马尔科夫随机场进行嘴唇分割，并使用基于Kullback-Leiller（KL）距离的模型校准方法使局部区域之间的分割结果相互协调。实验证明，该方法可以在皮肤中分离出嘴唇，分割准确率高，鲁棒性好，具有较高的实用价值。
- 图像分割 /
- 唇语识别 /
- 嘴唇分割 /
- 局部模型校准 /
- 马尔科夫随机场
Abstract: In order to effectively exploit the lip feature of human speech, a lip segmentation method based on Markov random field (MRF) and model calibration is proposed. In this paper, we conduct the color space transformation from RGB to LUX color space for the lip region image, and we make use of the logarithmic chroma U to determine the initial contour. A mask with fixed radius is selected along the contour to define the local region, the Markov random field is used to segment the lips, and the Kullback-Leiller (KL) distance based model calibration method is used to coordinate the segmentation results between the local regions. Experiments show that the method can separate the lips in the skin with high accuracy and robustness and is of high practical value.
- image segmentation /
- lip reading /
- lip segmentation /
- local model calibration /
- Markov random field

图 1 马尔科夫随机场模型流程图

下载: 全尺寸图片幻灯片

图 2 局部马尔科夫随机场模型

下载: 全尺寸图片幻灯片

图 3 嘴唇区域

下载: 全尺寸图片幻灯片

图 4 分割结果

下载: 全尺寸图片幻灯片

表 1 性能比较

MCM算法/%		本文算法/%
OL	SE	OL	SE
87.3	10.0	90.7	8.2
88.9	11.3	91.2	7.9
90.1	9.4	91.7	7.7
87.9	10.2	91.1	7.9
86.5	11.7	90.5	8.9
85.9	13.5	89.3	9.2
87.2	10.6	91.4	7.4
88.8	9.1	91.6	7.3
85.6	12.7	90.4	7.6
89.7	10.3	92.0	7.1

下载: 导出CSV

[1]	LEE K D, LEE K, LEE S Y. Extraction of frame-difference features based on PCA and ICA for lip-reading[C]//IEEE International Joint Conference on Neural Networks. [S. l. ]: [s. n. ], 2005.
[2]	NATH R, RAHMAN F S, NATH S, et al. Lip contour extraction scheme using morphological reconstruction based segmentation[C]//International Conference on Electrical Engineering and Information and Communication Technology. [S. l. ]: IEEE, 2014: 1-4.
[3]	YAN Li, YE Hang, WANG Yi-kai, et al. A lip localization method based on HSV transformation in smart phone environment[C]//International Conference on Signal Processing. [S. l. ]: IEEE, 2014: 1285-1290.
[4]	GRITZMAN A D, RUBIN D M, PANTANOWITZ A. Comparison of colour transforms used in lip segmentation algorithms[J]. Signal, Image and Video Processing, 2015, 9(4):1-11. doi: 10.1007%2Fs11760-014-0615-x
[5]	KASS M, WITKIN A, TERZOPOULOS D. Snakes:Active contour models[J]. International Journal of Computer Vision, 1988, 1(4):321-331. doi: 10.1007/BF00133570
[6]	NASUHA A, SARDJONO T A, PURNOMO M H. Lip Segmentation and tracking based on Chan-Vese model[C]//International Conference on Information Technology and Electrical Engineering: "Intelligent and Green Technologies for Sustainable Development". [S. l. ]: ICITEE, 2013: 155-158.
[7]	SUN Chen-yang, LU Hong, ZHANG Wen-qiang, et al. Lip segmentation based on facial complexion template[C]//Advances in Multimedia Information Processing. [S. l. ]: Springer International Publishing, 2014.
[8]	FU Jian-wen, WANG Shi-lin, LIN Xiang. Robust lip region segmentation based on competitive FCM clustering[C]//International Conference on Digital Image Computing: Techniques and Applications. [S. l. ]: IEEE, 2016.
[9]	YANG F, JIANG T. Pixon-based image segmentation with Markov random fields[J]. IEEE Transactions on Image Processing, 2003, 12(12):1552-1559. doi: 10.1109/TIP.2003.817242
[10]	CHEUNG Y M, LI M, CAO X. Lip segmentation and tracking under MAP-MRF framework with unknown segment number[J]. Neurocomputing, 2013, 104:155-169. doi: 10.1016/j.neucom.2012.10.009
[11]	荣传振, 岳振军, 贾永兴, 等.模糊语言模型在唇读系统中的应用[J].数据采集与处理, 2012, 27(s2):277-283. http://www.cqvip.com/QK/92416X/201510/666524320.html RONG Chuan-zhen, YUE Zhen-jun, JIA Yong-xing, et al. Research advances in key technology of lip-reading[J]. Joumal of Data Acquisition & Processing, 2012, 27(s2):277-283. http://www.cqvip.com/QK/92416X/201510/666524320.html
[12]	LEWIS T, POWERS D. Lip feature extraction using red exclusion[C]//Selected Papers from Pan-Sydney Workshop on Visualization. [S. l. ]: [s. n. ], 2002.
[13]	WANG S L, LAU W H, LEUNG S H, et al. Lip segmentation with the presence of beards[C]//International Conference on Acoustics, Speech, & Signal Processing. [S. l. ]: IEEE, 2004.
[14]	LEUNG S, WANG S, LAU W. Lip image segmentation using fuzzy clustering incorporating an elliptic shape function[J]. IEEE Transactions on Image Processing, 2004, 13(1):51-62. doi: 10.1109/TIP.2003.818116
[15]	MATTHEWS I, COOTES T F, BANGHAM J A. Extraction of visual features for lipreading[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(2):198-213. doi: 10.1109/34.982900
[16]	LIÉVIN M, LUTHON F. Nonlinear color space and spatiotemporal MRF for hierarchical segmentation of face features in video[J]. IEEE Transactions on Image Processing, 2004, 13(1):63-71. doi: 10.1109/TIP.2003.818013
[17]	PATTERSON E K, GURBUZ S, TUFEKCI Z, et al. CUAVE: a new audio-visual database for multimodal human-computer interface research[C]//IEEE International Conference on Acoustics, Speech & Signal Processing. [S. l. ]: IEEE, 2002.
[18]	LIEW W C, LEUNG S H, LAU W H. Segmentation of color lip images by spatial fuzzy clustering[J]. IEEE Transactions on Fuzzy Systems, 2003, 11(4):542-549. doi: 10.1109/TFUZZ.2003.814843
[19]	STILLITTANO S, GIRONDEL V, CAPLIER A. Lip contour segmentation and tracking compliant with lip-reading application constraints[J]. Machine Vision & Applications, 2013, 24(24):1-18. https://www.researchgate.net/publication/257334063_Lip_contour_segmentation_and_tracking_compliant_with_lip-reading_application_constraints

[1]	谢洲洋, 舒畅, 傅彦, 周俊临, 蒋家玮, 陈端兵. 先验知识辅助的金属涂层损伤分割方法 . 电子科技大学学报, 2024, 53(1): 76-83. doi: 10.12178/1001-0548.2022373
[2]	郝琨, 韩冰, 李志圣, 王传启. 基于投影阈值分割和数字序列校正的高噪声数字仪表图像识别方法 . 电子科技大学学报, 2023, 52(5): 728-738. doi: 10.12178/1001-0548.2022217
[3]	何坤, 郑秀清, 谢沁岑, 王丹. 基于水平集的自适应保边平滑分割 . 电子科技大学学报, 2017, 46(4): 579-584. doi: 10.3969/j.issn.1001-0548.2017.04.017
[4]	杨勇, 郭玲, 叶阳东, 周小佳. 多类变分优化的自然图像分割方法 . 电子科技大学学报, 2016, 45(5): 824-831. doi: 10.3969/j.issn.1001-0548.2016.05.020
[5]	杨勇, 郭玲, 叶阳东, 周小佳. 多类变分优化的自然图像分割方法 . 电子科技大学学报, 2016, 45(5): -. doi: 第45卷第5期 pp:824-831
[6]	宋强, 茹蓓, 刘凌霞. 基于MRF的SMT焊点区域分割的研究 . 电子科技大学学报, 2016, 45(5): 819-823. doi: 10.3969/j.issn.1001-0548.2016.05.019
[7]	刘修国, 徐乔, 陈启浩, 陈奇. 选择利用Wishart和K统计描述的极化SAR图像分割 . 电子科技大学学报, 2016, 45(5): 713-719. doi: 10.3969/j.issn.1001-0548.2016.05.001
[8]	罗时雨, 童玲, 陈彦. 基于参数化模型的水平集SAR图像多区域分割方法 . 电子科技大学学报, 2016, 45(6): 939-943. doi: 10.3969/j.issn.1001-0548.2016.06.011
[9]	邓晓政, 焦李成. 流形距离的自动免疫克隆聚类图像分割算法 . 电子科技大学学报, 2014, 43(5): 742-748. doi: 10.3969/j.issn.1001-0548.2014.05.019
[10]	张文娟, 冯象初. 图像多相分割松弛凸化模型分裂方法 . 电子科技大学学报, 2013, 42(1): 130-136. doi: 10.3969/j.issn.1001-0548.2013.01.027
[11]	吕雁, 冯大政. 有监督的水平集高分辨SAR图像分割方法 . 电子科技大学学报, 2011, 40(3): 357-362. doi: 10.3969/j.issn.1001-0548.2011.03.005
[12]	房春兰, 陈雷霆, 张宇. 肝脏CT图像三维分割研究 . 电子科技大学学报, 2009, 38(2): 278-281. doi: 10.3969/j.issn.1001-0548.2009.02.29
[13]	干可, 谢明, 罗代升. 激光共聚焦序列图像基于特征的分割方法 . 电子科技大学学报, 2008, 37(4): 630-633.
[14]	曹宗杰, 庞伶俐, 皮亦鸣. 融合区域和边界信息的水平集SAR图像分割方法 . 电子科技大学学报, 2008, 37(3): 325-327,353.
[15]	蒋宁, 章日康, 蒲立新, 陈伟建. Chan-Vese图像分割模型的快速实现算法的研究 . 电子科技大学学报, 2008, 37(5): 705-708.
[16]	马义德, 钱志柏, 陈娜. 基于FCM的动态结合全局图像阈值分割 . 电子科技大学学报, 2006, 35(3): 349-351.
[17]	田娅, 饶妮妮, 蒲立新. 国内医学图像处理技术的最新动态 . 电子科技大学学报, 2002, 31(5): 485-489.
[18]	马义德, 李廉, 戴若兰. 基于细胞逻辑、形态特征图像分割新算法 . 电子科技大学学报, 2002, 31(1): 84-87.
[19]	胡宇驰. 应用马尔科夫状态图法进行可靠性评估 . 电子科技大学学报, 2001, 30(2): 175-180.
[20]	汪天富, 郑昌琼, 李德玉. 基于神经网络的超声医学图像自动分割 . 电子科技大学学报, 1997, 26(4): 366-368.

点击查看大图

图(4) / 表(1)

计量

文章访问数: 4034
HTML全文浏览量: 1260
PDF下载量: 110
被引次数: 0

全文HTML

唇语识别(lip reading)是近年来模式识别和人工智能领域的热门研究问题，是声学和图像图形学的交叉学科。该技术涉及嘴唇区域定位、跟踪、特征提取、音素建模和目标识别等关键技术。由于图像序列中嘴唇区域相对位置不固定，现有的技术方法尚不能同时在嘴唇区域的精确分割和实时性方面同时获得满意结果。在唇语识别系统中，最为基础和关键的步骤是实现嘴唇区域分割，即利用精确的图像分割技术界定变化的嘴唇轮廓，进而挖掘人在说话时的唇动(lip movement)特征，实现利用视觉信息实现话语内容的识别。

文献中现有的嘴唇区域分割算法可以大致分为3类：基于像素的方法、基于模型的方法和基于统计的方法。基于像素的方法利用嘴唇区域的灰度图像来获得特征向量，或将图像转换为其他颜色空间并采用PCA(principal component analysis)、LDA (linear discriminant analysis)等实现特征提取^[1-4]。基于模型的方法借用一定的几何模型来确定嘴唇的内外轮廓，并借用少量参数来表征该轮廓^[5-7]。基于统计的方法发掘特征空间中的数据分布特征和相邻像素之间的空间相互作用关系来进行图像分割，为嘴唇分割提供了一种新颖方法^[8]，如利用空间限制的马尔可夫随机场图像分割技术^[9-10]。

早期嘴唇区域分割通常通过相机来直接捕获嘴部区域或手动标定唇部区域来实现^[11]。然而，这并不是理想的分割方法，本文研究的最终目标是要在变化的条件下(例如变化的光照，不同的肤色或非特定人的说话者等)自动地定位和追踪嘴唇。到目前为止，已经有许多研究者从事研究相关工作。文献[12]通过使用红色排除法在一系列图像上识别嘴唇来找到嘴角，得到了较准确的结果。文献[13-14]利用基于模糊聚类的算法在有胡须的情况下分割嘴唇区域。文献[15]采用自上而下主动形状模型来发现并跟踪内外唇轮廓。然而以上的分割方法在实际的分割过程中会出现一块块的、彼此不相互连通的小区域被分割出来，在颜色对比度较低的情况下，嘴唇边缘轮廓并不十分明显，此时分割的准确率和鲁棒性有待提高。

本文提出一种新的基于局部模型校准的马尔科夫随机场的嘴唇分割方法，考虑了局部空间的约束，使得分割在各自局部模型中独立进行。采用Kullback-Leiller距离来评估相邻局部模型的一致性，提出了有助于校准其参数的模型校正标准。通过实验与现有的MCM算法比较，证明该方法拥有良好的分割准确性。

1. 马尔科夫随机场框架概述

马尔科夫随机场理论提供了一种方便且稳健的方法来建模诸如图像像素或相关特征的环境实体。该模型的应用主要是基于马尔科夫随机场和吉布斯分布之间的等价性定理，该定理在1971年被提出并于1974年进一步发展而来。如今马尔科夫随机场已被广泛用于解决各个层面的视觉问题。

目前已有许多研究人员提出了几种估计标准来实现马尔科夫随机场模型的最佳估计。其中，最大后验估计(maximum a posterior, MAP)是最常用的最佳分割标准，并且表现出较高性能。结合标记场的先验分布和观察随机场的条件分布的知识可知，最大后验估计的本质是找到最大后验概率的解${f^ * }$，可表示为：

$$ {f^ * } = \mathop {\arg \max }\limits_f P(f|x) = \mathop {\arg \max }\limits_f P(f)P(x|f) $$

(1)

对于一幅拥有常规点阵的图像，它的坐标集由S=[1, 2, …, s]表示，邻域系统表示为N，根据Hammersley-Clifford定理，如果作用在S上的随机场X服从吉布斯分布，则它一定也是一个马尔科夫随机场。该理论将马尔科夫随机场与吉布斯分布(Gibbs distribution)结合在一起。先验概率$P(f)$被定义为：

$$ P(f) = \frac{1}{Z}{{\rm{e}}^{ - U(f)}} $$

(2)

式中，Z为归一化常数；U(f)是先验能量函数(energy function)，是基团势能${V_c}(f)$之和，可表示为：

$$ U(f) = \sum\limits_{s \in S} {\sum\limits_{c \in C} {{V_c}} } ({f_s}) $$

(3)

式中，C是在S范围内的所有基团的集合。

对于给定的分割标签，观察值应是独立且随机的。类似地，本文如式(2)一样定义条件概率$P(x|f)$：

$$ P(x|f) = \prod\limits_{s \in S}^m {P({x_s}|{f_s})} = \frac{1}{Z}{{\rm{e}}^{ - U(x|f)}} $$

(4)

式中，U(x|f)是反映观察值与标签值之间相干关系的条件能量函数。在大多数情况下，假设观测数据的条件概率分布服从高斯分布是合理的，因此U(x|f)可以表示为：

$$ U(x|f) = \sum\limits_{s \in S} {U({x_s}|{f_s})} = \sum\limits_{s \in S} {(\frac{{\ln |2{\rm{ \mathsf{ π} }}\sigma _l^2|}}{2}} + \frac{{{{({x_s} - {\mu _l})}^2}}}{{2\sigma _l^2}}) $$

(5)

式中，${\mu _l}$和$\sigma _l^2$分别表示每个标记观察变量的均值和方差。

系统能量函数定义如下：

$$ U(x;f) = U(f) + U(x|f) $$

(6)

分割结果为可使能量函数最小化的标记结果${f^ * }$：

$$ {f^*} = \mathop {\arg \min }\limits_f U(x;f) $$

(7)

3. 模型检验和校准

为了使局部MRF模型与其邻域的分割结果相协调，本文提出了一种可实现模型检验和模型校准的算法。首先需要为局部MRF定义邻域系统，将此邻域系统表示为NS(M)，M是局部MRF模型，通过下式计算出相对应k的平均值及方差：

$$ \forall k = 1,2, \cdots ,t\left\{ \begin{array}{l} {{\bar \mu }_k} = {D^{ - 1}}\sum\limits_{c' \in {\rm{NS}}(M)} {\mu _k^cd(c,c')} \\ {{\bar \sigma }_k} = {D^{ - 1}}\sum\limits_{c' \in {\rm{NS}}(M)} {\sigma _k^{c'}d(c,c')} \end{array} \right. $$

(16)

式中，$D = \sum {d(c, c')} $；t表示类数；c和c'是局部模型与其邻区的中心；$d(c, c')$表示c和c'之间的欧氏距离；$\mu _k^{c'}$和$\sigma _k^{c'}$对应相应的均值和方差。

其次，KL距离D_k用来衡量第k类分割的两个局部MRF模型之间的差异，有：

$$ \begin{array}{l} {D_k} = {\rm{KL}}({\mu _k},{\sigma _k},\overline {{\mu _k}} ,\overline {{\sigma _k}} ) = \\ \frac{{(\sigma _k^2 - \overline {\sigma _k^2} ) + ({\mu _k} - \overline {{\mu _k}} )(\sigma _k^2 + \overline {\sigma _k^2} )}}{{4\sigma _k^2\overline {\sigma _k^2} }} \end{array} $$

(17)

经校准后的平均值标记为$\overline{\overline {{\mu _k}}} $和$\overline{\overline {{\sigma _k}}} $，根据下式计算：

$$ \left\{ \begin{array}{l} \overline{\overline {{\mu _k}}} = (1 - \kappa ){\mu _k} + \kappa \overline {{\mu _k}} \\ \overline{\overline {{\sigma _k}}} = (1 - \kappa ){\sigma _k} + \kappa \overline {{\sigma _k}} \end{array} \right. $$

(18)

式中，$\kappa \in [0, 1]$。定义两个阈值T_k与T_r(T_k < T_r)用于模型校准，如下所示：

如果D_k≤T_k，局部模型的参数不需要调整，因此$\kappa = 0$。

如果D_k > T_k，局部模型需要调整，使参数$\kappa = 1$。

如果T_k < D_k < T_r，$\kappa = ({D_k} - {T_k})/({T_r} - {T_k})$。

5. 结束语

本文提出了一种基于局部MRF模型LUX颜色空间中的嘴唇分割方法。通过在一个椭圆轮廓的基础之上，结合初始化窗口函数来指定MRF模型的局部范围，实现嘴唇区域的分割。最后，提出了MRF模型的参数模型检查和校准方法。实验表明该方法可对唇部进行有效的分割。

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于局部马尔科夫随机场的模型校准嘴唇分割方法

doi: 10.3969/j.issn.1001-0548.2018.03.017

作者简介:
鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究

A Local MRF Model Based Lip Segmentation Method with Model Calibration

计量

基于局部马尔科夫随机场的模型校准嘴唇分割方法

doi: 10.3969/j.issn.1001-0548.2018.03.017

北方工业大学电子信息工程学院北京石景山区 100144

作者简介:
鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究

English Abstract

A Local MRF Model Based Lip Segmentation Method with Model Calibration

School of Electronic and Information Engineering, North China University of Technology Shijingshan Beijing 100144

全文HTML

2.1. 色彩空间转换

2.2. 初始化轮廓的确定

2.3. 基于局部区域马尔科夫随机场的分割

4.1. 定性分析

4.2. 定量分析

目录

期刊在线

编辑办公

友情链接

留言板

基于局部马尔科夫随机场的模型校准嘴唇分割方法

doi: 10.3969/j.issn.1001-0548.2018.03.017

作者简介: 鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究

A Local MRF Model Based Lip Segmentation Method with Model Calibration

计量

出版历程

基于局部马尔科夫随机场的模型校准嘴唇分割方法

doi: 10.3969/j.issn.1001-0548.2018.03.017

北方工业大学电子信息工程学院 北京 石景山区 100144

作者简介: 鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究

English Abstract

A Local MRF Model Based Lip Segmentation Method with Model Calibration

School of Electronic and Information Engineering, North China University of Technology Shijingshan Beijing 100144

全文HTML

2.1. 色彩空间转换

2.2. 初始化轮廓的确定

2.3. 基于局部区域马尔科夫随机场的分割

4.1. 定性分析

4.2. 定量分析

目录

期刊在线

编辑办公

友情链接

作者简介:
鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究

北方工业大学电子信息工程学院北京石景山区 100144

作者简介:
鲁远耀(1977-), 男, 博士, 副教授, 主要从事图像处理, 模式识别及机器学习等方面的研究