矩阵的低秩稀疏表达在视频目标分割中的研究

顾菘; 马争; 解梅

doi:10.3969/j.issn.1001-0548.2017.02.008

矩阵的低秩稀疏表达在视频目标分割中的研究

doi: 10.3969/j.issn.1001-0548.2017.02.008

顾菘^1,2,
马争¹,
解梅³

1.
电子科技大学通信与信息工程学院成都 611731
2.
成都航空职业技术学院航空工程学院成都 610100
3.
电子科技大学电子工程学院成都 611731

基金项目:

国家自然科学基金 61271288

教育部博士点基金 20130185130001

详细信息

作者简介:
顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究

中图分类号: TP39

Video Object Segmentation Via Low-Rank Sparse Representation

1.
School of Communication and Information Engineering, University of Electronic Science and Technology of China Chengdu 611731
2.
Department of Aircraft Maintenance Engineering, Chengdu Aeronautic Polytechnic Chengdu 610100
3.
School of Electronic Engineering, University of Electronic Science and Technology of China Chengdu 611731

摘要: 提出了一种视频目标跟踪与分割的在线算法。该算法将每帧图像中的超级像素作为一个数据点，根据已知的目标和背景建立模板，当前帧中待分割的目标可以看成已知模板的稀疏线性表达。根据此线性表达的系数可以建立描述当前帧与模板的相似性矩阵，即表达子。由于视频图像的连续性，表达子具有低秩和稀疏的特征。因此通过求解矩阵的低秩稀疏的优化问题可以得到当前帧中所有数据点属于目标的概率分布。为了获得基于像素级的分割结果，通过能量最小框架，并利用图分割的方法最终实现目标的分割。实验结果表明该算法具有良好的分割效果。
- 能量最小 /
- 图分割 /
- 低秩 /
- 稀疏 /
- 视频目标分割
Abstract: We present a novel on-line algorithm for target segmentation and tracking in video. Superpixels, which are abstracted in every frame, are treated as data points in this paper. The object in current frame is represented as sparse linear combination of dictionary templates, which are generated based on the segmentation result in the previous frame. Then the algorithm capitalizes on the inherent low-rank structure of representation that are learned jointly. A low-rank sparse matrix optimal solution results in the construction of the trimap. At last, a simple energy minimization solution is adopted in segmented stage, leading to a binary pixel-wise segmentation. Experiments demonstrate that our approach is effective.
- energy minimization /
- graph cut /
- low rank /
- sparse /
- video object segmentation

图 1 线性表达关系示意图 (视频图像参考文献[2])

下载: 全尺寸图片幻灯片

图 2 矩阵的低秩稀疏表达和显著性特征

下载: 全尺寸图片幻灯片

图 3 矩阵的低秩稀疏运算时间与采样样本个数的关系

下载: 全尺寸图片幻灯片

图 4 分割效果示例

下载: 全尺寸图片幻灯片

表 1 跟踪精度对比

视频	文献[2]	文献[3]	${\lambda _c} = 0.5$	${\lambda _c} = 0.2$	目标大小	帧数
parachute	502	235	206	207	3 695	50
girl	1 755	1 304	1 280	1 680	8 201	20
monkey	4 142	2 814	2 790	2 805	6 054	30
birdfall	454	252	—	319	495	29

下载: 导出CSV

[1]	NING J, ZHANG L, ZHANG D, et al. Joint registration and active contour segmentation for object tracking[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2013, 23(9):1589-1597. doi: 10.1109/TCSVT.2013.2254931
[2]	CHOCKALINGAM P, PRADEEP N, BIRCHFIELD S. Adaptive fragments-based tracking of non-rigid objects using level sets[C]//2009 IEEE 12th International Conference on Computer Vision. Kyoto:IEEE, 2009:1530-1537.
[3]	TSAI D, FLAGG M, NAKAZAWA A, et al. Motion coherent tracking using multi-label MRF optimization[J]. International Journal of Computer Vision, 2012, 100(2):190-202. doi: 10.1007/s11263-011-0512-5
[4]	CRIMINISI A, CROSS G, BLAKE A, et al. Bilayer segmentation of live video[C]//2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. NewYork:IEEE, 2006, 1:53-60.
[5]	WANG L, GONG M, ZHANG C, et al. Automatic real-time video matting using time-of-flight camera and multichannel poisson equations[J]. International Journal of Computer Vision, 2012, 97(1):104-121. doi: 10.1007/s11263-011-0471-x
[6]	YIN Z, COLLINS R T. Online figure-ground segmentation with edge pixel classification[C]//BMVC. Leeds:IEEE, 2008:1-10.
[7]	BAO C, WU Y, LING H, et al. Real time robust l1 tracker using accelerated proximal gradient approach[C]//2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence:IEEE, 2012:1830-1837.
[8]	ZHANG T, GHANEM B, LIU S, et al. Low-rank sparse learning for robust visual tracking[M]//Computer VisionECCV 2012. Berlin Heidelberg, Springer, 2012:470-484.
[9]	LI P, WANG Q. Local log-euclidean covariance matrix (L2ECM) for image representation and its applications[M]//Computer Vision-ECCV 2012. Berlin:Springer, 2012:469-482.
[10]	ACHANTA R, SHAJI A, KEVIN S, et al. SLIC superpixels compared to state-of the-art superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11):2274-2282. doi: 10.1109/TPAMI.2012.120
[11]	LAPTEV I, MARSZALEK M, SCHMID C. Learning realistic human actions from movies[C]//IEEE Conference on Computer Vision and Pattern Recognition. Anchorage:IEEE, 2008:1-8.
[12]	PERAZZI F, KRÄHENBÜHL P, PRITCH Y, et al. Saliency filters:Contrast based filtering for salient region detection[C]//2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence:IEEE, 2012:733-740.
[13]	LI C, LIN L, ZUO W, et al. Sold:Sub-optimal low-rank decomposition for efficient video segmentation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston:IEEE, 2015:5519-5527.
[14]	LIU X, LIN L, YUILLE A L. Robust region grouping via internal patch statistics[C]//2013 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Oregon:IEEE, 2013:1931-1938.
[15]	ZHUANG L, GAO H, LIN Z, et al. Non-negative low rank and sparse graph for semi-supervised learning[C]//2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence:IEEE, 2012:2328-2335.
[16]	KOLMOGOROV V, ZABIN R. What energy functions can be minimized via graph cuts?[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004, 26(2):147-159. doi: 10.1109/TPAMI.2004.1262177
[17]	CHENG M, MITRA N J, HUANG X, et al. Global contrast based salient region detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(3):569-582. doi: 10.1109/TPAMI.2014.2345401
[18]	TANG M, GORELICK L, VEKSLER O, et al. Grabcut in one cut[C]//2013 IEEE International Conference on Computer Vision (ICCV). Sydney:IEEE, 2013:1769-1776.

[1]	邓佳丽, 龚海刚, 刘明. 基于目标检测的医学影像分割算法 . 电子科技大学学报, 2023, 52(2): 254-262. doi: 10.12178/1001-0548.2022081
[2]	达婷, 杨靓. 一种低分辨率视频实例分割算法的研究 . 电子科技大学学报, 2021, 50(1): 63-75. doi: 10.12178/1001-0548.2020075
[3]	刘慧超, 王志君, 梁利平. 融合视频编码的低复杂度纹理自适应视频加密算法 . 电子科技大学学报, 2020, 49(5): 700-708. doi: 10.12178/1001-0548.2019291
[4]	李永攀, 彭伟伦, 门锟, 吴俊阳. 基于多视角低秩分析的电力状态不良数据检测 . 电子科技大学学报, 2019, 48(3): 361-365. doi: 10.3969/j.issn.1001-0548.2019.03.009
[5]	唐贤伦, 刘雨微, 万亚利, 马艺玮. 堆叠稀疏降噪自编码的脑电信号识别 . 电子科技大学学报, 2019, 48(1): 62-67. doi: 10.3969/j.issn.1001-0548.2019.01.011
[6]	李厚彪, 樊庆宇, 耿广磊. 基于自适应同时稀疏表示的鲁棒性目标追踪 . 电子科技大学学报, 2018, 47(1): 1-12. doi: 10.3969/j.issn.1001-0548.2018.01.001
[7]	何坤, 郑秀清, 谢沁岑, 王丹. 基于水平集的自适应保边平滑分割 . 电子科技大学学报, 2017, 46(4): 579-584. doi: 10.3969/j.issn.1001-0548.2017.04.017
[8]	凡时财, 曾祥峰, 周雪, 邹见效, 徐红兵. 融合超像素分割与码本模型的目标检测算法 . 电子科技大学学报, 2017, 46(4): 572-578. doi: 10.3969/j.issn.1001-0548.2017.04.016
[9]	宋强, 茹蓓, 刘凌霞. 基于MRF的SMT焊点区域分割的研究 . 电子科技大学学报, 2016, 45(5): 819-823. doi: 10.3969/j.issn.1001-0548.2016.05.019
[10]	杨勇, 郭玲, 叶阳东, 周小佳. 多类变分优化的自然图像分割方法 . 电子科技大学学报, 2016, 45(5): -. doi: 第45卷第5期 pp:824-831
[11]	程建, 黎兰, 王海旭. 稀疏表示框架下的SAR目标识别 . 电子科技大学学报, 2014, 43(4): 524-529. doi: 10.3969/j.issn.1001-0548.2014.04.009
[12]	陈俊周, 李炜, 王春瑶. 一种动态场景下的视频前景目标分割方法 . 电子科技大学学报, 2014, 43(2): 252-256. doi: 10.3969/j.issn.1001-0548.2014.02.018
[13]	任金胜, 贾海涛. 基于改进目标检测能量项的联合语义分割和目标检测 . 电子科技大学学报, 2014, 43(5): 749-753. doi: 10.3969/j.issn.1001-0548.2014.05.020
[14]	王汝言, 刘兰英, 吴大鹏. 采用网络分割的OBS网络故障监测机制 . 电子科技大学学报, 2011, 40(1): 36-40. doi: 10.3969/j.issn.1001-0548.2011.01.007
[15]	王敏琴, 韩国强, 涂泳秋. 新型的无监督纹理分割方法 . 电子科技大学学报, 2010, 39(1): 11-15. doi: 10.3969/j.issn.1001-0548.2010.01.003
[16]	韦素媛, 马天骏, 宁超, 高有行. 用时空能量图和小波变换方法表征和识别步态 . 电子科技大学学报, 2009, 38(3): 431-434. doi: 10.3969/j.issn.1001-0548.2009.03.027
[17]	马义德, 钱志柏, 陈娜. 基于FCM的动态结合全局图像阈值分割 . 电子科技大学学报, 2006, 35(3): 349-351.
[18]	杨春, 张先迪, 孙世新. 对一类最小图的研究 . 电子科技大学学报, 2005, 34(2): 258-260.
[19]	马义德, 李廉, 戴若兰. 基于细胞逻辑、形态特征图像分割新算法 . 电子科技大学学报, 2002, 31(1): 84-87.
[20]	汪天富, 郑昌琼, 李德玉. 基于神经网络的超声医学图像自动分割 . 电子科技大学学报, 1997, 26(4): 366-368.

点击查看大图

图(4) / 表(1)

计量

文章访问数: 4319
HTML全文浏览量: 1237
PDF下载量: 126
被引次数: 0

全文HTML

基于视频的目标分割 (video object segmentation) 不仅能够跟踪目标的位置，还能精确地描述目标的形状。它可以看成是目标的精确跟踪。视频目标分割的关键在于时间一致性 (temporal coherence) 和空间一致性 (spatial coherence) 的表达。时间一致性描述了在连续帧中目标的相似性，空间一致性描述了在一帧图像中目标与背景的分辨能力。文献[1-2]提出了基于水平集 (level set) 的分割算法。这种算法的缺点在于将运动估计与分割过程分别独立，将运动估计的结果作为分割的输入。这样当运动估计不准确时，会影响分割的精度。建立能量函数，利用能量最小化的方法进行目标分割是当前比较流行的方法。文献[3-6]分别利用目标的运动模型、颜色纹理等信息建立了不同的能量函数。这种方法的优点在于能够将时间与空间信息利用概率模型融合在一起，最终获得较好的分割效果。文献[3-4]通过对某些关键帧中已知目标的学习，提出了一种离线算法。文献[5]利用深度摄像机获得了目标的深度信息。但这些方法都大大限制了其应用范围。文献[6]利用目标的颜色信息建立了3D条件随机场模型 (conditional random field)。但由于其信息量较少，分割精度不高。本文也将利用能量最小的框架结构，创建新的能量函数，只需要较少的已知信息就能够进行视频目标的在线分割。

另一方面，本文将视频目标分割看作一种目标跟踪算法，将目标的分割转化成矩阵的低秩稀疏表达。近年来，矩阵的低秩稀疏表达已经被广泛应用在目标跟踪上。文献[7]提出了一种L1范数模型，将目标作为模板集的稀疏表达形式，实现了目标的在线跟踪。文献[8]提出了基于粒子滤波的跟踪算法，将对目标的跟踪转化为矩阵低秩稀疏的优化问题。

本文提出一种基于区域的在线目标视频分割算法。首先将图像过分割 (over segmentation) 成超级像素 (superpixel)，将超级像素作为数据点，这不仅滤除了不必要的细节特征，而且可以大大简化计算量。然后根据上一帧的分割结果建立模板集，将当前帧所有数据点看作模板集的稀疏线性组合。将目标分割问题转化为矩阵的低秩稀疏的优化问题。根据计算出的线性组合系数矩阵建立当前帧中每个超级像素的概率分布。最后将此概率分布作为能量函数的一个线索 (cue)，结合其他基本信息，构建出新的能量函数，利用能量最小化求得最终的结果。此外，由于超级像素的形状不规则，本文将采用L2ECM^[9](local log-euclidean covariance matrix) 算法提取其特征。

1. 特征提取

基于区域的分割算法已经被广泛应用。本文将超级像素^[10]作为一个数据点进行图像的分割。这种方法不仅能够大大地减少计算的数据量，而且超级像素本身已经将某些相似的像素聚集在一起，滤除了大量的细节噪声，增加了算法的鲁棒性。考虑到超级像素形状的不规则性，本文采用L2ECM算法提取其特征。在一幅图像中，一个像素的基本特征可以表示为：

$$ \begin{array}{l} f(x, y) = [I(x, y), |{I_x}(x, y)|, |{I_y}(x, y)|\\ |{I_{xx}}(x, y)|, |{I_{yy}}(x, y)|{]^{\rm{T}}} \end{array} $$

(1)

式中，|·|表示绝对值；I(x, y) 表示图像中像素点 (x, y) 的像素值；I_x(x, y) 和I_xx(x, y) 分别表示x方向的一阶和二阶导数；I_y(x, y) 和I_yy(x, y) 分别表示y方向的一阶和二阶导数。

在图像中给定一个超级像素S，则${\boldsymbol{F}_S} = (f({x_i}, {y_i}) \in $${R^d})_{i = 1}^{{N_S}}, ({x_i}, {y_i}) \in S$。显而易见，F_S是一个$d \times {N_S}$维的矩阵，其中d为基本特征的维度，N_S为超级像素中所包含像素的个数。F_S的每一列表示S中一个像素的基本特征。计算F_S的协方差并表示为C_S，则C_S是一个d×d维的方阵，它与所包含的像素个数N_S无关。由于协方差矩阵所构成空间满足黎曼流形的要求，无法在欧式空间中进行计算，因此必须将C_S通过logC_S转化到欧氏空间中^[9]。取logC_S的上对角并转化成矢量形式，因此一个超级像素S_i的特征是长度为$\frac{{d(d + 1)}}{2}$的向量，并表示为f_i。用L2ECM算法提取超级像素的特征具有较强的抗噪能力，对旋转、缩放和光照变化都不敏感^[11]，并且提取的特征维度只与基本特征的维度相关，与超级像素的形状和大小无关。

3. 目标分割

本文所提出的矩阵低秩稀疏表达是将超级像素看为一个数据点，这是一种基于区域的计算方法。要想获得基于像素的分割结果，本文将图像分割作为图分割问题，利用不同的信息为图像中的每个像素点建立不同的概率分布，并将此作为能量函数的线索，通过能量函数最小化的框架，利用最大流最小割 (max flow/min cut) 定理进行求解，达到目标分割的目的，提高分割精度。

3.1. 能量函数框架

给定一幅图像I，分别定义$\{ {I_i}\} $和$\{ {l_i}\} $为图像中的像素集和所对应的标签。当任一像素I_i属于目标时，则${l_i} = 1$，反之${l_i} = 0$。最佳的分割结果为最小化能量函数：

$$ \begin{array}{l} \mathop {\arg \min }\limits_L E(L) = \mathop {\arg \min }\limits_L \left( {\sum\limits_{i \in I} {\sum\limits_k {{\lambda _k}{\Phi _k}({l_i}, {I_i}) + } } } \right.\\ \left. {\sum\limits_{(i, j) \in \Omega } \Psi ({l_i}, {l_j}, {I_i}, {I_j})} \right) \end{array} $$

(7)

式中，E (L) 为能量函数；Φ_k表示不同的线索函数；${\lambda _k} > 0$为相对应的关注因子，并且$\sum\limits_k {{\lambda _k}} = 1$。线索函数评估了在不考虑其他像素的情况下，每个像素i属于l_i的概率。定义${\Phi _k}({l_i}, I) = \log (p({l_i}|{f_k}({I_i})))$，其中函数${f_k}( \cdot )$将输入图像映射到不同的特征空间。本文采用两个特征空间，分别为目标表观特征 (object appearance cue) 和目标显著性特征 (object salient cue)。函数Ψ为相关能量函数，表示相邻两个元素的相关程度，Ω选取其4领域范围。

根据文献[6]，相关能量函数定义为：

$$ \Psi ({l_i}, {l_j}, {I_i}, {I_j}) = \delta ({l_i} \ne {l_j})\frac{{\varepsilon + {{\rm{e}}^{-\xi {{\left\| {{I_i}-{I_j}} \right\|}^2}}}}}{{1 + \varepsilon }} $$

(8)

式中，$\varepsilon = 1$；$\xi = \frac{1}{{2\left\langle {{{\left\| {{I_i}-{I_j}} \right\|}^2}} \right\rangle }}$；$\left\langle \cdot \right\rangle $为期望算子；函数$\delta ( \cdot )$为狄拉克δ函数。

3.2. 目标表观特征

基于目标与背景的直方图为图像中每个像素建立颜色的概率分布。本文根据上一帧分割的结果，在YUV空间中分别建立目标与背景的颜色直方图，并且将此直方图通过高斯滤波器进行平滑。

3.3. 目标显著性特征

根据式 (3) 求得的表达子Z为图像中每个超级像素建立概率模型，使得待分割图像中的目标能够具有较大的概率。

通过式 (2) 可知，表达子Z表明了当前图像的所有样本集与模板集的相似程度。矩阵Z中的任意元素Z_ij越大，表明模板集中的第i个元素 (矩阵${\boldsymbol{D}^{t-1}}$中的第i列) 与样本集中的第j个元素 (矩阵X中的第j列) 越相似。从图 1可以看出，对于矩阵Z中的任意一列z_i，可以分解成，其中${\boldsymbol{z}}_i^O$表示矩阵X中第i列与矩阵${\boldsymbol{D}^O}$中各个元素的相似程度，${\boldsymbol{z}}_i^B$表示矩阵X中第i列与矩阵${\boldsymbol{D}^B}$中各个元素的相似程度。根据以上分析，在当前帧中，定义元素i属于目标的概率为：

$$ {T_i} = \exp \left( { - \frac{{\max (\left| {{\boldsymbol{z}}_i^B} \right|)}}{{\max (\left| {{\boldsymbol{z}}_i^O} \right|)}}} \right) $$

(9)

式中，|·|表示将向量中的所有元素取绝对值，函数max (·) 返回向量中最大的一个数。为了获得基于像素的概率分布，本文在进行计算时，超级像素Sⁱ中所包含的所有像素值均为Tⁱ。

3.4. 能量函数最小化求解与图像分割

通过目标表观特征和目标显著性特征可以将图像分别映射到两个不同的特征空间，分别构建两个线索函数，并结合式 (8) 创建能量函数。根据文献[16]，式 (7) 可以通过图分割的方式进行优化求解，达到目标分割的目的。为了提高分割精度，本文采用了文献[17]的方法，利用形态学的理论，在每次分割的基础上，对分割结果进行膨胀与腐蚀操作，建立新的粗略划分 (trimap)，利用GrabCut^[18]的方法对图像进行多次分割，提高图像的分割精度。

5. 结束语

本文通过矩阵的低秩稀疏表达提出了一种在线的目标分割算法。将已知目标图像进行过分割，提取每个超级像素的L2ECM特征，建立模板集。对待分割图像进行相对于模板集的线性表达；利用视频图像的连续性和噪声的稀疏性，对线性表达方程添加低秩和稀疏约束，将目标的显著性问题转化为方程的低秩稀疏优化问题；进而通过能量最小化框架，将图像的多种信息融合，达到像素级目标跟踪与分割的目的。在实验部分本文将该算法与已有的目标分割算法进行比较，提高了在线算法的分割精度。

但从本文的分析中可知，超级像素的大小会影响目标的显著性特征；并且能量最小化框架中不同特征的关注系数对于不同的图像环境影响较大。如何实现这些参数的自适应算法将是未来工作的重点。

参考文献 (18)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

矩阵的低秩稀疏表达在视频目标分割中的研究

doi: 10.3969/j.issn.1001-0548.2017.02.008

作者简介:
顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究

Video Object Segmentation Via Low-Rank Sparse Representation

计量

矩阵的低秩稀疏表达在视频目标分割中的研究

doi: 10.3969/j.issn.1001-0548.2017.02.008

1. 电子科技大学通信与信息工程学院成都 611731

2. 成都航空职业技术学院航空工程学院成都 610100

3. 电子科技大学电子工程学院成都 611731

作者简介:
顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究

English Abstract

Video Object Segmentation Via Low-Rank Sparse Representation

全文HTML

2.1. 模板的建立

2.2. 低秩稀疏表达

2.3. 式 (3) 的求解

3.1. 能量函数框架

3.2. 目标表观特征

3.3. 目标显著性特征

3.4. 能量函数最小化求解与图像分割

4.1. 矩阵的低秩稀疏表达

4.2. 对比实验

目录

期刊在线

编辑办公

友情链接

留言板

矩阵的低秩稀疏表达在视频目标分割中的研究

doi: 10.3969/j.issn.1001-0548.2017.02.008

作者简介: 顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究

Video Object Segmentation Via Low-Rank Sparse Representation

计量

出版历程

矩阵的低秩稀疏表达在视频目标分割中的研究

doi: 10.3969/j.issn.1001-0548.2017.02.008

1. 电子科技大学通信与信息工程学院 成都 611731 2. 成都航空职业技术学院航空工程学院 成都 610100 3. 电子科技大学电子工程学院 成都 611731

作者简介: 顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究

English Abstract

Video Object Segmentation Via Low-Rank Sparse Representation

全文HTML

2.1. 模板的建立

2.2. 低秩稀疏表达

2.3. 式 (3) 的求解

3.1. 能量函数框架

3.2. 目标表观特征

3.3. 目标显著性特征

3.4. 能量函数最小化求解与图像分割

4.1. 矩阵的低秩稀疏表达

4.2. 对比实验

目录

期刊在线

编辑办公

友情链接

作者简介:
顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究

1. 电子科技大学通信与信息工程学院成都 611731

2. 成都航空职业技术学院航空工程学院成都 610100

3. 电子科技大学电子工程学院成都 611731

作者简介:
顾菘 (1977-), 男, 博士, 主要从事数字图像处理方面的研究