手写体笔迹识别是根据笔迹对书写者进行身份认证的一种基于生物行为的识别技术,已在安防、金融等领域得到了广泛的应用,并逐渐成为计算机视觉和模式识别领域中的研究热点。通常根据笔迹是否与文本的内容相关,将其分为与文本相关的脱线笔迹识别和与文本无关的脱线笔迹识别两类。与文本无关的脱线笔迹识别克服了前者与书写内容相关的不足,在实际应用中具有制约少、数据易获取等特点,已得到广泛的应用。
1 研究现状与文本无关的脱线笔迹识别方法主要有局部特征方法和全局特征方法,局部方法主要通过建立笔迹字典等作为身份鉴别的依据[1]。全局方法将文本图像的内容笔迹视作纹理,提取其纹理特征作为识别依据[2]。文献[2]认为书写者的笔迹特征变化主要表现在傅里叶谱的低频部分,提出了利用傅里叶变换(FFT)结合KL变换来进行笔迹识别。文献[3]提出了利用FFT结合谱分析的方法进行笔迹识别。文献[4]提出了应用2D-Gabor结合欧式权距离(WED)分类器来进行笔迹身份识别。文献[5]提出了轮廓波变换(CT)结合广义高斯分布(GGD)模型的中文笔迹身份识别方法。文献[6]提出了基于小波分解(DWT)结合GGD模型方法做身份识别。文献[7]提出了利用传统金字塔小波变换结合隐马尔科夫树模型(HMT)的方法对中文笔迹进行身份识别。文献[8]提出了利用对偶树复小波(DTCWT)变换和GGD相结合的方法。文献[9-10]提出了利用抗混叠轮廓波(NACT)结合GGD和金字塔复方向滤波器组(PDTDFB)结合GGD的方法。
以上方法处理的数据是正常情况下获取的文本图像(无褶皱),如图 1a所示。但是在实际应用中,获取的笔迹文本图像可能是对褶皱纸张扫描后获取的文本图像,如图 1b所示。因纸张褶皱所产生的笔迹会出现一定程度的平移和局部弹性形变,造成相同的文本图像存在一定的视觉差异,如图 1a和图 1b所示,即在褶皱笔迹文本图像中,笔迹产生了局部平移和局部形变等变化,直接影响了褶皱情况下的笔迹身份识别,所以对褶皱中文笔迹身份进行鉴别,其描述特征应具有局部平移不变性和局部形变不变性。
文献[2-10]采用不同时频分析工具对文本图像进行特征提取,但这些方法均不能同时满足时移不变性和局部弹性形变稳定性。如文献[2-3]采用FFT变换具有时移和频移性,且对形变不稳定;文献[4]采用的2D-Gabor是小波的一种,但不具有形变稳定性;文献[5]采用了CT方法,CT致力于构建最优逼近意义下的高维函数表示方法,能够稀疏地表示纹理图像的奇异结构特征,但不具有时移不变性和局部弹性形变稳定性;文献[6-7]采用的DWT不具有局部弹性形变稳定性和时移不变性;文献[8]采用DTCWT方法;DTCWT虽具有时移不变性,但不具有局部弹性稳定性;文献[9]使用NACT方法,是对CT的改进,但不满足局部弹性稳定性和时移不变性;文献[10]采用PDTDFB方法,具有近似时移不变性,但不具有局部弹性稳定性,所以均难以处理褶皱笔迹身份鉴别问题。
散射变换是在小波的基础上提出的新理论[11],已在纹理识别、语音分析得到了应用[12-13]。散射变换具有平移不变性和弹性形变稳定性,能够满足处理褶皱情况下的笔迹识别的要求,所以本文使用散射变换来提取笔迹文本图像的全局特征方法,提出了基于散射变换的Gamma模型来解决褶皱情况下的脱线笔迹鉴别问题,其流程框架如图 2所示。
散射变换(Scatter)是文献[11]提出的基于小波变换的方法,采用多尺度小波变换提取图像底层结构特征,能有效地提取不同尺度和方向上图像共生信息,具有局部平移不变性、弹性形变稳定性和光照不敏感性等优点,其框架如图 3所示。
在散射变换中第一阶散射变换的构造如下:
$\left| {f*{\psi _{j,\gamma }}} \right|*{\phi _J}(x)$ | (1) |
式中,
$\left| {\left| {f*{\psi _{{j_1},{\gamma _1}}}} \right|*{\psi _{{j_2},{\gamma _2}}}} \right|*{\phi _J}(x)$ | (2) |
式(2)中丢失的高频信息又可通过下一轮的小波再分解得以恢复,则第q阶散射变换为:
$ {{S}_{q,J}}f(x)={{\left( \left| \left| \left| f*{{\psi }_{{{j}_{1}},{{\gamma }_{1}}}} \right|*...* \right|{{\psi }_{{{j}_{q}},{{\gamma }_{q}}}} \right|*{{\phi }_{J}}(x) \right)}_{\begin{smallmatrix} {{j}_{1}} < {{j}_{2}}\cdots < {{j}_{q}} < J \\ ({{\gamma }_{1}},{{\gamma }_{2}},\cdots ,{{\gamma }_{q}})\in {{\mathit{\Gamma } }^{q}} \end{smallmatrix}}} $ | (3) |
散射表达包括所有尺度和方向的散射系数,有:
${S_J}f(x) = \sum\limits_{q = 0}^m {{S_q}_{,J}f(x)} $ | (4) |
若小波变换的方向数为C,则第q阶散射变换沿频率递减的路径数为
1) 输入图像
2) 由式(4)计算图像的散射表达式
设
for
for
for
end for
end for
end for
3) 特征向量
小波变换系数是服从GGD模型的,并成功地应用于手写体身份鉴别[15]。复小波是将单小波的构造空间扩展到复数域,构造出的小波不仅保持了传统小波变换良好的时域局部化特征,具有方向性、时域敏感性和相位信息,在散射变换中,本文选择复小波进行变换。由式(1)可知,在散射变换过程中,原图像
为验证上述结论,本文设计了实验进行验证,对散射系数的直方图分布与DTCWT系数模的直方图进行对比研究和分析。随机选取一张图片,其在不同褶皱情况下的笔迹文本图像进行散射变换,如图 4b~图 4c所示,对应的2阶散射变换系数特定子图的直方图如图 4d~图 4f所示,通过观察可看出散射变换系数的直方图服从Gamma分布。
从Handwriting图像数据库中随机选择了40幅图像进行实验(分解级数为2级),使用DTCWT和Scatter对图像进行变换,按照式(5)定义变换系数的拟合度,分别计算DTCWT系数模的拟合度和Scatter系数的拟合度,其实验结果如表 1所示,有:
$y = \frac{1}{N}\sum\limits_{i = 1}^N {(h({u_i}) - h'({u_i}))} $ | (5) |
通过表 1可知,Scatter系数在不同褶皱情况下,Gamma模型的拟合度的均值和方差都小于Weibull模型,说明使用Gamma能够更好地拟合褶皱笔迹的Scatter系数;Scatter系数的拟合度的均值和方差与DTCWT系数模的拟合度相差较小,说明Scatter系数的直方图分布函数同DTCWT系数的模直方图分布函数一样近似逼近Gamma模型,与本文结论一致。
4 Gamma模型Gamma分布的概率密度函数为:
$p(x|\alpha ,\beta ) = \frac{{{\beta ^{ - \alpha }}{x^{\alpha - 1}}}}{{\mathit{\Gamma } (\alpha )}}\exp \left\{ { - \frac{x}{\beta }} \right\}$ | (6) |
式中,Г(α)为Gamma函数,当
$ \hat{\alpha }={{\left( {{\bar{x}}}/{s}\; \right)}^{2}},\ \ \ \ \ \ \ \ \ \hat{\beta }={{{s}^{2}}}/{{\bar{x}}}\; $ | (7) |
式中,
针对每幅图像各子带上估计的参数
针对Copula模型的概率密度
${D_{{\rm{MC}}}}({\rho _1}||{\rho _2}) \approx \frac{1}{n}\sum\limits_{i = 1}^n {\log {\rho _1}({x_i}) - \log {\rho _2}({x_i})} $ | (8) |
式中,
因
$ {{D}^{s}}_{\rm{MC}}({{\rho }_{1}}||{{\rho }_{2}})={({{D}_{\rm{MC}}}({{\rho }_{1}}||{{\rho }_{2}})+{{D}_{\rm{MC}}}({{\rho }_{2}}||{{\rho }_{1}}))}/{2}\; $ | (9) |
因计算的距离将随着n的不同而变化,为平衡计算时间和效果,式(8)中选择
针对无褶皱情况下的手写体笔迹鉴别问题,文献[9]中的NACT解决了CT中两个低通滤波器的基函数缺乏局部化能力而导致的频谱混叠现象[9],其实验结果优于文献[5-8]方法的实验结果,文献[10]中的PDTDFB方法结合了不可分离的方向滤波器组,具备小波所不能表达的多方向特性,能够有效地捕捉图像的边缘轮廓信息,且具有近似平移不变性,其实验结果也优于文献[5-8]方法的实验结果。另外,剪切波(Shearlet)是一种继承曲线波和轮廓波优点的新型多尺度几何分析工具,通过对基本函数缩放、剪切和平移等仿射变换生成具有不同特征的剪切波函数。对于二维信号,剪切波不仅可以检测到所有的奇异点,而且可以自适应跟踪奇异曲线的方向,且随着尺度参数变化,可精确描述函数的奇异性特征。DNST[16]利用了非独立紧支撑Shearlet算子,对图像的多尺度各向异性进行性稀疏编码,改善了Shearlet的方向选择性,在图像分割的效果上优于独立Shearlet结果[16]。综合以上已有的理论结果,本文的实验选取NACT、PDTDFB、DNST和CT方法作为比较对象。
5.2 相关参数和数据 5.2.1 实验参数文献[11]的研究结果表明,散射系数中超过99%的能量集中在
首先将所有的手写体文本以300 dpi的分辨率扫描进计算机,采用512×512像素作为本文处理文本图像的大小。实验选用了由50个人所书写的手写体文本进行预处理(使每个汉字的大小统一),每人有书写不同内容的两幅图像,这样共有100幅手写体文本图像。对这些图像进行不同程度的褶皱处理,分别得到无褶皱、轻度褶皱和重度褶皱手写体文本图像各100幅。
5.3 实验具体步骤为了验证本文方法的有效性,本文设计了两个实验进行说明。
实验 1 从HandWriting图像数据库中选取某个书写者对应的40幅图像进行了实验,分别计算Scatter的二阶系数、NACT的三级分解系数、PDTDFB的三级分解系数、DNST的三级分解系数、CT的三级分解系数,然后使用Gamma模型对Scatter系数进行参数估计,使用GGD模型对NACT系数、PDTDFB系数、DNST系数和CT系数进行参数估计,最后对拟合出的参数α、β进行统计分析,得出其均值、方差,结果如表 2所示。
实验 2 实验中将不同褶皱情况下的300幅图像称为父图,在原图像(父图)基础上,以字符为单位随机排列形成20幅512×512像素的子图像,这样得到正常文本图像集、轻度褶皱文本图像集和重度褶皱图像集。按照图 2的流程图进行实验,结果如表 3所示。
为评价本文方法的有效性,采用综合检索率作为评价标准,有:
$S = \frac{1}{M}\sum\limits_{i = 1}^{\rm{M}} {{{{R_i}} / K}} $ | (10) |
式中,K为属于同一个书写者的样本数目;Ri为每次相似计算结果中,前K个距离最小的样本与被测试样本中属于同一个书写者的数目;M为所有样本数。
5.4 实验结果与分析 5.4.1 实验结果分析由表 2可得,参数α、β比较如下:无褶皱情况下,PDTDFB系数、NACT系数、DNST系数和CT系数的拟合参数α的方差分别为Scatter的2.85×104倍、3.44×104倍、5.26×102倍、1.29×104倍,拟合参数β为Scatter的6.39×102倍、5.96×102倍、1.76×104倍、5.54×102倍;轻度褶皱情况下,PDTDFB系数、NACT系数、DNST系数和CT系数的拟合参数α的方差分别为Scatter的5.63×102倍、8.68×102倍、1.88×102倍、2.01×102倍,拟合参数β为Scatter的7.88×104倍、9.02×104、1.18×106倍、9.55×105倍;在重度褶皱情况下,PDTDFB系数、NACT系数、DNST系数和CT系数的拟合参数α的方差分别为Scatter的7.12×102倍、1.02×103倍、4.5×102倍、1.04×102倍,拟合参数β为Scatter的1.10×104倍、1.16×104倍、1.60×105倍、6.59×104倍。
综合实验结果可得,在不同褶皱情况下,NACT系数、PDTDFB系数、DNST系数和CT系数的拟合参数的均值和方差均大于散射系数拟合参数的均值和方差。其中α为尺度参数,模拟了系数直方图的峰值的宽度,β为形状参数,反比例于直方图中定点的下降速率,因此方差越小,直方图所表示的特征之间的相似度越高。因为Scatter的变换系数的拟合参数的方差最小,所以Scatter系数所表示的同类特征相似程度高,能够较好地表示褶皱笔迹文本特征。
从表 3可知,Scatter的效果要明显优于NACT、PDTDFB、DNST和CT的识别结果。取NACT、PDTDFB、DNST和CT的最好效果作为比较对象,无褶皱情况下,Scatter的识别率比NACT、PDTDFB、DNST和CT分别高15.4%、15.7%、22.2%、21.0%;轻度褶皱情况下,Scatter的识别率比NACT、PDTDFB、DNST和CT分别高18.3%、18.6%、19.3%、28.6%;重度褶皱情况下,Scatter的识别率比NACT、PDTDFB、DNST和CT分别高27.9.1%、29.1%、38.8%、32.2%。综合检索率结果可得,Scatter的平均检索率比NACT、PDTDFB、DNST和CT分别高22.5%、29.76%、29.8%、30.92%。
5.4.2 实验结果理论分析1) 散射变换具有平移不变性和形变稳定性。
小波变换不具有平移不变性,为了取得平移不变性,与SIFT方法相似,需要对小波系数进行平均;但由于
因褶皱文本图像的笔画信号存在平移、旋转等刚性形变和局部弹性形变,所构建的相似度度量应具有相应的不变性。CT是二维图像的一种稀疏表示方法,沿着图像轮廓边缘用最少的系数表示曲线,能够很好地表示边缘和纹理信息,但不具有平移不变性和局部弹性形变稳定性,不能很好地抵抗刚性形变和局部弹性形变;NACT只是对CT的频域局部化能力的改进,不具有平移不变性和局部弹性形变稳定性;PDTDFB和DNST虽具有近似平移不变性,但与散射变换相比,其局部弹性形变稳定性差,难以有效地表示图像结构变化的相似性特征。所以与NACT、PDTDFB、CT和DNST相比,Scatter可更好地描述褶皱文本图像的特征。
2) Scatter比PDTDFB、NACT、CT冗余度高。
PDTDFB、NACT、CT和散射变换均是冗余变换。本文从笔迹文本图像集中随机选取一幅图像,分别使用Scatter、PDTDFB、NACT、CT对其进行变换,通过计算得出Scatter系数数目是原图像大小的3倍,PDTDFB系数数目是原图像大小的2.641倍,NACT系数数目为原图像大小的1.315倍,CT系数数目为原图像大小的1.313倍,所以散射变换比PDTDFB、NACT、CT的冗余度高,其携带的有效信息相应增多,能够更好地表示图像的全局统计特性,同时也增加了计算复杂度。
6 结论在提取褶皱笔迹文本图像特征方面,本文利用Scatter比NACT、PDTDFB、DNST、CT提取出的特征更有效的特点,从Scatter的变换系数出发,利用Gamma模型,蒙特卡罗方法和KL距离相结合的方法,进行脱线中文手写体识别。通过理论分析和实验证明,本文的方法在针对中文手写体识别的精确性方面优于基于NACT、PDTDFB、DNST、CT的GGD方法,尤其在褶皱情况下,该方法的识别准确率优于其他方法,但本文提出基于Scatter的方法不能够很好地抵抗图像的旋转与缩放[13],需要在未来的研究中不断改进,为以后的图像识别研究提供基础。
[1] |
李昕, 丁晓青, 彭良瑞. 一种基于微结构特征的多文种文本无关笔迹鉴别方法[J].
自动化学报, 2009, 35(9): 1199–1208.
LI Xin, DING Xiao-qing, PENG Liang-rui. A microstructure feature based text-independent method of writer identification for multilingual handwritings[J]. Acta Automatica Sinica, 2009, 35(9): 1199–1208. |
[2] |
DUVERNOY J. Handwriting synthesis and classification by means of space-variant transform and density and Karhunen -Loeve analysis[J].
J Opt Soc Am, 1975, 65: 1331–1336.
DOI:10.1364/JOSA.65.001331 |
[3] |
KUCKUCK W. Writer identification by spectra analysis[C]//Proc Int Conf Security Through Science Engineering. West Berlin, Germany: IEEE, 1980: 1-3.
|
[4] |
SAID S H E, TAN T N, BAKER K D. Personal identification base on handwriting[J].
Pattern Recognition and Artificial Intelligence, 2000, 33(1): 149–160.
|
[5] |
HE Z Y, TANG Y Y. Chinese handwriting-based writer identification based on contourlet[C]//IEEE International Conference on Systems, Man, and Cybernetics (IEEE SMC 2005). Hawaii, USA: IEEE, 2005: 1058-1063.
|
[6] |
HE Z, YOU X, TANG Y Y, et al. Handwriting-based personal identification[J].
Pattern Recognition and Artificial Intelligence, 2006, 20(2): 209–225.
DOI:10.1142/S0218001406004612 |
[7] |
HE Zhen-yu, YOU Xin-ge, YUAN Yan-tang. Writer identification of Chinese handwriting documents using hidden Markov tree model[J].
Pattern Recognition, 2008, 41(4): 1295–1307.
DOI:10.1016/j.patcog.2007.08.017 |
[8] |
XU Da-yuan, SHANG Zhao-wei. Hand writing-based writer identification with complex wavelet[C]//International Conference on Wavelet Analysis and Pattern Recognition (ICWAPR). HongKong, China: IEEE, 2008: 597-601.
|
[9] |
朱贝贝, 尚赵伟. 抗混叠轮廓波变换的脱线中文手写体笔迹识别[J].
计算机工程与应用, 2011, 47(24): 150–153.
ZHU Bei-bei, SHANG Zhao-wei. Offline Chinese handwriting-based writer identification with non-aliasing contourlet transform[J]. Computer Engineering and Applications, 2011, 47(24): 150–153. DOI:10.3778/j.issn.1002-8331.2011.24.042 |
[10] |
朱贝贝. 脱线中文手写体笔迹识别[D]. 重庆大学, 2011: 28-36.
ZHU Bei-bei. Offline Chinese handwriting-based writer identification[D]. Chongqing: Chongqing University, 2011: 28-36. |
[11] |
MALLAT S, BRUNA J. Classification with scattering operators[C]//IEEE Conference Computer Vision and Pattern Recognition(CVPR). Colora Springs, USA: IEEE, 2011: 1561-1566.
|
[12] |
MALLAT S. Multiscale scattering for audio classification[C]//Proceedings of ISMIR 2011 Conference. Miami, Florida, USA: IEEE, 2011: 657-662.
|
[13] |
MALLAT S. Invariant scattering convolution networks[J].
IEEE Transactions PAMI, 2013, 35(8): 1872–1886.
DOI:10.1109/TPAMI.2012.230 |
[14] |
KWITT R, UHL A. A joint model of complex wavelet coefficients for texture retrieval[C]//IEEE International Conference on Image Processing(ICIP). Cairo, Egypt: IEEE, 2009: 1857-1860.
|
[15] |
KWITT R, ANDREAS U A. Lightweight probabilistic texture retrieval[J].
IEEE Transactions on Image Processing, 2010, 19(1): 241–253.
|
[16] |
LIM W Q. Nonseparable shearlet transform[J].
IEEE Transactions on Image Processing, 2013, 22(5): 2056–2065.
DOI:10.1109/TIP.2013.2244223 |