-
测谎,是对谎言的鉴别活动。从心理学角度,测谎技术分为准绳问题测试法与犯罪情景测试法(guilty knowledge technique, GKT)。后者主要是测试犯罪嫌疑人大脑中是否留有犯罪人应当留有的有关犯罪行为的记忆痕迹。该技术的心理基础是认知心理。P300是事件相关电位(event-related potential, ERP)[1]中的一种内源性成份,出现在刺激后300~800 ms时间窗口内的一个正向波[2],主要反映了受试者的思维与决策过程。利用GKT技术进行测谎的原理是与案情相关的事物会引起罪犯进行更大的信息加工,从而引出高幅值ERP,而无辜者则相反。1987年,文献[3]首次利用事件相关电位进行测谎并获得实验上的成功。国内的作者也基于P300成分证明了测谎的可能性[4]。
研究表明,大脑神经元活动及其脑电(EEG)都表现为非线性动力学低维混沌特征[5]。近几年,脑电研究人员开始探索脑电信号的非线性特征——复杂度。复杂度的最初算法实现由文献[6]给出,称为算法复杂度,又称柯尔莫哥洛夫复杂度(kolmogorov complexity, KC),简称KC复杂度。将KC复杂度用于脑电分析,可以刻画并区分不同状态下的脑电序列的复杂度[7]。近年来,研究人员又提出了其他复杂性测度。文献[8]引入了近似熵(approximate entropy, ApEn)理论,近似熵描述的是一维序列进行多维空间重构后,维数由m增加至m+1时产生新模式的可能性大小,利用该算法,只需少量数据就可得出稳定的数值。文献[9]提出了样本熵的概念,进一步提高了熵值算法的准确度。
目前为止,将脑电信号的复杂度特征用于谎言识别是否有效的研究还未见报道,基于GKT协议及脑电信号的P300成分,本文提出对说谎者和诚实者的脑电信号提取复杂度特征进行识别的方法。研究中,选用了广泛应用的3种典型的复杂度指标:KC复杂度、近似熵和样本熵,分别对两类受试者的多导脑电信号进行特征提取,最后使用分类器对两类受试者的特征样本进行分类,本研究的脑电信号处理基本流程如图 1所示。
-
本文选取3种典型复杂性测度算法,其中,KC复杂度是把时间序列二值化为符号序列,然后对序列反复进行如下操作:每次添加一个元素构成一个检验子串,如果该子串在除去最后添加的那个元素之前所构成的序列中已经出现过,那么所构成的新序列的复杂度维持不变,并继续添加元素,直到上述情况未出现,复杂度增加1,继续添加元素并建立新的检验子串,如此反复进行,直到结束[10]。KC复杂度反映了给定序列随其长度的增长出现新模式的速率,即序列接近随机的程度。
Shannon熵理论用于复杂度刻画的理论基础即熵值越低,时间序列的自我相似性越高,反之则序列随机性越强,序列复杂度越高。样本熵与近似熵的最大区别就是无需进行自身模板匹配。本文仅对样本熵算法步骤描述如下:
1) 将信号表达为一个N点的时间序列:
$$\{ {\boldsymbol{a}}(j)|1 \le j \le N\} $$ (1) 2) 构造一组m维向量:
$${{\boldsymbol{X}}_m}(1),{{\boldsymbol{X}}_m}(2), \cdots ,{{\boldsymbol{X}}_m}(N - m)$$ (2) 其中,
$${{\boldsymbol{X}}_m}(i) = \{ {\boldsymbol{a}}(i + k)|0 \le k \le m - 1\} $$ (3) 3) 定义两个向量${{\boldsymbol{X}}_m}(i),{{\boldsymbol{X}}_m}(j)$之间的距离为分量之间的最大距离:
$$\begin{array}{c} d[{{\boldsymbol{X}}_m}(i),{{\boldsymbol{X}}_m}(j)] = \max \{ |{\boldsymbol{a}}(i + k) - {\boldsymbol{a}}(j + k)|\\ 0 \le k \le m - 1,{\rm{ }}i;j = 1,2, \cdots ,N - m,j \ne i\} \end{array}$$ (4) 4) 给定一个r值,然后对每个i统计$d[{{\boldsymbol{X}}_m}(i),{{\boldsymbol{X}}_m}(j)]$中小于r×SD(SD中序列的标准差)数目${N^m}(i)$,并计算${C^m}(r)$:
$${C^m}(r) = {(N - m + 1)^{ - 1}}\sum\limits_{i = 1}^{N - m} {C_i^m(r)} $$ (5) 式中,$C_i^m(r) = {N^m}(i)/(N - m)$。
5) 增加维数至m+1,重复上述步骤,计算$C^{m + 1}(r)$:
$$C_{}^{m + 1}(r) = {(N - m)^{ - 1}}\sum\limits_{i = 1}^{N - m} {C_i^{m + 1}(r)} $$ (6) 6) 样本熵定义为:
$${\rm{SampEn}}(m,r) = \mathop {\lim }\limits_{N \to \infty } \{ - \ln [{C^{m + 1}}(r)/{C^m}(r)]\} $$ (7) 可见,样本熵的计算与参数m和r有关,m值越大,计算量越大,耗费时间越长;r值越小,噪声对结果的影响越显著,表示对序列自相似匹配程度要求越高。一般经验,对应N =1 000时,可以设m = 3,r可以在0.1~0.25之间选择[11]。
-
图 2为随机抽取的一名说谎者和一名诚实者在列举的6个极上的ERP波形,可以看出在这些电极上说谎者的ERP波形相对诚实者的ERP波形,P300特征都更为明显。
-
分别针对3种复杂度指标应用t-test统计检验(由于多重检验,使用了Bonferroni校正,即p < 0.01/12),测试两类受试者在各个电极上是否存在显著差异。表 1列举了12个电极上的两类受试者的3种复杂度指标的统计显著值。从表中可以看出,样本熵在更多的电极上存在显著差异。显著差异的电极有6个,分别是:P3、Pz、P4、C3、Cz、Oz。近似熵指标上达到显著差异的电极数为4个,分别是:P3、Pz、C3、C4。KC复杂度指标上达到显著差异的电极数为4个,分别是:F4、P4、C3、C4。
表 1 在各个电极上的3种复杂度指标的统计分析(显著差异)
复杂度指标 显著差异性 F3 Fz F4 P3 Pz P4 C3 Cz C4 O1 Oz O2 样本熵 ○ ○ ○ * ** * ** * ○ ○ * ○ 近似熵 ○ ○ ○ * * ○ * * ○ ○ ○ ○ KC复杂度 ○ ○ * ○ ○ * ** ○ * ○ ○ ○ “**”代表两类受试者在该电极上的复杂度指标存在显著差异(p < 0.01/12);“*”代表两类受试者在该电极上的复杂度指标存在显著差异(p < 0.05/12);“○”代表受试者在该电极上的复杂度指标不存在显著差异。
针对每一种复杂度指标,构建分类模型:即将显著差异电极上的两类受试者的复杂度值取出,构成特征向量、对KC复杂度、近似熵及样本熵,3种分类模型的特征向量的维数分别为4、4及6。文中分别将3种分类模型称为KC复杂度模型、近似熵分类模型及样本熵分类模型。
对支持向量机分类器,首先取惩罚因子C和RBF核函数($K(x,y){\rm{ = }}{{\rm{e}}^{ - {\rm{1/2*}}\left\| {x - y} \right\|/{\sigma ^{\rm{2}}}}}$,Burges,1998) 的参数σ通过下列网格C=[2-5, 2-4, …, 28]和σ=[2-5, 2-4, …, 28](步长为2) 进行训练,得到最佳参数。然后使用十则交叉验证,对每则的训练样本集进行训练,得出训练敏感度及特异度,记为:TRsen及TRspe。最后,将对应的测试样本集送入到训练好的分类器中,得出测试敏感度及特异度,记为:TEsen及TEspe,因此,通过十则交差验证,对于训练和测试,均可以得到10对敏感度及特异度,分别计算敏感度及特异度的均值及标准差(standard deviation, SD),将它们显示在表 2中。
表 2 3种分类模型的分类表现(准确率)
分类模型 准确率/% 训练 测试 TRsen±SD TRspe±SD TEsen±SD TEspe±SD 样本熵模型 92.77±2.40 93.00±3.06 91.18±2.51 91.52±2.92 近似熵模型 88.33±2.55 89.17±3.70 87.87±3.06 84.52±3.46 KC复杂度模型 74.43±4.23 72.11±4.54 74.00±4.32 72.12±4.59 表 2可见,样本熵分类模型的训练及测试准确率均明显高于其他两种复杂度指标的分类模型(不同分类模型之间的准确率进行t-test统计检验,均具有显著差异,p < 0.01);同时也发现样本熵与近似熵分类模型之间的准确率的差别较KC复杂度之间的准确率差别更小,即样本熵与近似熵分类模型的准确率更为接近;实验结果也发现KC复杂度模型相对于其他两种分类模型,标准差更大,即该复杂度指标产生的分类准确率波动性更大,推测应该是该复杂度指标相对于其他两种复杂度指标,更易受到噪声的干扰所致。通过计算,最后得到基于样本熵的分类模型的平均测试准确率为91.35%,高于基于KC复杂度模型的73.16%及近似熵分类模型的86.20%。
Study of Lie Detection Using Complexity Feature of Multichannel EEG
-
摘要: 谎言测试在刑讯侦查和心理疾病治疗中具有重要意义。为了区分是否说谎,30名受试者被随机分为诚实和说谎两组,根据脑电信号的非线性特征-复杂性测度,对他们的12导联的脑电信号提取了KC复杂度、近似熵与样本熵3种复杂度特征,通过统计分析,用两类受试者具有显著差异的多导电极上的复杂度构建特征向量,最后使用支持向量机分类识别特征样本。研究发现:3种复杂度指标中,两类受试者的样本熵特征在更多电极上存在显著差异,由它们构建的特征向量的分类准确率最高,表明样本熵可以更有效地区分诚实和说谎两种不同脑认知状态下的脑电信号,该研究为基于脑电的测谎提供了一种新的途径。Abstract: There is great significance in lie detection for the criminal investigation and psychological disease treatment. To distinguish lying, thirty subjects were divided into lying and telling-truth groups randomly and three groups of nonlinear features——complexity measures including Kolmogorov complexity, approximate entropy and sample entropy were extracted. By statistical analysis, the feature vector was constructed by using complexity on the muilti electrodes with significant difference of complexity values between the two groups of subjects. The support vector machine was used to classify and idendify feature samples. The study finds that there are more electrodes with significant difference of complexity values for the sample entropy, and the highest classification accuracy can be observed for the feature vector constructed from the sample entropy, compared with the other two featues. Experimental resutls indicate that sample entropy could be used to classify EEG signals in lying from EEG signals in telling-truth, which provides a new alternative for EEG-based lie detection method.
-
Key words:
- complexity /
- EEG /
- lie detection /
- nonlinear characteristics /
- sample entropy
-
表 1 在各个电极上的3种复杂度指标的统计分析(显著差异)
复杂度指标 显著差异性 F3 Fz F4 P3 Pz P4 C3 Cz C4 O1 Oz O2 样本熵 ○ ○ ○ * ** * ** * ○ ○ * ○ 近似熵 ○ ○ ○ * * ○ * * ○ ○ ○ ○ KC复杂度 ○ ○ * ○ ○ * ** ○ * ○ ○ ○ 表 2 3种分类模型的分类表现(准确率)
分类模型 准确率/% 训练 测试 TRsen±SD TRspe±SD TEsen±SD TEspe±SD 样本熵模型 92.77±2.40 93.00±3.06 91.18±2.51 91.52±2.92 近似熵模型 88.33±2.55 89.17±3.70 87.87±3.06 84.52±3.46 KC复杂度模型 74.43±4.23 72.11±4.54 74.00±4.32 72.12±4.59 -
[1] HERRMANN C S, RACH S, VOSSKUHL J, et al. Time-frequency analysis of event-related potentials:a brief tutorial[J]. Brain Topography, 2014, 27(4):438-450. doi: 10.1007/s10548-013-0327-5 [2] POLICH J. Attention, probability, and task demands as determinants of P300 latency from auditory stimuli[J]. Electroencephalography and clinical neurophysiology, 1986, 63(3):251-259. doi: 10.1016/0013-4694(86)90093-3 [3] ROSENFELD J P, NASMAN V T, WHALEN R, et al. Late vertex positivity in event-related potentials as a guilty knowledge indicator:a new method of lie detection[J]. International Journal of Neuroscience, 1987, 34(1-2):125-129. doi: 10.3109/00207458708985947 [4] 周亮, 杨文军, 廖四照, 等. P300用于模拟盗窃测谎的实验性研究[J].中国临床心理学杂志, 1999, 7(1):31-33. http://www.cnki.com.cn/Article/CJFDTOTAL-ZLCY901.008.htm ZHOU Liang, YANG Wen-jun, LIAO Si-zhao, et al. Using P300 in the experimental study of mock criminal in lie detection[J]. Chinese Journal of Clinical Psychology, 1999, 7(1):31-33. http://www.cnki.com.cn/Article/CJFDTOTAL-ZLCY901.008.htm [5] 徐琳, 许百华.非线性动力学脑电信号分析方法的研究与应用[J].心理科学, 2005, 28(3):761-763. http://cdmd.cnki.com.cn/Article/CDMD-10112-1015603031.htm XU ling, XU Bai-hua. A research and application of the nonlinear analysis of EEG[J]. Psychological Science, 2005, 28(3):761-763. http://cdmd.cnki.com.cn/Article/CDMD-10112-1015603031.htm [6] LEMPEL A, ZIV J. On the complexity of finite sequences[J]. IEEE Transactions on Information Theory, 1976, 22(1):75-81. doi: 10.1109/TIT.1976.1055501 [7] GRANDORI F, RAVAZZANI P. Magnetic stimulation of the motor cortex——theoretical considerations[J]. IEEE Transactions on Biomedical Engineering, 1991, 38(2):180-191. doi: 10.1109/10.76385 [8] PINCUS S M. Approximate entropy (ApEn) as a complexity measure[J]. Chaos, 1995, 5(1):110-117. doi: 10.1063/1.166092 [9] RICHMAN J S, MOOMAAN J R. Physiological time series analysis using approximate entropy and sample entropy[J]. American Journal of Physiology:Heart & circulatory physiology, 2000, 278(61):2039-2049. https://www.researchgate.net/publication/12474276_Physiological_Time-Series_Analysis_Using_Approximate_Entropy_and_Sample_Entropy [10] 孟丽艳, 赵晓宇, 姚力.语言认知EEG非线性时间序列分析[J].北京师范大学学报(自然科学版), 2005, 41(6):591-593. http://www.cnki.com.cn/Article/CJFDTOTAL-BSDZ200506010.htm MENG Li-yan, ZHAO Xiao-yu, YAO Li. A time series analysis on language cognition EEG[J]. Journal of Beijing Normal University (natural science), 2005, 41(6):591-593. http://www.cnki.com.cn/Article/CJFDTOTAL-BSDZ200506010.htm [11] 葛家怡, 周鹏, 赵欣, 等.睡眠脑电时间序列的非线性样本熵研究[J].电子器件, 2008, 31(3):972-975. http://www.cnki.com.cn/Article/CJFDTOTAL-DZQJ200803063.htm GE Jia-yi, ZHOU Peng, ZHAO Xin, et al. Research on sleep EEG time-series using nonlinear sample entropy[J]. Chinese journal of Electron Devices, 2008, 31(3):972-975. http://www.cnki.com.cn/Article/CJFDTOTAL-DZQJ200803063.htm [12] ABOOTALEBI V, MORADI M H, KHALILZADEH M A. A new approach for EEG feature extraction in P300-based lie detection[J]. Computer Methods and Programs in Biomedicine, 2009, 94(1):48-57. doi: 10.1016/j.cmpb.2008.10.001 [13] GAO Jun-feng, WANG Zhao, YANG Yong, et al. A novel approach for lie detection based on F-score and extreme learning machine[J]. Plos One, 2013, 8(6):1-12. http://europepmc.org/abstract/MED/23755136 [14] GAO Jun-feng, TIAN Hong-jun, YANG Yong, et al. A novel algorithm to enhanceP300 in single trials:Application to lie detection using F-score and SVM[J]. Plos One, 2014, 9(11):1-15. https://www.researchgate.net/publication/267753521_A_Novel_Algorithm_to_Enhance_P300_in_Single_Trials_Application_to_Lie_Detection_Using_F-Score_and_SVM [15] 丁世飞, 齐丙娟, 谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报, 2011, 40(1):2-10. http://www.juestc.uestc.edu.cn/CN/abstract/abstract1231.shtml DING Shi-fei, QI Bing-juan, TAN Hong-yan. An overview on theory and algorithm of support vector machines[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1):2-10. http://www.juestc.uestc.edu.cn/CN/abstract/abstract1231.shtml [16] 高军峰, 张文佳, 杨勇, 等.基于P300和极限学习机的脑电测谎研究[J].电子科技大学学报, 2014(2):301-305. http://www.juestc.uestc.edu.cn/CN/abstract/abstract407.shtml GAO Jun-feng, ZHANG Wen-jia, YANG Yong, et al. Lie detection study based on P300 and extreme learning machine[J]. Journal of University of Electronic Science and Technology of China, 2014(2):301-305. http://www.juestc.uestc.edu.cn/CN/abstract/abstract407.shtml