-
测谎,是对谎言的鉴别活动。从心理学角度,测谎技术分为准绳问题测试法与犯罪情景测试法(guilty knowledge technique, GKT)。后者主要是测试犯罪嫌疑人大脑中是否留有犯罪人应当留有的有关犯罪行为的记忆痕迹。该技术的心理基础是认知心理。P300是事件相关电位(event-related potential, ERP)[1]中的一种内源性成份,出现在刺激后300~800 ms时间窗口内的一个正向波[2],主要反映了受试者的思维与决策过程。利用GKT技术进行测谎的原理是与案情相关的事物会引起罪犯进行更大的信息加工,从而引出高幅值ERP,而无辜者则相反。1987年,文献[3]首次利用事件相关电位进行测谎并获得实验上的成功。国内的作者也基于P300成分证明了测谎的可能性[4]。
研究表明,大脑神经元活动及其脑电(EEG)都表现为非线性动力学低维混沌特征[5]。近几年,脑电研究人员开始探索脑电信号的非线性特征——复杂度。复杂度的最初算法实现由文献[6]给出,称为算法复杂度,又称柯尔莫哥洛夫复杂度(kolmogorov complexity, KC),简称KC复杂度。将KC复杂度用于脑电分析,可以刻画并区分不同状态下的脑电序列的复杂度[7]。近年来,研究人员又提出了其他复杂性测度。文献[8]引入了近似熵(approximate entropy, ApEn)理论,近似熵描述的是一维序列进行多维空间重构后,维数由m增加至m+1时产生新模式的可能性大小,利用该算法,只需少量数据就可得出稳定的数值。文献[9]提出了样本熵的概念,进一步提高了熵值算法的准确度。
目前为止,将脑电信号的复杂度特征用于谎言识别是否有效的研究还未见报道,基于GKT协议及脑电信号的P300成分,本文提出对说谎者和诚实者的脑电信号提取复杂度特征进行识别的方法。研究中,选用了广泛应用的3种典型的复杂度指标:KC复杂度、近似熵和样本熵,分别对两类受试者的多导脑电信号进行特征提取,最后使用分类器对两类受试者的特征样本进行分类,本研究的脑电信号处理基本流程如图 1所示。
HTML
-
图 2为随机抽取的一名说谎者和一名诚实者在列举的6个极上的ERP波形,可以看出在这些电极上说谎者的ERP波形相对诚实者的ERP波形,P300特征都更为明显。
-
分别针对3种复杂度指标应用t-test统计检验(由于多重检验,使用了Bonferroni校正,即p < 0.01/12),测试两类受试者在各个电极上是否存在显著差异。表 1列举了12个电极上的两类受试者的3种复杂度指标的统计显著值。从表中可以看出,样本熵在更多的电极上存在显著差异。显著差异的电极有6个,分别是:P3、Pz、P4、C3、Cz、Oz。近似熵指标上达到显著差异的电极数为4个,分别是:P3、Pz、C3、C4。KC复杂度指标上达到显著差异的电极数为4个,分别是:F4、P4、C3、C4。
复杂度指标 显著差异性 F3 Fz F4 P3 Pz P4 C3 Cz C4 O1 Oz O2 样本熵 ○ ○ ○ * ** * ** * ○ ○ * ○ 近似熵 ○ ○ ○ * * ○ * * ○ ○ ○ ○ KC复杂度 ○ ○ * ○ ○ * ** ○ * ○ ○ ○ “**”代表两类受试者在该电极上的复杂度指标存在显著差异(p < 0.01/12);“*”代表两类受试者在该电极上的复杂度指标存在显著差异(p < 0.05/12);“○”代表受试者在该电极上的复杂度指标不存在显著差异。
针对每一种复杂度指标,构建分类模型:即将显著差异电极上的两类受试者的复杂度值取出,构成特征向量、对KC复杂度、近似熵及样本熵,3种分类模型的特征向量的维数分别为4、4及6。文中分别将3种分类模型称为KC复杂度模型、近似熵分类模型及样本熵分类模型。
对支持向量机分类器,首先取惩罚因子C和RBF核函数($K(x,y){\rm{ = }}{{\rm{e}}^{ - {\rm{1/2*}}\left\| {x - y} \right\|/{\sigma ^{\rm{2}}}}}$,Burges,1998) 的参数σ通过下列网格C=[2-5, 2-4, …, 28]和σ=[2-5, 2-4, …, 28](步长为2) 进行训练,得到最佳参数。然后使用十则交叉验证,对每则的训练样本集进行训练,得出训练敏感度及特异度,记为:TRsen及TRspe。最后,将对应的测试样本集送入到训练好的分类器中,得出测试敏感度及特异度,记为:TEsen及TEspe,因此,通过十则交差验证,对于训练和测试,均可以得到10对敏感度及特异度,分别计算敏感度及特异度的均值及标准差(standard deviation, SD),将它们显示在表 2中。
分类模型 准确率/% 训练 测试 TRsen±SD TRspe±SD TEsen±SD TEspe±SD 样本熵模型 92.77±2.40 93.00±3.06 91.18±2.51 91.52±2.92 近似熵模型 88.33±2.55 89.17±3.70 87.87±3.06 84.52±3.46 KC复杂度模型 74.43±4.23 72.11±4.54 74.00±4.32 72.12±4.59 表 2可见,样本熵分类模型的训练及测试准确率均明显高于其他两种复杂度指标的分类模型(不同分类模型之间的准确率进行t-test统计检验,均具有显著差异,p < 0.01);同时也发现样本熵与近似熵分类模型之间的准确率的差别较KC复杂度之间的准确率差别更小,即样本熵与近似熵分类模型的准确率更为接近;实验结果也发现KC复杂度模型相对于其他两种分类模型,标准差更大,即该复杂度指标产生的分类准确率波动性更大,推测应该是该复杂度指标相对于其他两种复杂度指标,更易受到噪声的干扰所致。通过计算,最后得到基于样本熵的分类模型的平均测试准确率为91.35%,高于基于KC复杂度模型的73.16%及近似熵分类模型的86.20%。