留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

大气低频声信号识别深度学习方法研究

吴涢晖 赵子天 陈晓雷 邹士亚

吴涢晖, 赵子天, 陈晓雷, 邹士亚. 大气低频声信号识别深度学习方法研究[J]. 电子科技大学学报, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
引用本文: 吴涢晖, 赵子天, 陈晓雷, 邹士亚. 大气低频声信号识别深度学习方法研究[J]. 电子科技大学学报, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
WU Yun-hui, ZHAO Zi-tian, CHEN Xiao-lei, ZOU Shi-ya. Research on Deep Learning Method of Atmospheric Low Frequency Acoustic Signal Recognition[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
Citation: WU Yun-hui, ZHAO Zi-tian, CHEN Xiao-lei, ZOU Shi-ya. Research on Deep Learning Method of Atmospheric Low Frequency Acoustic Signal Recognition[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297

大气低频声信号识别深度学习方法研究

doi: 10.12178/1001-0548.2019297
详细信息
    作者简介:

    吴涢晖(1983-),博士,主要从事核爆探测与辐射防护方面的研究

    通讯作者: 邹士亚,Email: zsy81791@126.com
  • 中图分类号: TP391.4

Research on Deep Learning Method of Atmospheric Low Frequency Acoustic Signal Recognition

图(10) / 表(3)
计量
  • 文章访问数:  5584
  • HTML全文浏览量:  1343
  • PDF下载量:  26
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-12-25
  • 修回日期:  2020-03-17
  • 网络出版日期:  2020-09-29
  • 刊出日期:  2020-09-23

大气低频声信号识别深度学习方法研究

doi: 10.12178/1001-0548.2019297
    作者简介:

    吴涢晖(1983-),博士,主要从事核爆探测与辐射防护方面的研究

    通讯作者: 邹士亚,Email: zsy81791@126.com
  • 中图分类号: TP391.4

摘要: 针对全面禁核试低频声监测中需要对大气低频声信号进行有效识别的问题,对深度神经网络中的卷积神经网络进行了研究,提出了一种将低频声信号转换为图像,然后采用卷积神经网络进行识别,并对学习过程进行改进的方法。将该方法与基于人工设计特征的支持向量机方法进行了对比实验,实验结果表明,在训练数据集不大的情况下,通过改进学习过程的卷积神经网络可以挖掘出信号的潜在特征,具有和支持向量机同等的识别能力。

English Abstract

吴涢晖, 赵子天, 陈晓雷, 邹士亚. 大气低频声信号识别深度学习方法研究[J]. 电子科技大学学报, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
引用本文: 吴涢晖, 赵子天, 陈晓雷, 邹士亚. 大气低频声信号识别深度学习方法研究[J]. 电子科技大学学报, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
WU Yun-hui, ZHAO Zi-tian, CHEN Xiao-lei, ZOU Shi-ya. Research on Deep Learning Method of Atmospheric Low Frequency Acoustic Signal Recognition[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
Citation: WU Yun-hui, ZHAO Zi-tian, CHEN Xiao-lei, ZOU Shi-ya. Research on Deep Learning Method of Atmospheric Low Frequency Acoustic Signal Recognition[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
  • 大气低频声监测技术是中远程核爆炸探测的技术手段之一,次声监测已被联合国列入全面禁核试监测技术[1]。然而,自然界存在着多种大气低频声信号,如何对这些信号数据进行实时分析和识别,是核爆探测需要解决的一个问题,需要有效的技术方法来支持。深度学习的快速发展以及其不断提高的性能为解决这个问题提供了另外一个途径[2]

    深度学习是以神经网络为基础发展而来[3],文献[4-5]提出,具有多层结构的神经网络比浅层神经网络具有更强的学习能力,从而可以将原始输入数据中人工分析难以获取的特征信息挖掘出来。

    本文首先对核爆低频声的特征进行了分析并对机器学习中的支持向量机和卷积神经网络进行了研究,然后针对这些特征对化爆、雷电、台风的低频声信号进行了特征提取,并构造了多分类支持向量机和卷积神经网络进行识别实验,最后对学习过程进行了改进,获得了较好的性能。

    • 在大气层核爆炸的瞬间,核爆产生的能量被限制在具有极高温度、极大压力的小体积内。在不到1 µs内这种高温气体产生大量的软X射线,这些射线被周围1 m内的空气吸收,使其迅速膨胀,在约1 ms内产生一个直径超过100 m的灼热、极高的白炽状火球。火球继续以超声速膨胀,并以约100 m/s的速度缓慢上升。然后,近似球形的上升火球变成具有中心上升气流的蘑菇云。火球继续在大气中上升、冷却,直到放射性烟云的重力与其在大气中的浮力相等为止[6]

      核爆炸时不到1 s内产生强大的冲击波,在初始几秒内以超声速膨胀火球向外传播,冲击波阵面的超压是火球内部高压的2~3倍。50 s后,冲击波可传播到离爆心约20 km处[7]。大气层核爆炸产生的冲击波慢慢衰减成声波后,会发生频散现象,低频成分传播速度快而衰减慢,高频成分传播速度慢而衰减快。由于几何扩散和高频成分被大气吸收而慢慢演变成低频声信号[8]。核爆炸产生的低频声信号的波形取决于核爆当量和距离源的距离。由于高频信号比低频信号衰减得快,因此,离源很远的地方观测到的信号以长周期低频声波为主。如前所述,在离爆心约1000 km内的近场观测到的低频声信号呈现为一系列到达时间不同的波组,这是由于平流层和热电离层大气的一次或多次反射造成的。与此相反,在距离为几千km的远场,观测到的低频声波是由首先到达的兰姆波成分和随后到达的几个有层理的声波成分叠加而成的。

      根据国内外对大气层核爆炸低频声的观测与研究,其特征主要包括以下几个方面:

      1)信号的振幅与距离、爆炸当量和平流层的风速分量有关,其计算公式可以表示为[9]

      $$\lg {P_c} = 3.37 + 0.68\lg W - 1.36\lg R$$ (1)

      式中,Pc为含风干扰修正的次声监测声压,单位为Pa;W为核爆当量,单位为kT;R为监测点与爆心的距离,单位为km;

      2)信号的频率大约在0.002~20 Hz之间,对于小当量(几kt)的核爆,频率大约在0.02~4 Hz之间[10]

      3)信号的周期大约在0.01~100 s之间;

      4)由于平流层和热电离层大气一次或多次反射,以及高频信号比低频信号率减快,使得信号由几个有层理的声波成分叠加而成,出现明显的频散现象[11]

      5)波形呈“压缩式”变化。

      这些特征是对信号进行识别的基础,通过对这些特征建立相应的数学模型,计算出信号的特征值,然后进行深度学习来达到识别事件的目的。

    • 本文采用中科院声学所的InSAS2008型电容式低频声传感器在全国各地分别搭建了实验台站。实验台站由次声监测阵、数据信息处理中心和通信设备等组成。其中,次声监测阵为三元阵,每个次声传感器配置降噪管阵;数据信息处理中心负责各阵元的数据接收与处理。实验台站结构组成如图1所示。采集的样本数据共有600个,其中包含化爆数据16个,台风数据36个,闪电数据248个,噪声数据300个。

      图  1  实验台站结构组成图

      针对核爆低频声的基本特征,本文对化爆、闪电、台风3种事件的低频声信号,提取出了最大幅值、均值、方差、有效值、偏斜度、短时平均过零率、波形复杂度、频率三次矩等8种特征值组成特征向量数据集来进行机器学习实验。

      最大幅值:对原始信号进行去本底和大气扰动后,采样点数据的最大值,用Max表示。

      均值:信号各采样点数据的平均值,用μ表示。

      方差:信号各采样点数据与均值之差平方和的平均数,用σ表示。

      有效值:可以衡量信号的能量效应,用Ev表示[12]

      $${\rm{Ev}} = \sqrt {\frac{{\displaystyle\sum {{{({x_i})}^2}} }}{n}}$$ (2)

      偏斜度:衡量数据分布偏斜方向及程度,能够表示波形的分布方向,用Sc表示[15]

      $${\rm{Sc}} = \frac{{\displaystyle\sum {{{({x_i} - \mu )}^3}} }}{{{\sigma ^3}}}$$ (3)

      短时平均过零率:指每帧内信号通过零值的次数,在一定程度上可以反映信号的频率信息,用Zn表示[13]

      $${\rm{Zn}} = \frac{1}{{2N}}\left| {{\rm{sgn}} ({x_i}) - {\rm{sgn}} ({x_{i - 1}})} \right|$$ (4)

      N为采样点个数,sgn(x)为符号函数,x≥0时,sgn(x)=1,x<0时,sgn(x)=−1。

      波形复杂度:用于表示信号波形在能量分布上的复杂程度,用Cp表示:

      $${\rm{Cp }}= {{\displaystyle\int_{t = 0}^{t = L} {{f^2}(t){\rm{d}}t} }}\Bigg/{{\displaystyle\int_{t = L}^{t = H} {{f^2}(t){\rm{d}}t} }}$$ (5)

      频率三次矩:用于表示信号频谱特性,用Ft表示:

      $${\rm{Ft}} = {{\displaystyle\int_{f = L}^{f = H} {F(f){f^3}{\rm{d}}f} }}\Bigg/{{\displaystyle\int_{f = L}^{f = H} {F(f){\rm{d}}f} }}$$ (6)

      由于各维特征的计算方法不同,其值大小差异很大,在进行实验前还要分别对各特征维进行归一化处理。

    • 目前,构造支持向量机多分类模型的方法主要有两种,一种是直接构造多个分类面对所有样本进行划分,将多个分类面的参数求解合并到一个最优化问题中,通过求解多目标函数的最优化问题实现多类分类,简称直接法[14]。这种方法看似简单,但其最优化问题求解过程复杂,计算复杂度高,实现起来比较困难。另一种方法是将多分类问题分解为多个二分类问题,通过组合这些二分类器来间接实现多分类器的构造,简称间接法[15]

      由于样本数据只包括化学爆炸、闪电、台风和噪声4类数据,因此采用间接法构造分类模型,可以降低模型的计算复杂度。将支持向量机作为神经网络的隐层节点,依次分别把化学爆炸、闪电、台风和噪声作为一类,其他3类样本归为另一类,总共需要构造4个支持向量机。判别时,输入数据分别经过这4个支持向量机共得到4个输出值,将输出值经过一个线性激活函数进行比较,最大者对应类别为输入数据的类别,从而实现4类数据的识别。

      对于化学爆炸事件的识别,随机抽取12组化学爆炸特征数据作为正样本(其余4组化学爆炸特征数据用来测试),闪电、台风、噪声3类数据各随机抽取6组特征数据作为负样本,共同组成训练集对一个支持向量机进行训练,惩罚因子取0.25,选取幅值特征和均值特征进行可视化,训练结果如图2所示。

      对于闪电事件的识别,随机抽取186组闪电特征数据作为正样本(其余62组闪电特征数据用来测试),随机抽取134组噪声特征数据、全部化学爆炸和台风特征数据组成负样本,共同组成训练集对一个支持向量机进行训练,惩罚因子取0.15,选取幅值特征和均值特征进行可视化,训练结果如图3所示。

      对于台风事件的识别,随机抽取27组台风特征数据作为正样本(其余9组台风特征数据用来测试),化学爆炸、闪电、噪声3类数据各随机抽取10组特征数据作为负样本,共同组成训练集对一个支持向量机进行训练,惩罚因子取0.20,选取幅值特征和均值特征进行可视化,训练结果如图4所示。

      图  2  化爆SVM训练结果

      图  3  闪电SVM训练结果

      图  4  台风SVM训练结果

      对于噪声的识别,随机抽取400组噪声特征数据作为正样本,全部化学爆炸、闪电、台风特征数据作为负样本,共同组成训练集对一个支持向量机进行训练,惩罚因子取0.10,选取短时平均过零率特征和波形复杂度特征进行可视化,训练结果如图5所示。

      图  5  噪声SVM训练结果

      用训练好的4个SVM模型分别对测试样本进行预测分类,每一个样本得到4个预测类别得分值,分值最高的类别即为该样本的识别结果。选取特征6和特征7对识别结果进行可视化,得到测试样本的真实分布与支持向量机的预测分布如图6所示,各种事件的识别结果见表1

      从以上实验结果中可以看出,这8种特征对于化爆、闪电、台风和噪声这4种类型的数据,支持向量机有较好的分类性能,且只需要训练4个分类器,计算速度相对较快。

    • 卷积神经网络(convolutional neural networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一[16]。卷积神经网络的隐含层一般包含卷积层、池化层和全连接层3类常见结构,在一些新的算法中可能有Inception模块、残差模块等复杂结构,卷积层和池化层为卷积神经网络所特有[17]

      卷积层的功能是对输入数据使用卷积核进行卷积运算,生成特征图。卷积核的每个元素都对应一个权重系数和一个偏差量,类似于一个前馈神经网络的神经元[18]。进行卷积计算时,卷积核在输入矩阵中滑动,每滑动到一个位置,就根据其大小对输入特征做矩阵元素乘法求和并叠加偏差量。若Zl为第l层特征图,则第l+1层特征图的计算方法为:

      $${Z^{l + 1}}(i,j) = [{Z^l} \otimes {w^{l + 1}}](i,j) + b$$ (7)

      式中,(ij)为特征图像素点下标;w为卷积核;b为偏差量。设第l层特征图为行列均是Ll的方阵,卷积核大小为f,卷积步长为s0,填充层数为p,则:

      图  6  支持向量机在测试集上的预测结果

      表 1  SVM测试结果

      类型 测试样本数 正确识别数 闪电错误识别数 识别准确率/%
      化爆 6 4 2 66.7
      台风 13 12 1 92.3
      闪电 93 91 2 97.8
      噪声 112 112 0 100.0
      合计 224 219 5 97.7
      $${L_{l + 1}} = \frac{{{L_l} + 2p - f}}{{{s_0}}} + 1$$ (8)

      在卷积层进行特征提取后,输出的特征图传递至池化层进行特征选择和信息过滤,起到压缩数据减少参数数量的作用。池化层将特征图中一些相邻区域中的点用某一统计量进行代替,一般取池化区域内的最大值或平均值。池化的过程与卷积核扫描特征图类似,由池化大小f、步长s0和填充层数p控制,其一般表示形式为:

      $$A_k^l(i,j) = {\left[\sum\limits_{x = 1}^f {\sum\limits_{y = 1}^f {A_k^l(} } {s_0}i + x,{s_0}j + y)^p\right]}^{{\tfrac{1}{p}}}$$ (9)

      卷积神经网络的最后部分是一个全连接层,它等价于传统前馈神经网络中的隐含层,只用于对提取的特征进行非线性组合以得到输出。其网络结构包含3个卷积层、3个池化层和一个全连接层。

    • 卷积神经网络主要用于图像识别,其识别能力在某些方面已经远远超过人脑。但对于低频声传感器采集的离散信号,无法直接对信号特征进行识别。因此,本文将SVM识别实验中采集的600个样本数据通过傅里叶变换转换为时频特征图[19],并进行机器学习实验。图7为从4种类型的数据中各随机选取一个样本进行转换的结果。

      图  7  各类信号时频图示例

      实验中,分别从噪声数据和事件数据中随机抽取3/5的样本作为训练集,其余样本作为测试集,以检验训练得到的网络的分类能力,训练集和测试集的样本分布如图4所示。为了消除训练集和测试集随机选取带来的影响,实验进行多次运行,再对结果进行统计。

      然后将训练样本的时频特征图输入到卷积神经网络中对网络进行训练,经过75次迭代,训练准确率达到99.9%,测试准确率达到96.0%,训练准确率和损失率变化如图8所示。

      对各种事件的识别结果如表2所示,可以看出此方法的总体识别率和支持向量机相差不大,但是对于样本数据较少的化爆,其识别效果依然不理想。

    • 由于在现实环境中,化爆数据较少,无法采集到大量有效的数据作为训练样本。为了解决上述由于化爆样本量不足引起的识别率低的问题,本文将生成式对抗网络与卷积神经网络相结合,把增强后的化爆数据输入到卷积神经网络中进行训练。

      图  8  训练准确率和损失率变化曲线

      表 2  CNN测试结果

      类型 测试样本数 正确识别数 错误识别数 识别准确率/%
      化爆 6 3 3 50.0
      台风 13 11 2 84.6
      闪电 93 89 4 95.7
      噪声 112 112 0 100.0
      合计 224 215 9 96.0

      生成式对抗网络(generative adversarial nets, GAN)由文献[20-22]于2014年提出,它主要包括学习数据分布的生成模型(G)和分辨数据真实性的判别模型(D)两个部分。在网络的训练过程中,两个模型交替优化,不断地进行对抗,最终达到一个动态均衡,从而具有输出与训练样本相似的新数据的能力。

      采用GAN对化爆数据进行了训练和生成,增加了一倍的化爆伪样本数据,然后使用CNN进行识别实验,实验结果如表3所示,训练准确率为99.8%,测试准确率为93.0%,特别是对化爆数据的识别上,性能有较大的提升,但仍然不够理想,需要进一步的研究。

      表 3  改进后测试结果

      类型 训练样本数 正确识别数 错误识别数 识别准确率/%
      化爆 12 9 3 75.0
      台风 13 12 1 92.3
      闪电 93 81 12 87.1
      噪声 112 112 0 100.0
      合计 230 214 16 93.0
    • 从以上实验结果可以看出,SVM和CNN两种模型都具有较高的识别能力,但由于事件数据类型分布不均,对于样本数据较少的事件,识别准确率偏低。从这个角度出发,对模型的假正率(false positive rate, FPR)和真正率(true positive rate, TPR)进行综合评价。剔除对事件识别无用的噪声数据,对化爆、闪电、台风3种类型的数据进行识别实验,将分类模型的输出修改为每一个样本数据被识别为3种事件的概率,分别计算它们的ROC曲线和AUC值,所得结果如图9所示。

      图  9  模型的ROC曲线

      通过多次实验,对模型的AUC值进行统计,并对其概率密度函数进行拟合,所得结果如图10所示。

      图  10  模型AUC值拟合概率密度曲线

      SVM模型的AUC值近似服从参数为(α = 54.4831,β = 2.06348)的β分布,期望值E(x) = 0.9635。而CNN模型的AUC值近似服从参数为(α = 37.0722,β = 3.24117)的β分布,期望值E(x) = 0.9196。对于本文研究的次声数据样本分布的特点,SVM模型的AUC值总体高于CNN模型,即SVM模型性能较高。

    • 在本文的研究中,支持向量机模型的识别性能较好,但它对人工设计的特征有较高的要求,需要研究人员对各种信号的各种特征进行深入的研究,以便找出区别较大的信号特征。且对于多种类型数据的分类而言,需要训练多个支持向量机模型,当有新的类别加进来时,需要对所有的模型进行重新训练。

      卷积神经网络以其在图像识别中的优良性能,可以挖掘出人工设计时忽略的时频特征,从而较为准确地对本文中的3种大气低频声信号的频谱图进行识别,但对于小样本数据,依然存在学习不充分的问题。采用生成式对抗网络对学习过程进行改进,能改善对特定事件的识别效果,可以进一步结合CNN与GAN进行研究,以达到更好的效果。

参考文献 (22)

目录

    /

    返回文章
    返回