-
大气低频声监测技术是中远程核爆炸探测的技术手段之一,次声监测已被联合国列入全面禁核试监测技术[1]。然而,自然界存在着多种大气低频声信号,如何对这些信号数据进行实时分析和识别,是核爆探测需要解决的一个问题,需要有效的技术方法来支持。深度学习的快速发展以及其不断提高的性能为解决这个问题提供了另外一个途径[2]。
深度学习是以神经网络为基础发展而来[3],文献[4-5]提出,具有多层结构的神经网络比浅层神经网络具有更强的学习能力,从而可以将原始输入数据中人工分析难以获取的特征信息挖掘出来。
本文首先对核爆低频声的特征进行了分析并对机器学习中的支持向量机和卷积神经网络进行了研究,然后针对这些特征对化爆、雷电、台风的低频声信号进行了特征提取,并构造了多分类支持向量机和卷积神经网络进行识别实验,最后对学习过程进行了改进,获得了较好的性能。
HTML
-
卷积神经网络(convolutional neural networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一[16]。卷积神经网络的隐含层一般包含卷积层、池化层和全连接层3类常见结构,在一些新的算法中可能有Inception模块、残差模块等复杂结构,卷积层和池化层为卷积神经网络所特有[17]。
卷积层的功能是对输入数据使用卷积核进行卷积运算,生成特征图。卷积核的每个元素都对应一个权重系数和一个偏差量,类似于一个前馈神经网络的神经元[18]。进行卷积计算时,卷积核在输入矩阵中滑动,每滑动到一个位置,就根据其大小对输入特征做矩阵元素乘法求和并叠加偏差量。若Zl为第l层特征图,则第l+1层特征图的计算方法为:
式中,(i,j)为特征图像素点下标;w为卷积核;b为偏差量。设第l层特征图为行列均是Ll的方阵,卷积核大小为f,卷积步长为s0,填充层数为p,则:
类型 测试样本数 正确识别数 闪电错误识别数 识别准确率/% 化爆 6 4 2 66.7 台风 13 12 1 92.3 闪电 93 91 2 97.8 噪声 112 112 0 100.0 合计 224 219 5 97.7 在卷积层进行特征提取后,输出的特征图传递至池化层进行特征选择和信息过滤,起到压缩数据减少参数数量的作用。池化层将特征图中一些相邻区域中的点用某一统计量进行代替,一般取池化区域内的最大值或平均值。池化的过程与卷积核扫描特征图类似,由池化大小f、步长s0和填充层数p控制,其一般表示形式为:
卷积神经网络的最后部分是一个全连接层,它等价于传统前馈神经网络中的隐含层,只用于对提取的特征进行非线性组合以得到输出。其网络结构包含3个卷积层、3个池化层和一个全连接层。
-
卷积神经网络主要用于图像识别,其识别能力在某些方面已经远远超过人脑。但对于低频声传感器采集的离散信号,无法直接对信号特征进行识别。因此,本文将SVM识别实验中采集的600个样本数据通过傅里叶变换转换为时频特征图[19],并进行机器学习实验。图7为从4种类型的数据中各随机选取一个样本进行转换的结果。
实验中,分别从噪声数据和事件数据中随机抽取3/5的样本作为训练集,其余样本作为测试集,以检验训练得到的网络的分类能力,训练集和测试集的样本分布如图4所示。为了消除训练集和测试集随机选取带来的影响,实验进行多次运行,再对结果进行统计。
然后将训练样本的时频特征图输入到卷积神经网络中对网络进行训练,经过75次迭代,训练准确率达到99.9%,测试准确率达到96.0%,训练准确率和损失率变化如图8所示。
对各种事件的识别结果如表2所示,可以看出此方法的总体识别率和支持向量机相差不大,但是对于样本数据较少的化爆,其识别效果依然不理想。
-
由于在现实环境中,化爆数据较少,无法采集到大量有效的数据作为训练样本。为了解决上述由于化爆样本量不足引起的识别率低的问题,本文将生成式对抗网络与卷积神经网络相结合,把增强后的化爆数据输入到卷积神经网络中进行训练。
类型 测试样本数 正确识别数 错误识别数 识别准确率/% 化爆 6 3 3 50.0 台风 13 11 2 84.6 闪电 93 89 4 95.7 噪声 112 112 0 100.0 合计 224 215 9 96.0 生成式对抗网络(generative adversarial nets, GAN)由文献[20-22]于2014年提出,它主要包括学习数据分布的生成模型(G)和分辨数据真实性的判别模型(D)两个部分。在网络的训练过程中,两个模型交替优化,不断地进行对抗,最终达到一个动态均衡,从而具有输出与训练样本相似的新数据的能力。
采用GAN对化爆数据进行了训练和生成,增加了一倍的化爆伪样本数据,然后使用CNN进行识别实验,实验结果如表3所示,训练准确率为99.8%,测试准确率为93.0%,特别是对化爆数据的识别上,性能有较大的提升,但仍然不够理想,需要进一步的研究。
类型 训练样本数 正确识别数 错误识别数 识别准确率/% 化爆 12 9 3 75.0 台风 13 12 1 92.3 闪电 93 81 12 87.1 噪声 112 112 0 100.0 合计 230 214 16 93.0