-
直升机在军事突防中发挥着重要作用,因此关于直升机的探测和识别也成了一个重要的研究问题[1]。目前该领域已成功发展了红外、雷达等多种先进防空探测手段,但受地形、地面附近杂波等环境影响,雷达探测在低空仍存在盲区,无法有效探测到低空目标[2];红外等光学探测设备受大气环境和自然环境影响较大,无法针对低空目标进行全天候监测[3]。因此,低空飞行目标的检测和识别成为目前探测技术发展的重点和难点。直升机飞行时辐射的旋翼声信号作为飞行过程中的重要物理特征,具有传播距离远、衰减速度慢等特性,基于旋翼噪声信号进行直升机检测与识别的方法可行性高,具有重要研究价值。
目前,针对直升机声目标开展的研究主要划分为检测、识别两个相对独立的研究模块。在音频检测方面的研究大多集中于传统信号处理领域,如基于声类比理论的FW-H方法[4]、基于Kirchhoff和CFD的混合法[5]等,这些方法需要对完整的音频信号进行时频特性分析,在实际外场探测时的实时性难以保证;在直升机声目标识别方面,主要基于谐波特征提取、小波特征提取、人耳听觉感知特征提取[6]等方法提取直升机声信号的特征并利用KNN、SVM[7]等传统分类器进行声目标识别。随着深度学习在声音领域的发展,也有相关研究采用CNN、LSTM等网络模型以实现直升机声目标的深度特征提取和识别[7]。直升机声目标识别方法研究的数据是基于仿真或特定的实验环境,难以排除实际外场的噪声干扰,导致了连续识别正确率低、鲁棒性差的问题。并且在实际外场直升机目标监测时,需要将检测和识别方法结合。
由此,本文提出一种在实际环境中对直升机旋翼声信号进行一体化检测与识别的算法。该算法将声目标检测与声目标识别两个独立的研究方向进行一体化,检测结果能够为声目标识别剔除噪声段,以增加声目标识别的精度和效率,而声目标识别的结果又可以作为声探测结果的验证,进一步提高检测精度。通过外场实验采集的两类直升机信号和开源的noise92噪声数据集构建了实验数据,设计实验并验证了该算法的可行性。
-
实际的外场环境中,通常混叠各种声源产生的声音信号,这些不同的声源都会影响其检测识别的效果。图1和图2分别是一段纯净直升机声音信号的频谱图像和实际外场声信号的频谱图像。对比两图可知:纯净的直升机具有较为明显的谐波特性,在其频谱图像中很容易找到直升机的基频和它的倍频谱线。而复杂的外场环境中,受各个声源信号的混叠、抵消等影响,外场信号的频谱图杂乱无章,难以直接对直升机信号进行检测和识别。因此需要考虑抑制这些杂音的干扰,进而提升检测和识别效果。
-
外场采集的音频信号中混杂着直升机旋翼声信号及各种环境噪声,通过声目标特征提取方法可有效放大直升机旋翼声信号的某些特征,进而达到杂音抑制和信号增强的效果。本文采用基于谱质心、谱对比度及MFCC(mel frequency cepstrum coefficient)特征提取融合的特征提取方法。
谱质心是在一定频率范围内通过能量与频率乘积的加权平均,它包含了声音信号的频率分布和能量分布的重要信息[8]。谱质心的计算公式为:
$$ {\rm{SC}} = \frac{{\displaystyle\sum\limits_{n = 1}^N f (n)E(n)}}{{\displaystyle\sum\limits_1^N E (N)}} = \sum\limits_{n = 1}^N f (n)P(E(n)) $$ (1) 式中,f为信号频率;E(n)是连续的时域信号x(t)经短时傅里叶变化后对应频率的谱能量。
谱对比度是音频经时频变换形成的频谱图的像素对比度[9]。谱对比度的计算公式为:
$$ c = \sum r (i,j)r(i,j)p(i,j) $$ (2) 式中,r(i,j)=|i−j|即相邻像素间的灰度;p(i,j)为相邻像素灰度差为r的像素分布概率。高对比度值通常对应清晰的窄带信号,而低对比度值则对应宽带噪声。
MFCC是语音识别领域最常用的语音特征[10]。MFCC特征提取的流程如图3所示。输入的原始数字信号经预加重、分帧、加窗、FFT、Mel滤波、DFT等操作后,最终变为能够表征频域特征的特征向量,该向量作为分类器的输入,进行分类识别处理。
-
在完成了直升机的声目标特征提取后,需要将提取的特征系数作为输入,由分类模型进行检测和分类处理。考虑到实际外场信号的复杂性,使用浅层分类器直接进行分类识别的正确率较低,故本文使用基于深度学习训练的神经网络模型进行深层特征提取和分类识别。搭建的深度神经网络模型如图4所示。网络模型架构由2层卷积层、2层池化层、2层全连接层和1个Softmax分类器拼接组成。前4层用于深度特征提取,最后2层全连接层用于聚合特征,最后由Softmax分类器进行分类识别和输出结果。
-
由于缺少开源的实验数据,本文利用开源的noise92噪声数据集和实际外场实验采集的R22和R44两类民用直升机的声信号数据进行人工合成,构建实验数据集进行实验和算法效果分析。
-
Noise-92噪声数据集是由英国荷兰感知-TNO 研究所语音研究单位(SRU)在项目编号2589-SAM下在现场测量的不同噪声数据。所有文件的持续时间均为235 s,由采样率为18.98 kHz,具有16位的模数转换器、抗混叠滤波器和不带预加重级的采集设备来获取的[13]。选用其中的8类噪声作为噪声数据,分别是白噪声、粉红噪声、室内人声、电焊设备工作声、汽车生产车间噪声、车辆行驶噪声、冲击噪声及无线电波噪声。由于用于测试的目标信号为5 kHz,所以又对noise92数据集进行了5 kHz的重采样。
而目标直升机数据,通过外场飞行实验,以5 kHz的采样率采集了R22和R44两类直升机在直飞状态下的数据。选取了其中信噪比较高的,距采集设备2 km以内的音频段,切分作为两类直升机目标数据,图6和图7分别展示了一段噪声信号和直升机声信号的波形示例。
-
将两类直升机信号分割为1 s长的音频段,分别按照不同的时间戳随机插入到8类噪声信号中并记录各个目标段的开始时间和结束时间,共两类声目标信号,分别随机插入各类环境噪声中100次,构成1600(2×8×100)段待测数据,每段数据中含有1 s长的直升机声目标。为了模拟更为复杂的噪声环境,在上述8种噪声中的两种以上进行随机叠加,构成复合的噪声环境;再将两类声目标信号插入复合噪声并记录起止时间,构成200(2×100)段复合信号;单一噪声和复合噪声信号共计1800段。
然后使用训练好的SVM模型,按照2.1节中的检测流程分别对1800段数据集进行切片、滤波、特征提取和检测,并将检测到目标的音频时间戳与记录的时间戳进行对比,计算各种声目标环境下的检测率(检测率=检测正确段数/总段数×100%),结果见表1。
表 1 算法对9类噪声环境下的潜在目标段检测正确率统计表
% 白噪声 粉红噪声 室内人声 电焊设备声 车间噪声 车辆行驶噪声 冲击噪声 无线电噪声 复合噪声 平均 99.0 98.0 94.0 94.0 92.0 90.0 94.0 95.0 86.0 93.6 由表1可见,基于SVM的待测目标的平均检测率为93.6%,其中该方法对白噪声、粉红噪声、室内人声、电焊设备工作声、冲击噪声及无线电波噪声这6类的检测效果较好。而对于生产车间噪声和车辆行驶噪声这两类的检测效果相对较差,但仍在90%以上。对于由多种噪声环境构成的复合噪声环境的检测率为86%,相比单一的噪声环境有了一定程度的下降,在后续的识别实验中可以重点考虑识别算法对复合噪声环境误判的目标信号是否存在抑制作用。
对于用于分类识别的神经网络模型的训练,将R22和R44两类直升机信号各提取100段1 s长的音频段作为训练集,训练本文的神经网络模型。并且以同样的方法训练SVM和RNN两种分类器,从而对比本文算法的识别效果。
分类识别算法效果实验的数据集,按照上述记录的时间戳将直升机目标段分割出来,构成1800段,R22和R44在9类环境中各100段的分类识别测试集。使用3种分类模型进行分类,得到的识别效果如表2所示。
表 2 3种算法对9类噪声环境中潜在目标段的识别率统计表
% 算法 白噪声 粉红噪声 室内人声 电焊设备声 车间噪声 车辆行驶噪声 冲击噪声 无线电噪声 复合噪声 平均 SVM 78.0 74.0 70.0 70.0 66.0 64.0 70.0 69.0 60.0 69.0 RNN 96.0 96.0 90.0 95.0 86.0 83.0 88.0 90.0 82.0 89.5 本文算法 98.0 96.0 94.0 95.0 92.0 91.0 93.0 96.0 90.0 93.9 由表2可以得出,与其他两种分类器模型对比,本文使用的神经网络模型在9种不同的噪声环境中都具有更高的识别率。为了验证该算法在其他数据集中是否具有较好的鲁棒性,使用了英国BBC提供的直升机数据与noise92数据集进行混合。原始数据是由BBC提供的brant、bristo、fairey、sikors和wessex这5种悬停的直升机演示视频[14],从中截取了音频文件并划分为一秒长的音频段,按照上述的噪声叠加方法叠加形成了9种环境下的5类直升机信号。然后,分别训练了SVM、LSTM和本文使用的CNN网络,并分别进行测试,3种算法对该数据集的识别率如表3所示。
表 3 3种分类器对9类噪声环境中直升机目标的识别率统计表
% 算法 白噪声 粉红噪声 室内人声 电焊设备声 车间噪声 军车行驶噪声 机枪射击噪声 无线电噪声 复合噪声 平均 SVM 68.0 66.0 57.0 59.0 60.0 60.0 58.0 63.0 57.0 60.9 LSTM 90.0 91.0 89.0 92.0 84.0 80.0 76.0 81.0 77.0 84.4 本文算法 96.0 92.0 90.0 90.0 88.0 87.0 89.0 91.0 85.0 89.8 由表可见,3类网络模型对5类直升机的识别率都有所下降,不过本文算法仍旧保持最高的识别率,在一定程度上验证了本文算法的鲁棒性。由于本次实验提供的直升机数据中没有包含详细的参数说明,因此无法准确地获取它的时频特征信息,从而使信号增强和特征提取方法受到了影响,同时由于原始音频数据是由视频数据截取而来,造成了一定程度的失真,这两个因素都对识别效果产生了较大的影响。
-
为了验证在实时系统中该算法的可行性,同样对外场实验中采集的真实数据进行了算法测试和分析。在某民用机场进行了直升机外场飞行实验,得到了罗宾逊R44和R22两类直升机的飞行音频数据[15]。直升机声目标测量设备包括阵列架、传声器和采集器等。实验现场如图8所示。
当直升机离传声器较近时,信噪较高,而随着直升机与传声器距离的变大,由于直升机声信号在空气中传播时的衰减,信噪比逐渐降低。进行外场飞行试验时,直升机先是从近距离出发,逐渐飞远,然后飞回。由于两次飞行试验的飞行距离和飞行轨迹的区别,选取了两次实验中直升机由6 km左右的距离飞向采集点、再飞离采集点直至6 km左右的两条实验音频数据。按照3.1节中的算法步骤对完整的飞行事件进行了检测和识别处理。检测和识别结果见图9与图10。
由实验结果可见,总体上,直升机在测点附近时,由于信噪比较高,平均识别正确率总体相对较高。随着目标与测点的距离增大,信噪比变低,平均识别正确率随之下降,直到无法有效识别。对于本文提出的算法而言,在5 km左右的距离,检测算法对两次飞行试验的检测率都基本能检测出潜在目标,而识别算法对于4 km以内的数据也具有较好的识别效果。
An Integrated Algorithm for Helicopter Rotor Sound Signal Detection and Recognition Based on Deep Learning
-
摘要: 基于直升机旋翼声信号的目标检测与识别是低空目标预警领域的一个重要问题。目前的相关研究将检测和识别分别进行研究,而在实际应用中检测与识别是一个整体过程。针对上述问题,提出了一种基于深度学习的直升机旋翼声信号检测与识别一体化算法。算法首先通过融合特征提取和支撑向量机进行目标检测,再将检测到的潜在直升机声目标的信号段基于深度学习进行分类识别。通过实验数据测试了该算法的效果,实验结果表明,该算法使检测率、识别率均得到较大幅度的提升,增强了检测识别精准度。Abstract: The detection and recognition of helicopter rotor acoustic signals are the important problems in the field of low altitude target warning. The current algorithms treated detection and recognition separately, but in practical applications, detection and recognition is a whole process. In order to solve the above problems, this paper proposes an integrated detection and recognition algorithm for helicopter rotor acoustic signal based on deep learning. Firstly, the target is detected by fusing feature extraction and support vector machine, and then the signal segments of potential helicopter acoustic targets are classified and recognized based on deep learning. The effect of the algorithm is studied and tested in detail by constructing experimental data. Experimental results show that the detection rate and recognition rate of the algorithm are greatly improved, and the detection accuracy and recognition accuracy are greatly enhanced. The algorithm has high research and application values.
-
表 1 算法对9类噪声环境下的潜在目标段检测正确率统计表
% 白噪声 粉红噪声 室内人声 电焊设备声 车间噪声 车辆行驶噪声 冲击噪声 无线电噪声 复合噪声 平均 99.0 98.0 94.0 94.0 92.0 90.0 94.0 95.0 86.0 93.6 表 2 3种算法对9类噪声环境中潜在目标段的识别率统计表
% 算法 白噪声 粉红噪声 室内人声 电焊设备声 车间噪声 车辆行驶噪声 冲击噪声 无线电噪声 复合噪声 平均 SVM 78.0 74.0 70.0 70.0 66.0 64.0 70.0 69.0 60.0 69.0 RNN 96.0 96.0 90.0 95.0 86.0 83.0 88.0 90.0 82.0 89.5 本文算法 98.0 96.0 94.0 95.0 92.0 91.0 93.0 96.0 90.0 93.9 表 3 3种分类器对9类噪声环境中直升机目标的识别率统计表
% 算法 白噪声 粉红噪声 室内人声 电焊设备声 车间噪声 军车行驶噪声 机枪射击噪声 无线电噪声 复合噪声 平均 SVM 68.0 66.0 57.0 59.0 60.0 60.0 58.0 63.0 57.0 60.9 LSTM 90.0 91.0 89.0 92.0 84.0 80.0 76.0 81.0 77.0 84.4 本文算法 96.0 92.0 90.0 90.0 88.0 87.0 89.0 91.0 85.0 89.8 -
[1] 栗琳. 直升机发展历程[M]. 北京: 航空工业出版社, 2007. LI L. History of helicopter development[M]. Beijing: Aviation Industry Press, 2007. [2] 吴阳. 地面雷达低空探测杂波抑制研究[D]. 长沙: 湖南大学, 2011. WU Y. Research on the clutter suppression of low altitude detection for ground-based radar[D]. Changsha: Hunan University, 2011. [3] 高怀平. 探测条件和大气环境对红外热成像系统MRTD影响的研究[D]. 南京: 南京航空航天大学, 2016. GAO H P. Research on the effect of detection condition and atmospheric environment on MRTD of infrared thermal imaging system[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2016. [4] KAUSHIK B, NANCE D, AHUJA K, et al. A review of the role of acoustic sensors in the modern battlefield[C]//1st AIAA/CEAS Aeroacoustics Conference. California: IEEE, 2005: 2997. [5] ELSHAFEI M, AKHTAR S, AHMED M S. Parametric models for helicopter identification using ANN[J]. IEEE Transactions on Aerospace and Electronic Systems, 2000, 36(4): 1242-1252. doi: 10.1109/7.892672 [6] 李京华, 许家栋, 李红娟. 支持向量机的战场直升机目标分类识别[J]. 火力与指挥控制, 2008, 33(1): 31-34. doi: 10.3969/j.issn.1002-0640.2008.01.009 LI J H, XU J D, LI H J. Research on helicopter target identification based on support vector machine[J]. Fire Control & Command Control, 2008, 33(1): 31-34. doi: 10.3969/j.issn.1002-0640.2008.01.009 [7] 黄博, 高勇. 基于倒谱特征和小波包特征熵的直升机声目标识别[J]. 探测与控制学报, 2007, 29(6): 15-18. doi: 10.3969/j.issn.1008-1194.2007.06.004 HUANG B, GAO Y. The recognition of helicopter acoustic target based on cepstrum characteristic and wavelet packet characteristic entropy[J]. Journal of Detection & Control, 2007, 29(6): 15-18. doi: 10.3969/j.issn.1008-1194.2007.06.004 [8] BRENTNER K. An efficient and robust method for predicting helicopter high-speed impulsive noise[J]. Journal of Sound and Vibration, 1997, 203(1): 87-100. doi: 10.1006/jsvi.1996.0834 [9] YAKUBOVSKIY A, SALLOUM H, SUTIN A, et al. Feature extraction for acoustic classification of small aircraft[C]//2015 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. New York: IEEE, 2015: 1-5. [10] PICZAK K J. Environmental sound classification with convolution neural networks[C]//2015 IEEE 25th International Workshop on Machine Learning for Signal Processing (MLSP). [S. l.]: IEEE, 2015: 1-6. [11] 郭洋. 基于深度学习的声目标识别技术研究[D]. 重庆: 重庆邮电大学, 2019. GUO Y. A study of acoustic target recognition technology based on deep learning[D]. Chongqing: Chongqing University of Posts and Telecommunications, 2019. [12] 李启虎. 水声学研究进展[J]. 声学学报, 2001, 26(4): 295-301. doi: 10.3321/j.issn:0371-0025.2001.04.002 LI Q H. Advances of research work in underwater acoustics[J]. Acta Acustica, 2001, 26(4): 295-301. doi: 10.3321/j.issn:0371-0025.2001.04.002 [13] YIN Y H, LI C F, LU Y. Estimating curie-point depths using both wavelet-based and Fourier spectral centroid methods in the western Pacific marginal seas[J]. Geophysical Journal International, 2021, 227(2): 798-812. doi: 10.1093/gji/ggab257 [14] 张征. 面向室外监控场景的天气分类与低质图像增强技术研究[D]. 北京: 北京邮电大学, 2017. ZHANG Z. Research on weather classification and low-quality image enhancement in outdoor scene[D]. Beijing: Beijing University of Posts and Telecommunications, 2017. [15] 倪俊帅, 赵梅, 胡长青. 基于深度学习的舰船辐射噪声多特征融合分类[J]. 声学技术, 2020, 39(3): 366-371. doi: 10.16300/j.cnki.1000-3630.2020.03.019 NI J S, ZHAO M, HU C Q. Multi-Feature fusion classification of ship radiated noise based on deep learning[J]. Technical Acoustics, 2020, 39(3): 366-371. doi: 10.16300/j.cnki.1000-3630.2020.03.019