留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于时序拓扑数据分析的电力电缆局部放电模式识别

李自强 李睿 孙抗

李自强, 李睿, 孙抗. 基于时序拓扑数据分析的电力电缆局部放电模式识别[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2022398
引用本文: 李自强, 李睿, 孙抗. 基于时序拓扑数据分析的电力电缆局部放电模式识别[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2022398
LI Ziqiang, LI Rui, SUN Kang. Power cable partial discharge pattern recognition based on topological data analysis for time series[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2022398
Citation: LI Ziqiang, LI Rui, SUN Kang. Power cable partial discharge pattern recognition based on topological data analysis for time series[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2022398

基于时序拓扑数据分析的电力电缆局部放电模式识别

doi: 10.12178/1001-0548.2022398
基金项目: 河南省科技攻关计划项目(202102210092);河南省高校青年骨干教师项目(2021GGJS056)
详细信息
    作者简介:

    李自强(1986— ),男,硕士,高级工程师,主要从事电力系统自动化,电气设备故障诊断等方面的研究

    通讯作者: 孙抗,E-mail:sunkang@hpu.com
  • 中图分类号: TM855

Power cable partial discharge pattern recognition based on topological data analysis for time series

  • 摘要: 在电力电缆局部放电模式识别时,相位图谱以及统计特征往往因区分度不足而影响识别精度。为此,提出一种基于时序拓扑数据分析(TDA)的局放特征提取和识别方法。首先,提出一种符号熵和粒子群优化(PSO)相结合的重构参数选择方法,将预处理后的局放时域信号进行相空间重构,并生成三维局放数据点云;其次,基于TDA方法提取持续同调特征,据此生成持续散点图及持续条形码,计算并可视化表达为贝蒂曲线;最后,将贝蒂曲线输入1D-CNN模型,对四种典型局放缺陷模式进行识别并开展对比实验。实验结果表明,该方法对相空间重构时延参数的选取更加准确,且TDA特征具备良好的区分度,相比其他以相位图谱及统计特征为输入的模型,整体识别准确率最高可提升15.34%,达到98.55%,同时提升部分模式的精度。
  • 图  1  单纯形示意图

    图  2  Rips复形的构建及拓扑特征提取过程

    图  3  模式识别流程

    图  4  1D-CNN网络结构

    图  5  电缆局部放电检测系统

    图  6  电缆结构及电缆缺陷示意图

    图  7  四种PD信号的PRPD谱图和典型统计特征样本分布

    图  8  四种模式的点云分布以及拓扑特征

    图  9  不同分类器的模式识别性能

    表  1  四种时延参数选择方法的模式识别结果对比

    方法 评价指标/%
    $Acc$ $F1 - score$
    小窗口解法 95.65 94.55
    自动嵌入法 96.65 95.51
    C-C法 96.60 95.34
    本文方法 98.55 96.76
    下载: 导出CSV

    表  2  不同方法的局放模式识别结果对比

    方法 评价指标/%
    $Acc$ $F1 - score$
    本文方法 98.55 96.76
    STA+1D-CNN[9] 93.25 92.38
    STA+TDA+1D-CNN 97.75 96.02
    PC+2D-CNN 96.75 92.95
    PRPD+2D-CNN[6] 90.63 84.23
    STA+RF[8] 83.21 73.42
    STA+GBDT[8] 84.71 78.46
    STA+GAN+SVM[10] 86.49 76.54
    STA+GAN+RF[10] 91.84 83.75
    下载: 导出CSV
  • [1] 陈新, 李文鹏, 李震宇, 等. 高压直流XLPE绝缘材料及电缆关键技术展望[J]. 高电压技术, 2020, 46(05): 1571-1579.

    CHEN X, LI W P, LI ZH Y, et al. Prospect on key technology of the XLPE insulation materials and HVDC cables[J]. High Voltage Engineering, 2020, 46(05): 1571-1579.
    [2] 杜浩, 关弘路, 陈向荣, 等. 直流电压下交联聚乙烯电缆典型缺陷局部放电特性[J]. 高电压技术, 2021, 47(02): 555-563.

    DU H, GUAN H L, CHEN X R, et al. Partial discharge characteristics of typical defects in XLPE cable under DC voltage[J]. High Voltage Engineering, 2021, 47(02): 555-563.
    [3] 丁要军, 王安宙. 基于CWGAN-GP平衡化的网络恶意流量识别方法[J]. 电子科技大学学报, 2022, 51(05): 760-765.

    DING Y J, WANG A ZH. Network malicious traffic identification method based on CWGAN-GP category balancing[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(05): 760-765.
    [4] 崔少国, 陈俊桦, 李晓虹. 融合语义及边界信息的中文电子病历命名实体识别[J]. 电子科技大学学报, 2022, 51(04): 565-571. doi:  10.12178/1001-0548.2021350

    CUI SH G, CHEN J H, LI X H. Named entity recognition for Chinese electronic medical record by fusing semantic and boundary information[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(04): 565-571. doi:  10.12178/1001-0548.2021350
    [5] 毛文清, 徐雅斌. 基于深度图卷积网络的社交机器人识别方法[J]. 电子科技大学学报, 2022, 51(04): 615-622+629.

    MAO W Q, XU Y B. Social bot identify method based on deep graph convolutional network[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(04): 615-622+629.
    [6] HALIL-IBRAHIM U, ILHAN S, OZDEMIR A. Workmanship defect classification in medium voltage cable terminations with convolutional neural network[J]. Electric Power Systems Research, 2021, 194107105.
    [7] CHANG C K, CHANG H H , BOYANAPALLI B K . Application of Pulse Sequence Partial Discharge Based Convolutional Neural Network in Pattern Recognition for Underground Cable Joints[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2022, 29(3): 1070-1078.
    [8] LI J SH. , WU Y J, WANG G J, et al. G Gradient boosting decision tree and random forest based partial discharge pattern recognition of HV cable[C]//2018 China International Conference on Electricity Distribution (CICED): IEEE, 2018: 327-331.
    [9] PENG X SH, YANG F, WANG G J, et al. A convolutional neural network-based deep learning methodology for recognition of partial discharge patterns from high-voltage cables[J]. IEEE Transactions on Power Delivery, 2019, 34(4): 1460-1469. doi:  10.1109/TPWRD.2019.2906086
    [10] WU Y J, CHEN L, WANG G J, et al. Partial discharge data augmentation of high voltage cables based on the variable noise superposition and generative adversarial network[C]//2018 International Conference on Power System Technology (POWERCON). IEEE, 2018: 3855-3859.
    [11] 秦雪, 钱勇, 许永鹏, 等. 基于2D-LPEWT的特征提取方法在电缆局部放电分析中的应用[J]. 电工技术学报, 2019, 34(01): 170-178.

    QIN X, QIAN Y, XU Y P, et al. Application of Feature Extraction Method Based on 2D-LPEWT in Cable Partial Discharge Analysis. Transactions of China Electrotechnical Society[J], 2019, 34(01): 170-178.
    [12] MYERS A D, KHASAWNEH F A. Damping parameter estimation using topological signal processing[J]. Mechanical Systems and Signal Processing, 2022, 174: 109042. doi:  10.1016/j.ymssp.2022.109042
    [13] PEREIRA C M M, DE M R F. Persistent homology for time series and spatial data clustering[J]. Expert Systems with Applications, 2015, 42(15-16): 6026-6038. doi:  10.1016/j.eswa.2015.04.010
    [14] RAVISHANKER N, CHEN R J. Topological data analysis (TDA) for time series[J]. arXiv preprint arXiv: 1909.10604, 2019.
    [15] GIDEA M, KATZ Y. Topological data analysis of financial time series: Landscapes of crashes[J]. Physica A:Statistical Mechanics and its Applications, 2018, 491: 820-834. doi:  10.1016/j.physa.2017.09.028
    [16] TAKENS F. Detecting strange attractors in turbulence[M]//Dynamical systems and turbulence, Warwick 1980. Springer, Berlin, Heidelberg, 1981: 366-381.
    [17] DEYLE E R, SUGIHARA G. Generalized theorems for nonlinear state space reconstruction[J]. Plos one, 2011, 6(3): e18295. doi:  10.1371/journal.pone.0018295
    [18] BRADLEY E, KANTZ H. Nonlinear time-series analysis revisited[J]. Chaos:An Interdisciplinary Journal of Nonlinear Science, 2015, 25(9): 097610. doi:  10.1063/1.4917289
    [19] ZHANG Z, SONG Y, CUI H, et al. Topological analysis and Gaussian decision tree: Effective representation and classification of biosignals of small sample size[J]. IEEE Transactions on Biomedical Engineering, 2016, 64(9): 2288-2299.
    [20] KUGIUMTZIS D. State space reconstruction parameters in the analysis of chaotic time series—the role of the time window length[J]. Physica D: Nonlinear Phenomena, 1996, 95(1): 13-28. doi:  10.1016/0167-2789(96)00054-1
    [21] 行鸿彦, 龚平, 徐伟. 嵌入窗方法确定混沌系统重构参数的仿真研究[J]. 系统仿真学报, 2013, 25(06): 1219-1225.

    XING H Y, GONG P, XU W. Simulation research of chaos system reconstruction parameters based on embedded window[J]. Journal of System Simulation, 2013, 25(06): 1219-1225.
    [22] KIM H S, EYKHOLT R, SALAS J D. Nonlinear dynamics, delay times, and embedding windows[J]. Physica D: Nonlinear Phenomena, 1999, 127(1-2): 48-60. doi:  10.1016/S0167-2789(98)00240-1
    [23] MARIANO M G, MORALES I, RODRIGUEZ J M, et al. Selection of embedding dimension and delay time in phase space reconstruction via symbolic dynamics[J]. Entropy, 2021, 23(2): 221. doi:  10.3390/e23020221
    [24] MARINI F, WALCZAK B. Particle swarm optimization (PSO). A tutorial[J]. Chemometrics and Intelligent Laboratory Systems, 2015, 149: 153-165. doi:  10.1016/j.chemolab.2015.08.020
    [25] WESLEY R J, KHAN A N, SHAHINA A. Phoneme classification in reconstructed phase space with convolutional neural networks[J]. Pattern Recognition Letters, 2020, 135: 299-306. doi:  10.1016/j.patrec.2020.05.002
    [26] PETROV L A, LEWIN P L, CZASZEJKO T. On the applicability of nonlinear time series methods for partial discharge analysis[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2014, 21(1): 284-293. doi:  10.1109/TDEI.2013.003983
    [27] CHEN X, XU Y, CAO X. Nonlinear time series analysis of partial discharges in electrical trees of XLPE cable insulation samples[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2014, 21(4): 1455-1461. doi:  10.1109/TDEI.2014.004307
    [28] ZHANG X, XIAO S, SHU N, et al. GIS partial discharge pattern recognition based on the chaos theory[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2014, 21(2): 783-790. doi:  10.1109/TDEI.2013.004020
  • [1] 刘勇国, 高攀, 兰荻, 朱嘉静.  ECA-SKNet:玉米单倍体种子的卷积神经网络识别模型 . 电子科技大学学报, doi: 10.12178/1001-0548.2022361
    [2] 周丰丰, 牛甲昱.  细胞穿膜肽识别问题的多特征融合卷积网络预测算法 . 电子科技大学学报, doi: 10.12178/1001-0548.2021391
    [3] 赵学功, 邓佳坤, 魏浩然, 彭真明.  基于卷积神经网络的眼底图像微血管瘤检测方法 . 电子科技大学学报, doi: 10.12178/1001-0548.2021186
    [4] 孙抗, 李万建, 张静.  含窄带噪声和白噪声的复杂染噪局部放电信号提取及应用 . 电子科技大学学报, doi: 10.12178/1001-0548.2020245
    [5] 周书田, 颜信, 谢镇汕.  视频人脸识别中高效分解卷积与时间金字塔网络研究 . 电子科技大学学报, doi: 10.12178/1001-0548.2020319
    [6] 毛远宏, 贺占庄, 马钟.  重构迁移学习的红外目标分类 . 电子科技大学学报, doi: 10.12178/1001-0548.2019162
    [7] 杜娟, 刘志刚, 宋考平, 杨二龙.  基于卷积神经网络的抽油机故障诊断 . 电子科技大学学报, doi: 10.12178/1001-0548.2019205
    [8] 张安安, 何嘉辉, 李茜, 杨威, 赵万明.  基于数学形态学和分形理论的电缆局放识别 . 电子科技大学学报, doi: 10.12178/1001-0548.2018199
    [9] 胡青松, 张亮, 丁娟, 李世银.  人体动作数据编码与CNN精确识别 . 电子科技大学学报, doi: 10.12178/1001-0548.2019108
    [10] 李润东, 李立忠, 李少谦, 宋熙煜, 何鹏.  基于稀疏滤波神经网络的智能调制识别 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2019.02.001
    [11] 田文洪, 曾柯铭, 莫中勤, 吝博强.  基于卷积神经网络的驾驶员不安全行为识别 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2019.03.012
    [12] 张安安, 杨林, 何嘉辉, 高春林, 李茜.  基于MDS的电缆附件局部放电模式识别 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2019.02.007
    [13] 郭继昌, 李翔鹏.  基于卷积神经网络和密度分布特征的人数统计方法 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2018.06.002
    [14] 唐贤伦, 刘庆, 张娜, 周家林.  混合PSO优化卷积神经网络结构和参数 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2018.02.011
    [15] 陈俊周, 汪子杰, 陈洪瀚, 左林翼.  基于级联卷积神经网络的视频动态烟雾检测 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2016.06.020
    [16] 秦志光, 陈浩, 丁熠, 蓝天, 陈圆, 沈广宇.  基于多模态卷积神经网络的脑血管提取方法研究 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2016.04.010
    [17] 金燕华, 秦开宇, 白泰礼.  在模式识别下的萃取液温度控制方法研究 . 电子科技大学学报, doi: 10.3969/j.issn.1001-0548.2009.03.014
    [18] 俞海, 贺昌政, 何跃.  自组织模式识别与经济预测 . 电子科技大学学报,
    [19] 任立勇, 卢显良.  基于串-并行计算BP网络拓扑结构的研究与实现 . 电子科技大学学报,
    [20] 孟相如, 虞厥邦.  电流模式神经网络分类器的CMOS实现技术 . 电子科技大学学报,
  • 加载中
图(9) / 表(2)
计量
  • 文章访问数:  241
  • HTML全文浏览量:  77
  • PDF下载量:  6
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-07-21
  • 修回日期:  2021-10-15

基于时序拓扑数据分析的电力电缆局部放电模式识别

doi: 10.12178/1001-0548.2022398
    基金项目:  河南省科技攻关计划项目(202102210092);河南省高校青年骨干教师项目(2021GGJS056)
    作者简介:

    李自强(1986— ),男,硕士,高级工程师,主要从事电力系统自动化,电气设备故障诊断等方面的研究

    通讯作者: 孙抗,E-mail:sunkang@hpu.com
  • 中图分类号: TM855

摘要: 在电力电缆局部放电模式识别时,相位图谱以及统计特征往往因区分度不足而影响识别精度。为此,提出一种基于时序拓扑数据分析(TDA)的局放特征提取和识别方法。首先,提出一种符号熵和粒子群优化(PSO)相结合的重构参数选择方法,将预处理后的局放时域信号进行相空间重构,并生成三维局放数据点云;其次,基于TDA方法提取持续同调特征,据此生成持续散点图及持续条形码,计算并可视化表达为贝蒂曲线;最后,将贝蒂曲线输入1D-CNN模型,对四种典型局放缺陷模式进行识别并开展对比实验。实验结果表明,该方法对相空间重构时延参数的选取更加准确,且TDA特征具备良好的区分度,相比其他以相位图谱及统计特征为输入的模型,整体识别准确率最高可提升15.34%,达到98.55%,同时提升部分模式的精度。

English Abstract

李自强, 李睿, 孙抗. 基于时序拓扑数据分析的电力电缆局部放电模式识别[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2022398
引用本文: 李自强, 李睿, 孙抗. 基于时序拓扑数据分析的电力电缆局部放电模式识别[J]. 电子科技大学学报. doi: 10.12178/1001-0548.2022398
LI Ziqiang, LI Rui, SUN Kang. Power cable partial discharge pattern recognition based on topological data analysis for time series[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2022398
Citation: LI Ziqiang, LI Rui, SUN Kang. Power cable partial discharge pattern recognition based on topological data analysis for time series[J]. Journal of University of Electronic Science and Technology of China. doi: 10.12178/1001-0548.2022398
  • 电力电缆是城市配电网及大规模清洁能源接入的关键基础设备,其可靠性关系到电力系统的安全稳定运行[1]。由于电缆绝缘材料、工艺及结构缺陷,再加上外部电、热、机械应力等复杂工作环境引起的绝缘材料老化,可引起局部放电(PD)乃至介质击穿,导致绝缘事故[2]。局部放电检测与分析被广泛应用于电缆绝缘劣化的诊断指标,其放电模式与绝缘缺陷的性质有很强的相关性。充分挖掘与分析电力电缆运行故障记录和各类局放试验数据,及时、准确识别故障类型,对于电缆线路的维护、检修策略制定等具有重要的指导意义。

    近年来,随着人工智能技术在模式识别领域的发展[3-5],局部放电相位分析(PRPD)以及统计特征与人工智能相结合的局部放电模式识别方法相继被提出。Halil[6] 等人将PRPD谱图转化为2D映射的RGB图像并利用卷积神经网络进行模式识别,此模型对于部分局部放电模式的识别率可达到96.77%,但由于实际电压频率与标准电压频率有一定的偏差,使得电压的基准相位的选取有一定难度[7],且绝缘外表面划痕和主绝缘表面污秽两种局部放电模式对应的PRPD谱图在相位分布和放电量大小具有一定的相似性,这两种模式对应的识别率相对较低。Peng[8-10]等人通过提取相位角、峰值电压以及脉冲偏度等统计特征作为输入,使用一维卷积神经网络(1D-CNN),随机森林(RF)与梯度迭代决策树(GBDT)以及经过生成式对抗网络(GAN)进行样本扩充与支持向量机(SVM)和随机森林(RF)相结合的分类模型进行识别。由于电力电缆局部放电信号在传输过程中衰变及受电磁干扰较为严重[11],直接对PD信号进行统计特征的提取会使得部分模式的识别率较低。因此,如何选择区分度更强的局放特征是进一步提高模式识别率的关键。

    时间序列拓扑数据分析(topological data analysis, TDA)[12-15]是一种通过Takens嵌入定理[16]进行相空间重构[17],即将一维时域信号嵌入一个高维空间,通过分析高维空间对应的“点云”拓扑结构获取时域信号动态变化特征提取方法。相比较于PRPD图谱及统计特征,TDA提取的电缆局放特征的核心在于信号的动态变化量,对于部分对基准电压的选取要求较高的模式,TDA提取的特征区分度更大且更加直观。相空构的核心在于时延参数和嵌入维数的确定。Elizabeth[18]和Zhang[19]等人的研究表明更高的嵌入维数并不能提高模式识别能力。时延参数现有的选择方法,如小窗口解法[20]、自动嵌入法[21]和C-C法[22]等,对于局部放电这类非线性信号相空间重构的动态特征与真实值的偏差相对较大[23],进而影响放电模式的识别率。

    区别于现有的以PRPD谱图及统计特征为输入的局部放电模式识别方案,本文提出一种基于时序拓扑数据分析的局部放电特征提取与模式识别方法。论文主要贡献在于:对于相空间重构,提出一种符号熵[23]与粒子群算法[24]相结合的重构参数选择及优化方法;特征提取阶段,将嵌入相空间的局部放电信号转化为三维局部放电数据点云,使用拓扑数据分析法提取拓扑特征,生成持续条形码和持续散点图并最终转化为贝蒂曲线;根据贝蒂曲线数据的特点,针对性地构造了1D-CNN分类模型并应用于局部放电模式识别。

    • 相空间重构法适用于动态系统的非线性时间序列分析[25]。在局部放电信号方面,该方法能够提取其动态变化特征[26-28],并减弱对模式识别效果的影响,是一种有效方法,可以替代传统的信号分类方法。

      时间序列信号经过相空间重构,其中嵌入维数为$m$,时延参数为$\tau $

      $$ \left\{ {\begin{array}{*{20}{c}} {X(1) = \{ x(1),x(1 + \tau ), \cdots ,x[1 + (m - 1)\tau ]\} } \\ {X(2) = \{ x(2),x(2 + \tau ), \cdots ,x[2 + (m - 1)\tau ]\} } \\ \vdots \\ {X(N) = \{ x(N),x(N + \tau ), \cdots ,x[N + (m - 1)\tau ]\} } \end{array}} \right. $$ (1)

      采用符号分析[23]的方法对其相空间重构参数$\tau $进行选择。将相空间重构生成的每一组点云记作一个$m$维向量${\mathbf{v}} = \left( {{v_1},{v_2},\cdots,{v_m}} \right)$,则被划分到同一分区的所有$m$维向量都被标记为相同的符号。

      对应的指示函数和标记映射如下所示:

      $$ {\delta _{ij}}(v) = \left\{ {\begin{array}{*{20}{c}} 1 & {if\left| {{v_i}} \right|,\left| {{v_j}} \right| < \varepsilon {\text{ or }}\left| {{v_i}} \right|,\left| {{v_j}} \right| \geqslant \varepsilon }\\ 0& {otherwise} \end{array}} \right.$$ (2)
      $$ {f_\varepsilon }\left( {{\mathbf{v}} = ({v_1},{v_2}, \ldots ,{v_m})} \right) = \left( {{\delta _{12}}(v),{\delta _{13}}(v), \ldots ,{\delta _{1m}}(v)} \right) $$ (3)

      向量被标记为某一符号的概率为:

      $$ {p_A} = \frac{{\# \{ {X(t)}\;\; {of}\;\;{A - type} \} }}{N} $$ (4)

      其中$A$为符号的类型,$N$为点云序列的长度。则符号熵可定义为:

      $$ h\left( {m,\tau } \right) = - \sum {{p_A}\ln ({p_A})} $$ (5)

      最优时延参数为:

      $$ {\tau ^*} = \arg \mathop {\max }\limits_\tau \{ h(m,\tau )\} $$ (6)
    • 确定时延参数$\tau $,选择正确的$\varepsilon $很重要。粒子群优化算法(PSO)是一种随机搜索算法,通过粒子间的相互协作找到最优解。使用符号熵与峰值检测函数FPs结合的方法构建适应度函数。定义:

      $$ h_{\Delta^-\max}=\max\left\{h_{\tau}-h_{\tau-1},h_{\tau}-h_{\tau-2},\ldots,h_{\tau}-h_{\tau-k}\right\} $$ (7)
      $$ {h_{{\Delta ^ + }\max }} = \max \left\{ {{h_\tau } - {h_{\tau + 1}},{h_\tau } - {h_{\tau + 2}}, \ldots ,{h_\tau } - {h_{\tau + k}}} \right\} $$ (8)
      $$ {h_{{\Delta ^ - }\min }} = \min \left\{ {{h_\tau } - {h_{\tau - 1}},{h_\tau } - {h_{\tau - 2}}, \ldots ,{h_\tau } - {h_{\tau - k}}} \right\} $$ (9)
      $$ {h_{{\Delta ^ + }\min }} = \min \left\{ {{h_\tau } - {h_{\tau + 1}},{h_\tau } - {h_{\tau + 2}}, \ldots ,{h_\tau } - {h_{\tau + k}}} \right\} $$ (10)
      $$ F{P^ + }(k,\tau ) = \frac{{{h_{{\Delta ^ - }\max }} + {h_{{\Delta ^ + }\max }}}}{2} $$ (11)
      $$ F{P^ - }(k,\tau ) = \frac{{{h_{{\Delta ^ - }\min }} + {h_{{\Delta ^ + }\min }}}}{2} $$ (12)

      适应度函数为区分群体中粒子位置好坏的评判标准。本文采用的适应度函数为:

      $$ fitness(\varepsilon ) = \max \left\{ {\mathop {\max }\limits_\tau \left\{ {F{P^{^ + }}(k,\tau )} \right\},\mathop {\min }\limits_\tau \left\{ {\left| {F{P^{^ - }}(k,\tau )} \right|} \right\}} \right\} $$ (13)
    • 单纯形是代数拓扑的基本概念,而单纯复形则是一种由各种维数的单纯形连接组成的结构,用于描述拓扑连通性。

      对于空间${\mathbb{R}^N}$中的一个点集${\bf{X}} = \{ {{\bf{X}}_1},{{\bf{X}}_2}, \cdots , {{\bf{X}}_n}\} $,单纯形为满足特定条件的集合:

      1. $\sigma = \displaystyle\sum\nolimits_{i = 0}^n {{t_i}{x_i}} $,其中 $\displaystyle\sum\nolimits_{i = 0}^n {{t_i} = 1} $

      2. $ \forall i $,${t_i} \geqslant 0$,${t_i}$$\sigma $唯一确定。

      图1所示,在几何上,0-单纯形可以看作端点,1-单纯形可以看作线段,2-单纯形可以看作三角形,以此类推。$k$-单纯形为${\mathbb{R}^N}$$k$维子空间。

      图  1  单纯形示意图

      若与$k$-单纯形$\sigma $相对应的点集为${\bf{X}}$,且单纯形$\tau $对应的点集${\bf{T}}$$ {\bf{T}} \subseteq {\bf{X}} $,则称$\tau $$\sigma $的面,当$\tau = \sigma $时为共面。单纯复形$ \mathcal{K} $是单纯形的一个集合,并且具有如下的性质:

      1. 若单纯形$\sigma \in \mathcal{K}$$\tau \leqslant \sigma $,则$\tau \in \mathcal{K}$

      2. 若单纯形$\sigma $${\sigma {'}} \in \mathcal{K}$,则当$\sigma \cap {\sigma {'}} \ne \emptyset $时,$\sigma \cap {\sigma {'}} \leqslant\sigma ,{\sigma {'}}$

    • 用点云集的坐标信息表示为一个$n \times m$的矩阵${\bf{X}}$,其中$n$为点云数量,$m$为重构维数。点云之间的欧氏距离为${\xi _{ij}}$。将点云之间的欧氏距离表示为一个$n \times n$的矩阵$d{\bf{(X)}}$

      点云集$P$的度量空间${\bf{M}}$中,任意两个点云$a,b$可以定义为中心为$a$,半径为$r$的开集${\bf{B}}(a;r)$

      $$ {\bf{B}}(a;r) = \{ b \in {\bf{M}}:d(a,b) < r\} $$ (14)

      其中$r$限定在欧氏距离的最大值和最小值之间,即$ {\xi _{\min }} < r < {\xi _{\max }} $

      开集半径为$r$的点集构成特定条件的单纯形,这些单纯形形成的复形为Rips复形${\bf{R}}(r)$

      $$ {\bf{R}}(r) = \{ \sigma \subseteq X|r < {r_n}\} $$ (15)

      Rips复形序列中0维同调是未组成1-单纯形的0-单纯形,1维同调是未组成2-单纯形的1-单纯形组成的闭合连接体。高维数据具有更高维度的同调结构。同调在序列中持续时间为持续同调,同调群的代数秩为贝蒂数:

      $$ {\beta _k} = rank{{\bf{H}}_k} $$ (16)

      图2所示,拓扑特征提取过程中可用三种图形表征:持续条形码(Barcodes)、持续散点图(Persistence diagram)和贝蒂曲线(Betty Curves)。它们可以清晰地展示0维和1维同调的存续时间,其中持续散点图对局放数据可视化效果最佳,贝蒂曲线兼容更多机器学习分类器,能匹配特征数据格式。

      图  2  Rips复形的构建及拓扑特征提取过程

      本研究使用拓扑数据分析对局部放电信号进行特征提取。相比传统分析方法,该方法更注重拓扑结构的变化,避免了初值选取和频率偏移对结果的影响。

    • 基于时序拓扑特征的电缆局部放电模式识别整体流程如图3所示,总体上可以分为信号的提取与预处理、相空间重构参数选择并生成点云、TDA点云建模提取特征和模式识别五个部分。

      图  3  模式识别流程

      1)采集四类绝缘缺陷电缆局放数据,根据局放相位分布进行预处理,以简化计算量,降低网络训练难度。

      2)使用符号熵和PSO相结合的方法寻找相空间重构参数的最优$(m,\tau )$组合。

      3)以PSO得到的最优$(m,\tau )$组合对局部放电信号进行相空间重构生成点云,并使用TDA对点云的拓扑特征(持续同调)进行提取。

      4)根据得到的拓扑特征绘制持续散点图与持续条形码,并根据持续条形码绘制贝蒂曲线。

      5)以贝蒂曲线作为1D-CNN的输入,按照比例随机划分训练集与测试集,训练神经网络并对模式识别结果进行验证。

      1D-CNN作为分类器,适用于处理大量数据和需要提取深度特征的数据集。贝蒂曲线数据以1000*3格式输入卷积层,其中卷积层和池化层共3层,卷积核参数分别为10*1,5*1和2*1,卷积核个数设置为64、64、128,步长为1。卷积池化后的特征输入全连接层进行分类,并加入0.2的Dropout层以防过拟合。批量处理样本数为256。网络结构如图4

      图  4  1D-CNN网络结构

    • 搭建实验系统如图5所示,主要由缺陷电缆试件、控制台、无局放试验变压器、隔离滤波变压器、传感器及示波器等构成。实验对象为铜芯交联聚乙烯绝缘非铠装电力电缆,电缆结构和绝缘缺陷如图6所示,左为电缆横切面,右为纵切面。制作的四类典型绝缘缺陷按顺序分别代表绝缘外表面划痕、外半导体爬电、绝缘内部气隙以及绝缘主表面污秽。对于数据采集阶段,每种绝缘缺陷采集5000个样本。

      图  5  电缆局部放电检测系统

      图  6  电缆结构及电缆缺陷示意图

    • 四类局放信号的二维PRPD图谱[6]以及典型的时域信号统计特征[8-10]的样本分布如图7所示,Type-0至Type-3分别表示绝缘外表面划痕、外半导体爬电、绝缘内部气隙以及绝缘主表面污秽四种缺陷。

      PRPD图谱用于模式识别时,第一类和第四类信号重叠严重,第二类和第三类信号在数量级上与其他类别差别大。仅依靠PRPD图谱作为特征量进行模式识别的效果相对较差。四类PD信号在峰值电压和均值电压两个维度的特征上重叠程度最高。

      图  7  四种PD信号的PRPD谱图和典型统计特征样本分布

      图8为预处理之后的四种局部放电信号转换的数据点云以及相应的特征分布。主图为点云提取拓扑特征得到的持续散点图,子图point cloud为点云分布,子图1-dim Betty curve为一维贝蒂曲线。

      图  8  四种模式的点云分布以及拓扑特征

      图8点云分布可以看出,缺陷1和3间距较小,且大多集中于中心区域,而缺陷2和3与其他类型在信号幅值的数量级上差异较大。点云数据的离散程度能够形成良好区分度,但0维同调不能很好地描述点云分布区域。拓扑特征可以描述四种局放信号的动态变化特征,形成良好的区分度。 缺陷1和4的点云分布差异程度越大,1维和2维同调分布越离散且持久性越强。

    • 本研究使用符号熵确定的相空间重构参数作为1D-CNN模型的输入,并通过实验验证其在模式识别中的有效性和优越性。实验中,将20000个样本分为80%的训练集和20%的测试集,迭代轮次为1000次,并进行5次试验取平均值。使用Tensorflow框架和i7-10700F CPU,NVIDIA RTX3060 GPU和32GB RAM进行实验。模式识别结果用整体准确率$Acc$和F1分数$F1 - score$评估。

      表 1  四种时延参数选择方法的模式识别结果对比

      方法 评价指标/%
      $Acc$ $F1 - score$
      小窗口解法 95.65 94.55
      自动嵌入法 96.65 95.51
      C-C法 96.60 95.34
      本文方法 98.55 96.76

      基于符号熵的相空间重构参数选择法能够在模式识别中取得明显的优势。在整体准确率和F1分数指标上,该方法分别达到了98.55%和96.76%。因此,结合符号熵和粒子群算法的参数选择方法可以有效地减小误差并优化模式识别的表现。

      为了验证TDA提取的拓扑特征在电缆局部放电模式识别中的优势,我们将以TDA拓扑特征为输入的1D-CNN与传统的PRPD图谱和诸如均值电压、峰值电压和波峰因数等36种统计特征STA[8-10]的模式识别方法进行了比较,同时将未进行特征提取的点云图像和拓扑特征与统计特征相结合的组合特征分别输入不同的分类器进行了对比。其中使用的分类器有2D-CNN[6]、RF[8]、GBDT[8]、GAN[10]和SVM[10],PC代表未经过特征提取的局部放电3D点云图像,STA+TDA代表统计特征与拓扑特征的组合特征。模式识别的结果列于表2中。

      表 2  不同方法的局放模式识别结果对比

      方法 评价指标/%
      $Acc$ $F1 - score$
      本文方法 98.55 96.76
      STA+1D-CNN[9] 93.25 92.38
      STA+TDA+1D-CNN 97.75 96.02
      PC+2D-CNN 96.75 92.95
      PRPD+2D-CNN[6] 90.63 84.23
      STA+RF[8] 83.21 73.42
      STA+GBDT[8] 84.71 78.46
      STA+GAN+SVM[10] 86.49 76.54
      STA+GAN+RF[10] 91.84 83.75

      TDA+1D-CNN模式识别方法比其他主流方法表现更优,准确率能达到98.55%、F1分数达到96.76%,区分度相对较好。相比较以统计特征[8-10]为输入的方法,本文方法最高可提升15.34%准确率;相较于以PRPD图谱[6]为输入的方法,本文准确率提升约8%。虽然STA+TDA+1D-CNN和PC+2D-CNN模型表现相对较好,但与本文方法相比分别仍有0.80%和1.80%的准确率差距,F1分数差距分别为0.74%和3.81%。

      图9所示,1D-CNN在处理局部放电拓扑特征的数据集上表现出明显优势,整体准确率高达98.55%。相比之下,其他分类器的F1分数相对较低,差距范围为0.40%至5.41%。因此,1D-CNN可以进一步提升TDA在不同模式区分度上的优越性。

      图  9  不同分类器的模式识别性能

    • 本文提出了一种以TDA方法提取拓扑特征为输入的1D-CNN模型进行电缆故障类型的模式识别方法,通过符号熵与粒子群算法结合的方法确定相空间重构参数,并进行对比实验。实验结果表明,该方法对相空间重构时延参数的选取更加准确,提取的局放TDA特征具备良好的区分度,相比多种以PRPD图谱及统计特征为输入的模型,在整体识别准确率以及区分度等方面均体现出显著优势。

参考文献 (28)

目录

    /

    返回文章
    返回