-
近年来,以深度学习[1-5]为代表的数据驱动学习在物理和工程领域取得革命性成果,克服了传统物理模型复杂求解的难题。然而也面临以下问题:1)监督学习需要大量训练数据,在特殊工程领域数据获取是一大难题;2)数据稀疏性易使模型陷入过拟合而导致泛化能力变差;3)纯数据驱动学习方式未考虑实际工程场景隐含的某种物理知识,可解释性较差。因此一种内嵌物理知识的神经网络(Physics Informed Neural Networks, PINN)[6-7]逐渐兴起,其结合数据驱动与物理模型的优势,在先验知识条件下仅利用少量训练数据即可训练出满足物理约束规则的模型,因此在高维物理场预测任务中得到越来越广泛的应用。
PINN不仅能够像传统神经网络一样学习到训练数据样本的分布规律,而且能学习到数学方程描述的物理定律。文献[8]提出可用于解决非线性偏微分方程(Partial Differential Equation, PDE)求解问题的PINN深度学习框架,构建出表征物理量隐含关系的机器学习模型。文献[9]将物理模型的控制方程与卷积神经网络结合,实现无需标签数据训练条件下的非线性系统预测。文献[10]利用卷积递归结构的PhyCRNet,用于空间特征提取和时间演化学习,并在多个非线性PDEs验证求解性能。文献[11]以DenseNet为框架,构建基于有限差分法(Finite Difference Method, FDM)物理约束的自编码神经网络,实现非线性系统的动态建模。
PINN将数据约束方程作为机器学习模型[12]的先验知识,赋予流体力学等工程领域新的物理内涵与认知。文献[13]利用PINN神经网络模型的预测能力实现流动物理模型重建。文献[14]将结构化的深度神经网络与基于物理定律的非线性偏微分方程组耦合,实现温度场预测。这些PINNs将物理控制方程作为限制施加到神经网络训练中,因而能用更少的数据样本学习到更具泛化能力的模型。然而当前物理控制方程约束多为时域数据处理,如频分复用(Frequency Division Mutiplexing, FDM)、有限元法(Finite Element Method, FEM)[15-16]等近似数据分布,由此也带来低计算效率、严格边界条件限制[17]等问题。
因此,本文提出一种基于频域控制方程约束的物理神经网络非线性系统预测方法,在PINN框架下构建时序特征交替更新的非线性预测网络模型,在频域建立基于傅里叶谱方法(Fourier Spectrum Method, FSM)的物理控制方程约束,解决时域计算低效问题,时空数据在网络模型与频域控制约束耦合下实现无标签数据加速训练,完成系统演化学习。
-
本文选取Burgers方程进行湍流预测实验,通过引入物理约束方程控制方法,在模型训练效率、长时演化预测效果以及准确率方面进行对比分析。 Burgers方程是模拟激波传播和反射的非线性偏微分方程,可应用于所有数学领域,尤其是同时含有偏分项与非线性项,被视为描述如流体力学、气体动力学、交通流动力学等众多物理模型的代表性方程。
一维Burgers系统描述如下:
本文设
$ v=0.002\;5,L=1,T=2\;{\rm{s}} $ ,令时间步长$ \tau =0.005\;\mathrm{s} $ ,采用Backward Euler方法,其频域物理控制方程约束为:令
$ {k}_{1}=jk,{k}_{2}=(jk{)}^{2} $ , 系统状态$ {\hat{u}}_{k}^{n+1} $ 更新为:最终通过IDFT实现时域状态物理约束:
-
本次实验环境为Python 3.8,4路NVIDIA GeForce RTX 3090 24 GB显卡。文中所有对比模型均在同一软硬件环境下运行。
PINN模型与物理控制规则约束耦合,并不依赖传统神经网络基于监督数据的训练方式。因此,基于频域物理约束控制的PINN仅利用初始状态,通过无监督数据、短时训练方式进行物理规则学习,基于频域FSM方法构建物理约束,实现未知系统状态长时演化预测。
针对Burgers系统,随机设置2560组初始系统状态用于训练,同时选取另外200组不同初始系统状态作为测试数据,其中50组可作为验证数据,并利用FEM方法得到实际演化数据。其中Burgers系统训练与测试数据部分初始状态如图3所示。
本文所提模型主要参数设置如表1所示。
模型参数名称 设置值 梯度下降法 Adam 学习率η 1.0×10−3 η衰减率 0.99 最大训练次数epochs 200 Burgers系统初始状态组数 2560 训练mini-batch 256 模型输入状态数k 5 -
为充分验证本文提出模型的有效性,在网络架构与物理规则约束两方面进行实验对比研究,表2为不同模型在Burgers系统上的验证MSE对比,基准PINN模型为文献[11]提出的主流Auto-regressive Network网络+时域FDM的PINN预测模型,因此对比模型为该基准模型及其变体,分别进行时域FDM与频域FSM物理控制约束。
表中MSE为均方误差,
$ \mathrm{e}\mathrm{p} $ 为迭代周期。可以看出,随着训练次数的增加,所有模型各时刻系统验证MSE均随之下降,同时随演化时间的增加累计误差也逐渐增大。文献[11]提出的模型在迭代周期10次训练时,在演化时间t为0.25、0.5、1、1.5、2 s时系统验证预测MSE分别为1.82、4.04、4.80、4.77、4.76,而同时刻CliqueNet+FDM系统由于多尺度反馈注意力机制,验证预测MSE下降为0.23、0.36、0.56、0.71、0.76,实现更快的规则学习。在利用频域FSM控制约束物理方程模型后,学习效率进一步提升,CliqueNet+FSM系统验证预测MSE能够达到0.11、0.09、0.10、0.05、0.08。随着训练进行,在t≤0.25 s和t≤0.5 s短时预测情况下,经前期迭代周期20次训练后,本文模型系统验证预测MSE,较基准模型预测MSE,分别从0.42、1.72降为0.06、0.08,MSE分别下降了 86%、95%。在t≤2 s长时预测情况下,经充分训练后(epochs=200)系统验证预测MSE从0.05降为0.01,降低了80%。
模型 系统时间/s $ {{\rm{MSE}}}_{{\rm{ep}}=10} $ $ {{\rm{MSE}}}_{{\rm{ep}}=20} $ $ {{\rm{MSE}}}_{{\rm{ep}}=40} $ $ {{\rm{MSE}}}_{{\rm{ep}}=80} $ $ {{\rm{MSE}}}_{{\rm{ep}}=160} $ $ {{\rm{MSE}}}_{{\rm{ep}}=200} $ Auto-regressive Network + FDM $ t=0.25 $ 1.82 0.42 0.08 0.02 0.03 0.01 $ t=0.5 $ 4.04 1.72 0.06 0.06 0.09 0.02 $ t=1.0 $ 4.80 0.07 0.12 0.10 0.10 0.04 $ t=1.5 $ 4.77 6.03 0.07 0.16 0.07 0.05 $ t=2.0 $ 4.76 6.02 0.10 0.19 0.06 0.04 DenseNet + FSM $ t=0.25 $ 0.24 0.19 0.09 0.05 0.09 0.01 $ t=0.5 $ 0.49 0.56 0.33 0.09 0.14 0.02 $ t=1.0 $ 0.86 1.23 0.94 0.12 0.2 0.03 $ t=1.5 $ 1.05 2.37 1.67 0.13 0.19 0.05 $ t=2.0 $ 1.52 3.43 2.99 0.15 0.19 0.06 CliqueNet + FDM $ t=0.25 $ 0.23 0.17 0.01 0.00 0.00 0.00 $ t=0.5 $ 0.36 0.09 0.03 0.01 0.01 0.02 $ t=1.0 $ 0.56 0.04 0.03 0.01 0.02 0.02 $ t=1.5 $ 0.71 0.06 0.04 0.04 0.03 0.02 $ t=2.0 $ 0.76 0.08 0.05 0.02 0.01 0.03 CliqueNet + FSM $ t=0.25 $ 0.11 0.06 0.00 0.01 0.00 0.00 $ t=0.5 $ 0.09 0.08 0.02 0.01 0.01 0.01 $ t=1.0 $ 0.10 0.11 0.03 0.03 0.02 0.02 $ t=1.5 $ 0.05 0.10 0.02 0.04 0.02 0.02 $ t=2.0 $ 0.08 0.08 0.02 0.04 0.02 0.01 长时三维演化预测效果展示如图4所示。图中采样周期
$ {T}=0.05\;{\rm{s}} $ ,可见频域控制约束PINN模型能够较好预测Burgers系统长时演化,特别是在前1 s演化阶段系统预测状态几乎与实际状态完全一致,后1 s偶有微小波动,但整体与实际演化路径仍然保持一致。图5为更多测试系统状态预测的二维展示。以上测试系统初始状态均为随机,且训练过程从未出现过。可见基于频域物理控制的PINN面向未知初始系统状态,能够较好地预测长时演化路径。基于FSM的频域约束控制方法能够避免大量的时域数值计算,能够有效加快网络训练速度,图6为测试系统预测MSE对比,可见本文模型在具备高效计算的同时,在长时演化预测准确率方面,较基准PINN模型也具有优势,能更好地适应系统演化预测。
Nonlinear System Prediction Method of Physical Neural Networks Based on Frequency Domain Control Constraints
doi: 10.12178/1001-0548.2023036
- Received Date: 2023-02-08
- Rev Recd Date: 2023-08-27
- Available Online: 2024-04-01
- Publish Date: 2024-03-30
-
Key words:
- physical information neural network /
- Fourier spectrum method /
- frequency domain governing equation constraints /
- Burgers system /
- nonlinear system prediction
Abstract: To address the problems of high computational cost and boundary condition limitations associated with the existing physical information neural network using numerical simulation to approximate the physical control equations, a nonlinear system prediction method of physical neural networks based on frequency domain control constraints is proposed. Firstly, a nonlinear prediction network model with alternating updates of temporal features is constructed, followed by a physical control equation constraint based on the Fourier spectrum method (FSM) in the frequency domain, and then the spatio-temporal data are trained without labels under the coupling of the network model and the frequency domain control constraint to complete the system evolution learning. The experimental results show that the proposed method can achieve unlabeled nonlinear complex modeling under physical rule constraints, and has faster learning speed and prediction accuracy compared with the mainstream Physics Informed Neural Network (PINN) model and its variants. In the case of t≤0.25 s and t≤0.5 s short-time prediction, the Mean Square Error (MSE) of the system is reduced by 86% and 95% compared with that of the mainstream baseline model in the same period of time after 20 times of pre-training, and the MSE of the system can be reduced by 80% in the case of t≤2 s long-time prediction after sufficient training.
Citation: | QIAN Kui, SONG Aiguo, TIAN Lei. Nonlinear System Prediction Method of Physical Neural Networks Based on Frequency Domain Control Constraints[J]. Journal of University of Electronic Science and Technology of China, 2024, 53(2): 227-234. doi: 10.12178/1001-0548.2023036 |