留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于时变参数-SIR模型的COVID-19疫情评估和预测

喻孜 张贵清 刘庆珍 吕忠全

喻孜, 张贵清, 刘庆珍, 吕忠全. 基于时变参数-SIR模型的COVID-19疫情评估和预测[J]. 电子科技大学学报, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
引用本文: 喻孜, 张贵清, 刘庆珍, 吕忠全. 基于时变参数-SIR模型的COVID-19疫情评估和预测[J]. 电子科技大学学报, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
YU Zi, ZHANG Gui-qing, LIU Qing-zhen, LÜ Zhong-quan. The Outbreak Assessment and Prediction of COVID-19 Based on Time-varying SIR Model[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
Citation: YU Zi, ZHANG Gui-qing, LIU Qing-zhen, LÜ Zhong-quan. The Outbreak Assessment and Prediction of COVID-19 Based on Time-varying SIR Model[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027

基于时变参数-SIR模型的COVID-19疫情评估和预测

doi: 10.12178/1001-0548.2020027
基金项目: 国家自然科学基金(11247217)
详细信息
    作者简介:

    喻孜(1981 − ),男,副教授,主要从事理论物理方面的研究

    通讯作者: 张贵清,Email: nkzhanggq@tust.edu.cn
  • 中图分类号: O414;TP391

The Outbreak Assessment and Prediction of COVID-19 Based on Time-varying SIR Model

图(8)
计量
  • 文章访问数:  11176
  • HTML全文浏览量:  4398
  • PDF下载量:  415
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-02-02
  • 修回日期:  2020-02-04
  • 网络出版日期:  2020-02-27
  • 刊出日期:  2020-05-01

基于时变参数-SIR模型的COVID-19疫情评估和预测

doi: 10.12178/1001-0548.2020027
    基金项目:  国家自然科学基金(11247217)
    作者简介:

    喻孜(1981 − ),男,副教授,主要从事理论物理方面的研究

    通讯作者: 张贵清,Email: nkzhanggq@tust.edu.cn
  • 中图分类号: O414;TP391

摘要: 该文基于COVID-19疫情发展到2020年2月1日所呈现的特点,对SIR模型进行了修正,使用易感再生数、当日感染率和潜伏感染率来求解病毒演化动力学方程,研究了感染人数的变化趋势,并分析了政府防控措施对趋势变化产生的影响。结果表明,从2020年1月24日后,政府的防控措施有效降低了病毒蔓延趋势。与1月24日之前呈现的趋势相比,截至2020年2月1日,实际感染人数较原趋势预估人数下降了超1/2。易感再生数、当日再生数和潜伏再生数都大幅度降低。基于目前的趋势,对易感再生数、当日感染率、潜伏感染率随时间的变化进行了分析,利用时变参数对疫情发展进行了预测。结果表明在2020年2月9日左右,疫情发展会达到高峰,随后确诊人数将出现下降。

English Abstract

喻孜, 张贵清, 刘庆珍, 吕忠全. 基于时变参数-SIR模型的COVID-19疫情评估和预测[J]. 电子科技大学学报, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
引用本文: 喻孜, 张贵清, 刘庆珍, 吕忠全. 基于时变参数-SIR模型的COVID-19疫情评估和预测[J]. 电子科技大学学报, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
YU Zi, ZHANG Gui-qing, LIU Qing-zhen, LÜ Zhong-quan. The Outbreak Assessment and Prediction of COVID-19 Based on Time-varying SIR Model[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
Citation: YU Zi, ZHANG Gui-qing, LIU Qing-zhen, LÜ Zhong-quan. The Outbreak Assessment and Prediction of COVID-19 Based on Time-varying SIR Model[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 357-361. doi: 10.12178/1001-0548.2020027
  • 截至2020年1月31日晚12点,全国确诊新型冠状病毒肺炎(COVID-19)病患接近1万。政府迅速采取了一系列措施来对抗疫情。从2020年1月23日开始,地方政府陆续开始“封城”并通过媒体实时发布确诊人数、专家通过网络及媒体传播防治疫情的注意事项、全社会自觉在家自我隔离、戴口罩出门、企业延期复工及人员聚集场所关停等。疫情的发展已经严重影响到人们的日常工作与生活,并逐渐开始产生恐慌情绪。全社会都在关注两个重要问题:一是确诊人数将如何变化,什么时候会下降?二是迄今为止,政府所采用的防控措施,产生了多大的积极作用?回答这两个问题,需要对疫情进行科学的预测和评估。

    目前已经有大量工作对COVID-19疫情进行了研究。文献[1]根据最早425例确诊病例数据,描述了病例特征,并估计了关键流行病学延迟时间分布情况,在病毒早期呈指数增长的初期,估计了传染病倍增时间和基本再生数。文献[2]发现了第二代病例,指出病毒会存在“人传人”,对金银潭医院最开始收治患者时候的信息进行归纳研究,指出非华南海鲜市场暴露的病例的存在。文献[3]基于SEIR模型,根据2020年1月25日之前的发展趋势,估算得到了COVID-19的再生数,并对疫情发展进行了预测。还有很多其他研究[4-9],从不同角度对疫情的特点进行了评估。这些研究都对疫情的防治提供了重要的参考。在病毒传播研究中[10-13],由于SIR动力学模型能给出较为清晰的逻辑关系和准确的趋势预测,因而被广泛采用。相比于之前的病毒传播事件,COVID-19疫情比较特殊:1) 相对于总的人口基数,目前的治愈人数和死亡人数都较低,因此出院人员(removed)比率可以忽略不记;2) 从2020年1月11日,官方开始报道确诊人数以来,存在人口流动,因此传统SIR模型认为总体环境是封闭(S+I+R=常数)并不符合现实;3) 由于染病确诊后将被隔离,所以确诊病人并不形成新的感染;4) 此次病毒有较长的潜伏期,会带来明显的延迟效应;5) 此次疫情突发,诊断力量在初期存在明显不足。综上所述,为了更为准确地对疫情进行预测,需要对SIR模型进行修正。本文根据实际情况,对SIR模型进行了适当修正,聚焦国内确诊人数的变化,对趋势进行预测和判断,并根据结果对现有政策进行评估。

    • 本文根据实际疫情对SIR模型进行了一些修正,描述如下:

      1) 由于不存在封闭情况,考虑开放体系。

      2) 新型冠状病毒的治愈人数和死亡人数相对较小,因此只考虑Susceptible(易感)和Infected(感染)两类人群。

      3) 目前数据以天为单位发布,因此不考虑连续变化情况,只考虑离散的方程。

      4) 当确诊后,病人立即隔离,因此不会作为新的感染源。因此感染源应该是第n+1天和第n天诊断的病人差。假设平均染病者(I)会使k个人成为易感者(k为易感再生数),则每日新增的感染者为$ k\left( {{I_{n + 1}} - {I_n}} \right) $

      5) 假设每天有${\mu _1}$的概率(当日感染率)易感者会成为感染者,则当日新增病人为$ {\mu _{\rm{1}}}{S_n}$。其中$ k \mu _1 $,描述了当日病人再生数,后文简称当日再生数。

      6) 病情会有约10天的潜伏期,在初期出现症状后,很多暴露者才会去寻求诊断,同时主要发病地武汉的初期诊断能力有限,这都会带来一个延迟效应。取$\tau $=4,代表平均延迟天数。在平均4天内的潜伏者会以$\,{\mu _2}$的概率(潜伏感染率)被确诊为感染者。则每日潜伏感染人数为$ \,{\mu _2}\left( {{S_n} - {S_{n - \tau }}} \right) $$k{\mu _2}$描述了由于潜伏原因导致的病人再生数,后文简称潜伏再生数。

      基于上述考虑,在每日模型迭代中,各部分更新关系如下:

      $$\begin{split} & {S_{n + 1}} - {S_n} = k({I_{n + 1}} - {I_n}) - {\mu _1}{S_n} - {\mu _2}({S_n} - {S_{n - \tau }}) \\ & \qquad {I_{n + 1}} - {I_n} = {\mu _1}{S_n} + {\mu _2}({S_n} - {S_{n - \tau }}) \end{split} $$ (1)

      为了求解式(1),需要知道(k, ${\mu _1}$, ${\mu _2}$)3个模型参数[14-18],以及IS的初值。I(0)通过官方数据给出(数据来源于官方网站:http://www.nhc.gov.cn/),剩下3个参数以及S(0)则没有信息。本文先给定3个参数和S(0)的初值,求解方程,将得出的解与真实数据进行比较,通过梯度下降法寻找方差的最小值,从而确定模型参数。由于梯度下降法对初值极为敏感,因此,本文还根据经验在一定初值范围内进行多次搜索,保证得到的是最优解。

      模型参数(k, ${\mu _1}$, $\,{\mu _2}$)是根据一个阶段的数据求出,因而能够反应病毒在该阶段的传播趋势。通过截取不同阶段的数据来求解不同阶段的(k, $\,{\mu _1}$, $\,{\mu _2}$),就能分析病毒演化趋势是否在外力作用下发生改变。最后再通过模型参数(k, $\,{\mu _1}$, $\,{\mu _2}$)的变化规律,对未来进行预测。

      官方从2020年1月11日开始公布数据,前4天均无确诊人数变化。本文选择2020年1月15日作为数据研究的起始点,然后变化数据的结束点来截取不同时间段的数据进行求解。为了描述方便,后文对时间段使用结束日期的英文简写来标识。例如1月15日至1月24日这个时间段,简称为Jan.24th时间段,1月15日至1月28日这个时间段,简称为Jan.28th时间段。Jan.24th时间段是文章研究的第一个时间段,此后每增加1天构成一个新的时间段。这是基于以下两点考虑:1) 从Jan.24th时间段开始,已经积攒了足够多的数据(10天的数据);2) 政府从1月11日开始公布确诊人数并采取措施,趋势的形成需要一个时间,并且病毒的最长潜伏期约为14天。需要指出,在理想状况下,S(0)应该是一个确定值,然而,在开放体系下,通过现有的数据无法评估S(0)的真实值。因此只能通过式(1)的解与数据拟合来反向求解S(0)。这会造成不同阶段的S(0)略有不同。然而,由于本文采用了大范围梯度下降搜索,因此每一组参数都是在与现有数据拟合最优情况下得到的,因此文章求解得到的(k, $\,{\mu _1}$, $\,{\mu _2}$)能体现数据背后隐藏的病毒演化趋势。

    • 图1图3给出了不同时间段的拟合效果,其中曲线是模型计算结果,圆点代表官方统计数据。从图中发现模型的计算结果和实际公布的数据吻合较好,说明模型是合理的。同时也发现易感再生数、当日感染率、潜伏感染率参数也确实发生了变化,并且是在不断减小,这和政府的防控措施及民众的居家防护有直接关系。图4给出了3个时间段确诊人数随时间变化的趋势图。从图中可以清楚发现,疾病的传播趋势确实是在减缓的,如果按照Jan.24th时间段的疫情发展趋势,那么在2020年1月31日的确诊人数将会达到近40 000,同样,如果按照Jan.28th时间段的疫情发展趋势,那么1月31日的确诊人数将会达到15 000左右,明显高于实际疫情的发展情况。所以图4表明政府的防控措施和民众的居家防护对于疫情的控制确实效果明显(确诊人数按照趋势变化减少了将近1/2)。

      图  1  Jan.24th时间段的拟合效果图

      图  2  Jan.28th时间段的拟合效果图

      图  3  Jan.31th时间段的拟合效果图

      图  4  不同时间段确诊人数的走势图

    • 为了更清楚地展示从初始阶段(Jan.24th时间段)起的趋势变化情况,本文从第一个阶段(2020年1月15日−1月24日)开始,每增加一天构成一个新的时间段进行求解,得到了易感再生数、当日感染再生数和潜伏感染再生数随时间的演化趋势。结果如图5图7所示,图中的横坐标代表了时间段结束日期,图中x的值取时间段结束日期与1月23日间隔的天数(例如1月24日对应x=1,1月25日对应x=2)。从图中可以看到3个参数都有下降趋势。同时,趋势每天都在改变。说明政府的防控措施和民众的居家隔离确实产生了强力效果。需要注意,2020年1月27日,多地医疗工作者驰援武汉,使得检测能力得到大幅提升,所以导致1月27和28日的确诊人数大幅上升,出现了明显的和前期不一样的易感再生数、当日再生数和潜伏再生数。这些参数的波动,也从侧面证明了本文模型能够敏感地体现外力对趋势的改变。另一方面,也说明参数固定不变的动力学模型无法真实体现此次 COVID-19疫情的变化情况。

      图  5  易感再生数随着时间的演化情况(去除了27日的波动较大点)

      图  6  当日再生数随着时间的演化情况

    • 为了结合现有趋势对未来进行预测,本文去除波动数据的影响对参数进行了拟合,从而得到了参数的变化趋势方程如下:

      $$\left\{ \begin{aligned} & k = 2.173\;24 - 0.008\;73x - 0.002\;44{x^2} \\ & k{\mu _1} = 0.856\;87 - 0.009\;06x - 0.002\;9{x^2} \\ & k{\mu _2} = 0.192\;61 - 0.011\;8x \end{aligned} \right.$$ (2)

      式中,x代表与1月23日间隔的天数,从1月24日开始取1。参数按照式(2)的规律变化,代入式(1)中进行求解,预测1月31日以后的数据,如图8所示。从图中可以看出26天后,也就是2020年2月9日左右应该会出现确诊总数的峰值,同时确诊人数也达到最大的54 000左右。随后确诊人数将会下降。

      图  7  潜伏再生数随着时间的演化情况(去除27,28日上下两个波动点后,发现直线拟合效果最佳,因此用直线拟合)

      图  8  图中给出了在模型最优参数条件下的模型估计值

    • 本文基于修正SIR模型研究了COVID-19疫情发展到2020年2月1日(政府隔天公布数据)为止的趋势和政策的效果。模型的参数根据实时数据拟合得到,因而修正过后的时变参数-SIR模型结果能够反应不同阶段疫情的趋势变化。通过趋势变化能够解读政府的防控措施产生的效果。结果表明,在2020年1月27日和28日,由于全国医疗系统驰援武汉使得确诊能力得到了增强,一些积压和潜伏病人得到收治,因此模型参数出现扰动。其他时间段,参数变化趋势明显。2020年1月24日之后,政府的的防控措施有效地降低了病毒蔓延趋势,使得染病人数的变化趋势逐日下降。易感再生数、当日感染率和潜伏感染率都大幅度降低。基于当前的趋势对疫情发展进行了预测。结果表明,在2月9日左右,疫情会达到高峰,随后确诊人数将会出现下降。

      从动力学方程的解和实际数据的比较来看,本文提出的时变参数-SIR模型能够及时反应现有趋势变化,甚至体现一些突发情况(2020年1月27日全国医疗系统驰援武汉)带来的影响。因此,本文基于现有数据对趋势变化的分析结论应该是有效的。从预测角度来说,动力学预测方案本身就会存在一定的不确定性。然而,本文并没有采用固定参数去求解动力学方程,而是基于前期积累的趋势,采用动态参数求解,这在一定程度上减少了动力学方程的不确定性。因而,本文预测的趋势应该能够提供有益的参考价值。本文基于COVID-19病毒的流行特点,对SIR模型进行的理论修正,以及通过数据确定动态参数进行预测的方案,会对病毒的研究提供积极的理论参考。

      本研究工作还得到天津科技大学青年教师创新基金(2014CXLG23)的资助,在此表示感谢。

参考文献 (18)

目录

    /

    返回文章
    返回