-
利用实证数据对流行病传播过程进行建模分析有助于深入分析流行病传播的内在机制,预测传播范围,为进行有效的流行病防控提供重要依据[1-3]。由于缺乏对新型冠状病毒肺炎(COVID-19)传播机制的了解,且没有针对新型冠状病毒(SARS-CoV-2)的疫苗,自COVID-19确诊以来,确诊规模不断扩大[4]。据国家卫生健康委员会官方网站的疫情通报数据显示,截止至2020年3月2日24时,累计报告确诊病例80 151例,累计死亡病例2 943例。世界卫生组织官网宣布,将COVID-19疫情列为国际关注突发公共卫生事件。疫情的爆发不仅给各地医疗公共卫生机构[5-7],以及科学界带来了巨大挑战,还使各行各业直接面临停工停产的严峻考验。尽管在国家和各地政府的努力下,疫情蔓延的势头在一定程度上受到遏制[8],但限于对COVID-19传播机制的认知,有关疫情可能持续的期限、近期出现拐点的可能性和可以采取的最有效防控措施等问题仍莫衷一是。因而,在缺乏确切的治愈手段和疫苗的情况下,对COVID-19的传播机制进行解构分析,能帮助准确研判疫情的传播途径和扩散范围,以便及时干预,科学防治,精准施策,最大限度降低疫情的影响。
引发COVID-19的SARS-CoV-2是一种新型病毒,各领域的专家学者在短时间内做了大量的研究工作,为深入分析病毒的特性和COVID-19的传播机制提供了第一手资料。除针对COVID-19病理学及发病机理的研究[9-10]外,科研工作者及时追踪每天疫情的进展及病例动态,进而对COVID-19疫情的发展态势进行预测和分析。研究工作主要集中在预估新增病例和死亡人数[11-13]、COVID-19传染机制的研究[14-16]、人员流动对疫情传播的影响[17-19]、隔离和疑似病例对疫情的影响[20]、估计疫情在境外的发展趋势[21-22]、未来疫情防控工作中对医疗卫生服务的需求[23]等。
目前,学者们对COVID-19的研究已取得了进展,然而,对于病毒传播过程的模型设计还有待完善。本文试图从实证数据出发,结合COVID-19传播的特点,提出了P-SI模型。该模型考虑了省际流动人群对每天新增感染COVID-19病例的影响,能够刻画一个省内每天新增感染COVID-19病例的变化趋势。本文用2019年12月31日−2020年1月30日的实证数据拟合出P-SI模型,该模型可以描述湖北省3个阶段的COVID-19传播情况。此外,本文还发现用另一个相同的P-SI模型可以描述其他4省的COVID-19传播过程。用实证数据检验拟合的模型能够描述各省每天新增感染COVID-19的人数。在此基础上,以2020年1月23日为分界点,将分界点前的实证数据视为训练集,拟合各省的P-SI模型。在修正了拟合模型的参数后,本文发现拟合模型能够对分界点后的每天新增病例人数作辅助预测,其预测出各省感染COVID-19的动态情况与实证数据相符。
HTML
-
本文选取了在浙江、安徽、广东、陕西4省发现的573例COVID-19感染人员进行研究。数据覆盖的时间从2019年12月31日−2020年1月30日,包含了感染人员进入湖北省的日期,离开湖北省的日期、发病日期、就诊日期和确诊日期。其中,有部分人员长期在湖北省居住,并在2020年1月30日前返回上述4省,累计163人。部分人员在返回上述4省期间,曾在湖北省短期停留,累计252人。还有部分人员没有去过湖北省,一直在上述4省,累计158人。本文对这3类人员做了统计,如表1所示。本文在使用P-SI模型拟合湖北省和4省的COVID-19传播过程时,用的是2020年12月31日−1月30日的完整数据。
日期 客居数 流动数 留原省数 2019.12.31−2020.01.23 161 242 72 2020.01.24−2020.01.30 2 10 86 实证数据中每个病例都有确切的发病日期,但个别数据缺少确诊日期或仅登记了就诊日期,这为准确定义每个病例发病后所具备传染性的有效时间带来了不确定性。为准确估算每个病例传染性的有效时间,对所有登记了就诊日期和确诊日期的病例做了统计,发现从就诊日期至确诊日期的平均值为3.845 2天(约为4天),从发病日期至确诊日期的平均值为6.291 0天(约为6天)。本文分2种情况为缺少确诊日期的病例推算确诊日期,对登记了就诊日期的病例按延后4天推算出确诊日期,同时对没有登记就诊日期记录的病例按延后6天推算出确诊日期。从而可为每个病例定义发病日期至确诊日期为具备传染性的时间段。
以2020年1月23日湖北武汉“封城”作为分界点,对各省感染的数据进行划分,将2019年12月31日−2020年1月23日的4省数据划分为训练集,将2020年1月24日−1月30日的4省数据划分为测试集。
-
由于国家卫生健康委员会和各地方政府每天都会公布有关疫情和感染情况的实时通报,可以掌握实证数据573例感染人员的实时状态。在拟合出P-SI辅助预测模型后,实际可以得到大量与2019年12月31日−2020年1月23日期间感染情况相符的模型。为了从中选出最符合实际情况模型,根据2020年1月24日与1月25日2天的实时通报中公布的新增感染COVID-19人数,仅保留拟合模型中预测得到的2020年1月24日与1月25日这两天每天新增感染COVID-19人数与实际最接近的模型。于是,本文便能得到有限个较为理想的P-SI辅助预测模型,从而再用这些模型预测2020年1月24日−1月30日4省感染COVID-19的总体情况。
-
本文根据掌握的573位感染人员的数据,分别对湖北省及其他4个省的COVID-19传播模型进行拟合。由于湖北省武汉市于2020年1月23日当日10:00开始“封城”,湖北省其他城市也采取了严格的措施,大部分客居人员和流动人员大都在“封城”前回到自己所属省。本文便以2019年12月31日−2020年1月23日期间在湖北长期客居和短期停留人员的感染情况数据来拟合湖北省的COVID-19传播模型。将统计信息代入式(3),便可求解得出参数λH=0.526 1和参数εH=0.349 9。拟合结果如图3所示。
图3中空心方块标记的曲线描述了湖北省每天新增感染COVID-19人数,空心圆圈标记的曲线则是根据拟合的传播模型计算得出每天新增感染COVID-19人数。从空心方块标记的曲线变化趋势看,传播分为3个阶段:第1阶段是2019年12月31日−2020年1月8日,为病毒传播的最初期。每天的新增感染人数在该阶段相对较少。第2阶段是2020年1月9日−1月15日,为病毒传播的平稳期。每天的新增感染人数在该阶段有所上升,并伴有微小波动。第3阶段是2020年1月16日−1月23日,为病毒传播的爆发期。每天的新增感染人数在该阶段急剧增加,达到顶峰。后因所有客居人员或流动人员均在湖北省采取严厉措施前回到所属省,所以湖北省的感染人数随人员的离开而降低了。
拟合曲线的变化趋势与实际曲线大体相同,能大致地将每天新增感染COVID-19人数描绘出来,在图中能够明显区分出3个阶段的变化。同时拟合曲线能将某些日期上新增感染人数的波动体现出来。如空心方块标记的曲线展示出了2020年1月4日、1月9日、1月16日人数的上升,以及在1月18日先下降,在1月19日又上升等变化趋势。空心圆圈标记的曲线也都较好地描绘了类似变化趋势,只是在日期上可能会有1~2天的时间差。这主要是因为用于拟合的数据量有限,会带来一些误差。
以2019年12月31日−2020年1月30日间在湖北短期停留人员和没有去过湖北人员的感染情况数据来拟合4个省的COVID-19传播模型。本文将4组统计信息代入式(8),便可求解得出对应的4组参数。其中浙江省的参数
${\lambda _{i1}}$ =0.003 4,${\lambda _{i2}}$ =0.002 3,参数εi=−1.646 2;安徽省的参数${\lambda _{i1}}$ =0.007 9,${\lambda _{i2}}$ =0.000 8,参数εi=0.275 7;陕西省的参数${\lambda _{i1}}$ =0.010 2,${\lambda _{i2}}$ =0.008 3,参数εi=−0.726 1;广东省的参数${\lambda _{i1}}$ =0.019 0,${\lambda _{i2}}$ =0.015 5,参数εi=−2.517 8,结果如图4所示。图4a~4d中空心方块标记的曲线依次描述浙江、安徽、陕西、广东4个省每天新增COVID-19实际感染人数,空心圆圈标记的曲线则是根据拟合的传播模型计算得出每天的新增感染人数。从空心方块标记的曲线的变化趋势看,传播的最初期和平稳期内新增感染人数并没有显著变化,在2020年1月16−1月18日开始进入COVID-19传播的爆发期。前期感染人数变化不显著的原因是当时感染源主要在湖北武汉,由少量离开湖北到外省的流动人员携带SARS-CoV-2至所属省,引发COVID-19初期传播。由于从湖北省到这4个省乘坐高铁,只需1天即可抵达。在武汉“封城”前,携带SARS-CoV-2的感染人员陆续返回所属省,大量输入病例进入该省,COVID-19也随之传播。因而,4省的爆发期与湖北省的非常接近。在4省的爆发期,新增感染人数达到峰值以后曲线陡然下降。一方面是因为本文仅追踪了有限的实证数据,其中涉及的易感人群已大都受到了感染,将来可能被感染的易感人群成为了极少数,所以新增感染人数也接近于0。另一方面是因为各省均已加大了防控力度,限制了COVID-19的传播渠道和速度,新增感染人数也相应地得到了一定的控制。
空心圆圈标记的拟合曲线能够大致地刻画每天新增感染人数的变化趋势,尤其刻画了最初期及平稳期新增感染人数保持平稳的趋势,而在爆发期人数急剧攀升和人数陡然下滑的变化趋势也与实际情况大体相符。以浙江省为例,可以观察到,该省的实际新增感染人数在2020年1月15日前较为平稳,在1月16日以后便迅速上升,在1月21日到达峰值后,在22日略有下降,在1月23日再次攀升后便立即下降。相应地,空心圆圈标记的拟合曲线同样在2020年1月16日以后迅速上升,在1月23日到峰值后便立即下降。该拟合曲线较为平滑,尽管没能刻画真实情况中的一些细微变化,如:局部峰值,先降后升的变化,或在日期上存在1~2天的偏差等情况,但总体上能够反映该省每天新增感染COVID-19情况。其他3个省的拟合曲线总体上也比较符合实际情况。可见,用同1个模型能够模拟4个省的COVID-19传播过程。
-
按1.3、2.1和2.2节的思路将4个省的实证数据划分为训练集和测试集,依次运用各省的训练集数据拟合出P-SI模型的相关参数。以2020年1月23日的感染人数Ii和易感人数Si为初始信息,将其代入式(8)推测出1月24日的新增感染人数
$\Delta {I_i}$ ,更新当天的感染人数Ii和易感人数Si,以此类推,得到1月25日的每天新增感染人数$\Delta {I_i}$ ,感染人数Ii和易感人数Si。在产生了多组模型后,对照2020年1月24日−1月25日两天的新增感染COVID-19实际人数,按每个省分别选取了预测结果最接近实际情况的4个模型,并以之对2020年1月24日−1月30日感染COVID-19的情况进行了预测。将预测结果展示在图5上,可以从图5看到预测得到新增感染人数
$\Delta {I_i}$ 、感染人数Ii、易感人数Si与实际人数之间的差异。同时,从上述16个模型得到预测结果最接近每天新增感染COVID-19人数的4个模型的参数,列于表2。参数\省份 浙江 安徽 陕西 广东 ${\lambda _{i1}}$ 0.002 9 0.000 2 0.000 4 0.000 4 ${\lambda _{i2}}$ 0.003 2 0.010 6 0.005 2 0.021 4 εi −1.820 5 1.633 4 1.394 0 0.399 1 图5a~5l依次展示了模型对浙江、安徽、陕西和广东4省每天新增感染人数
$\Delta {I_i}$ 、感染人数Ii和易感人数Si的预测情况。以浙江省为例,图中由空心方块标记的曲线描述了该省每天实际新增感染人数、感染人数和易感人数,由空心圆圈、空心三角形、空心倒三角形和空心菱形标记的曲线则分别对应参数β取不同值时所得到的预测结果。根据图5a,可以发现由空心方块标记的曲线描绘的每天实际新增感染人数$\Delta {I_i}$ 在2020年1月25日前和1月28日后单调下降,而在1月26日和1月27日间有一个先增后降的过程。P-SI模型预测的每天新增感染人数$\Delta {I_i}$ 是一条单调下降的曲线,与实际情况较为接近,但没有能预测出该省在2020年1月26日和1月27日间感染人数的波动。图5b和图5c则是根据预测到的每天新增感染人数$\Delta {I_i}$ 求得的感染人数Ii和易感人数Si变化趋势。从感染人数Ii和易感人数Si的变化趋势来看,预测结果本来与实际情况略有偏差,只因模型未能预测到2020年1月26日和1月27日新增感染人数的一个上升波动,加大了预测的易感人数Si以及感染人数Ii与实际人数的偏差量,但总体的变化趋势较为一致。根据4个省的预测趋势图,可以看出尽管预测模型对每天新增感染人员的波动情况还不能准确刻画,而没有掌握2020年1月23日流动人员入省的信息对感染人数Ii和易感人数Si的预测存在一定影响,如造成了广东省在2020年1月24日预测的新增感染人数与实际情况出现了些许偏差,且这部分偏差致使后期对当地感染人数的预测偏差逐渐加大。但该辅助预测模型对每个省的感染情况的描述还是大致符合实际的。此外,预测得到的各省的参数彼此间存在差异,体现了COVID-19在各省传播扩散的速度和程度有所不同。