-
许多实际的复杂系统都可以抽象为节点之间存在物质、能量或信息等流动关系的流网络[1]。典型的流网络包括金融机构之间有资金流动的金融网络[2]、地点之间有客流或货流的交通运输网络[3]、论文之间存在引用关系(一种信息的流动)的科学引文网络[4]、物种之间存在能量流动的食物链网络[5]等。在这些流网络的复杂性研究中(实际上是整个复杂网络研究领域中)的一个核心问题是:如何对网络中的关键节点进行识别[6-8]?在这里,节点是否“关键”或者说节点的“中心性”可以根据所研究问题的特点而有不同的衡量标准。如,从网络拓扑结构的角度,可以认为拥有更多直接或间接邻居的节点更为重要,据此可定义度中心性、H指数[9]、核数[10]等节点中心性评估指标;从网络中节点间最短路径的角度,可以认为通过最短路径最多的节点或与其他节点的平均最短距离最小的节点更为重要,据此可定义介数中心性[11]或邻近中心性[12]等指标。类似地,还有很多节点中心性指标可以从网络结构或功能的不同角度来进行定义,文献[6-7]对主要的网络节点中心性指标进行了非常全面的综述和深入的讨论。本文更为关心的是:在一般的含有流的复杂网络中,如何衡量节点在整个流网络系统中的影响力—这种影响力既包括节点出入流的直接影响(如在一个草原生态系统中,植物对食草动物的能量流供给),也会考虑节点间的间接影响(如植物间接供给捕食食草动物的禽兽的能量)。
经济学中的投入产出分析法[13]为前述问题提供了一种可以借鉴的解决手段。标准的投入产出分析法是用来处理国民经济系统中生产和消费部门之间的投入产出问题的一种方法。在这种系统中,每个生产部门都会生产产品,一部分可能被用于最终消费部门的消费,另一部分可能被作为生产资料投入到其他部门的生产活动中。通过假设删除某一个部门后,观察系统总产出的减少量,即可作为评估该生产部门重要性的一种指标。投入产出分析法很容易从部门构成的经济网络扩展应用到很多其他网络系统中。如可以将食物链网络中的每个物种看成一个部门,物种A食用物种B就可以看作是部门B投入给了部门A。但是,标准的投入产出分析法只能用于带有外界消费部门的开放系统中。而对于一些实际的流网络系统,这样的外界可能并不直接存在(例如科学引文网络)或者外界的流入流出数据并不容易获得(例如交通运输网络)。对于这样缺乏外界的封闭流网络系统,标准的投入产出分析法并不能直接应用。最近,文献[14]提出一种对封闭流网络的投入产出矩阵施加微扰求取逆矩阵的方法来计算网络中节点的影响力,并应用于学科领域影响力的评估问题中。但在这种方法的计算过程中,由于施加的微扰破坏了矩阵的稀疏性,导致计算效率降低,难以应用于大规模封闭流网络的关键节点识别。
本文提出另外一种基于投入产出分析法的封闭流网络关键节点识别方法。在封闭流网络系统中引入一个虚拟的外界节点,并将此外界节点与网络中的所有节点建立双向连接,同时设置外界节点到网络某原有节点的流入量等于该节点实际流出量的总和,设置从网络某原有节点到外界节点的流出量等于该节点实际流入量的总和。通过这种方式处理后,就可以直接将标准的投入产出分析法应用到封闭流网络系统的关键节点识别中。本文将首先介绍这一方法的原理和细节,然后给出这一方法的应用实例,并将其评估结果与一些流网络关键节点识别经典算法的结果进行对比。
-
投入产出分析是研究经济系统中各个部门之间投入与产出的相互依存关系的一种经济数量方法[13]。假设某经济系统中共有N个部门,用xji表示部门i投入到部门j的价值,则部门间直接的投入产出系数bji可定义为第j部门产出单位价值所消耗第i部门的价值:
$$ b_j^i = \frac{{x_j^i}}{{{X^j}}} $$ (1) 式中,Xj表示部门j的总产出价值:
$$ {X^j} = \sum\limits_k^N {x_k^j} $$ (2) 如果令其中的部门N表示最终消费者,则其他部门投入到部门N的价值可记为:
$$ {y^i} = x_N^i $$ (3) 根据式(1)~式(3),有:
$$ {X^i} = \sum\limits_{j = 1}^{N-1} {b_j^i} {X^j} + {y^i} $$ (4) 于是前N-1个生产部门的产出量可以写成如下形式:
$$ {\mathit{\boldsymbol{X}}^{(-N)}} = {\mathit{\boldsymbol{B}}^{(-N)}}{\mathit{\boldsymbol{X}}^{(-\mathit{N})}} + {\mathit{\boldsymbol{Y}}^{( - N)}} $$ (5) 式中,X(-N)是删除第N个元素后的X向量;Y(−N)是删除第N个元素后的Y向量;B(-N)是删除第N个部门后的投入产出矩阵。
式(5)也可以写成如下形式:
$$ {\mathit{\boldsymbol{X}}^{(-N)}} = {(1-\mathit{\boldsymbol{B}}(-N))^{ - 1}}{\mathit{\boldsymbol{Y}}^{( - N)}} $$ (6) 式中,L=(1−B(−N))−1被称为Leontief逆矩阵,也被称为完全投入产出系数矩阵。由于该矩阵中既包含了部门之间的直接投入产出关系,也包含了间接投入产出关系。因此,投入产出方法能够用于分析各部门在系统中的整体影响力[13]。
-
虚拟消去法(hypothetical extraction method, HEM)[15]是传统投入产出分析中用来衡量某个部门k的重要性的一种标准方法。HEM通过假设从N-1生产部门中删除一个部门k,然后计算新的系统中剩余的N-2个生产部门的产出量:
$$ \mathit{\boldsymbol{\hat X}} = {(1-{\mathit{\boldsymbol{B}}^{(-N-k)}})^{ - 1}}{\mathit{\boldsymbol{Y}}^{( - N - k)}} $$ (7) 式中,Y(−N−k)是删除第k和第N个元素后的Y向量;B(-N)是删除第k和第N个部门后的投入产出矩阵。那么,部门k的重要性就可以用去除部门k后系统总的产出量$\sum\limits_{i = 1, i \ne k}^{n-1} {{{\mathit{\boldsymbol{\hat X}}}^i}} $相对于原系统中总的产出量$\sum\limits_{i = 1}^{n-1} {{\mathit{\boldsymbol{X}}^i}} $的减少比例Hk来衡量:
$$ {\mathit{\boldsymbol{H}}_k} = \frac{{\sum\limits_{i = 1}^{n-1} {{\mathit{\boldsymbol{X}}^i}}-\sum\limits_{i = 1, i \ne k}^{n-1} {{{\mathit{\boldsymbol{\hat X}}}^i}} }}{{\sum\limits_{i = 1}^{n - 1} {{\mathit{\boldsymbol{X}}^i}} }} $$ (8) Hk越大,说明部门k在整个经济活动中的地位越重要。
-
前述投入产出分析法和HEM很容易扩展到一些流网络系统的节点中心性评估问题中,只要网络中存在节点i到j的流量,并且存在一个最终汇入所有其他节点剩余流量的外界节点。食物链网络是一个符合上述要求的典型网络。在食物链网络中,某物种节点上产出的能量除了被另一些物种节点消耗外,剩余的部分会耗散到“自然界”这个外界节点中。像食物链网络这种存在实际外界节点的系统和存在最终消费者的经济系统,都可以被称为是开放网络流系统。但在更多一般的流网络中,像最终消费者这样的和产业部门不一样的外生部门是很难找到的,将这种不存在或不显式存在外界节点的流网络系统称为封闭流网络系统。为评估封闭流网络系统中各节点的重要性,受文献[16]的启发,本文提出一种为网络增加虚拟外界节点的方法。文献[16]提出的LeaderRank算法,通过在原始网络中添加一个超级节点与所有节点双向相连的方法,能够处理社交网络的节点影响力排序问题。本文将这种方法推广到一般的封闭流网络中:本文在网络中增加一个虚拟的外部节点n,并且将它与网络中已有的所有节点双向连接,并设置外界节点到网络某原有节点的流入量等于该节点实际流出量的总和,设置从网络某原有节点到外界节点的流出量等于该节点实际流入量的总和。通过这种方式处理后,就可以直接将式(1)~式(8)中标准的投入产出分析法应用到封闭流网络系统的关键节点识别中。
-
在使用式(7)计算删去节点k后系统的产出量${\mathit{\boldsymbol{\hat X}}}$时,涉及到矩阵1−B(−N−k)的逆矩阵求解,对于大规模的网络这一过程是较为耗时的。在这里本文可以使用简单迭代法[17]来求解${\mathit{\boldsymbol{\hat X}}}$。由于式(7)可以化为等价的方程组:
$$ \mathit{\boldsymbol{\hat X}} = {\mathit{\boldsymbol{B}}^{(-N-k)}}\mathit{\boldsymbol{\hat X}} + {\mathit{\boldsymbol{Y}}^{(-N - k)}} $$ (9) 根据上式构造如下迭代公式:
$$ {{\mathit{\boldsymbol{\hat X}}}^{(m + 1)}} = {\mathit{\boldsymbol{B}}^{(-N-k)}}\mathit{\boldsymbol{\hat X}}(m) + {\mathit{\boldsymbol{Y}}^{(-N - k)}} $$ (10) 式中,m为当前迭代次数,初始条件可取$ \mathit{\boldsymbol{\hat X}}(0) = {(1, 2, \cdots, 1)^{\rm{T}}}$。根据式(1)可知投入产出矩阵B是一个列归一化矩阵,其最大特征值为1[13]。而迭代矩阵B(−N−k)是在B中删去了两行两列,因此其最大特征值(即谱半径)一定小于1。由线性方程组简单迭代法收敛的充分必要条件是迭代矩阵谱半径小于1[17]可知,式(10)的迭代过程一定收敛。在本文的后续实例计算中,本文设定的迭代控制条件为$\mathop {\max }\limits_{1 \le i \le N-1, i \ne k} \left| {{{\mathit{\boldsymbol{\hat X}}}^i}(m + 1)-{{\mathit{\boldsymbol{\hat X}}}^i}(m)} \right| < 10^{-6}$
Identification of Critical Nodes in Flow Network by a Virtual External Input-Output Analysis
-
摘要: 网络关键节点识别是复杂网络研究的核心问题之一。经济学中的投入产出分析法可以用于评估带有外界流入流出量的开放流网络的节点中心性,但该方法不能直接应用于缺乏外界流入流出量的封闭流网络系统的关键节点识别。该文通过引入虚拟的外界节点将封闭流网络系统转化为开放的流网络系统,再在转换后的网络上进行标准的投入产出分析即可对网络关键节点进行识别。以中国铁路网络和世界粮农贸易网络关键节点识别问题为例,演示了虚拟外界投入产出分析法的应用过程与结果。该文方法为评估一般的封闭流网络系统中的节点中心性提供了一种可选手段。Abstract: Identification of critical nodes in a network is one of key issues in complex network analysis. The input-output (IO) model in economics can be used to evaluate the node centrality in open flow networks, but it cannot be directly applied to closed flow networks which lack of external inflow and outflow. This paper introduces a virtual external node to convert the closed flow network into an open flow network, which makes the standard IO analysis method can be used to identify critical nodes in closed flow networks. This virtual external IO analysis method is then applied to the identification of critical nodes in Chinese Railway Network and the World Food and Agriculture Trade Network. The proposed analysis method provides an alternative approach for evaluating node centrality in closed flow networks.
-
[1] BARRAT A, BARTHELEMY M, PASTOR-SATORRAS R, et al. The architecture of complex weighted networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(11):3747-3752. doi: 10.1073/pnas.0400087101 [2] GAI P, KAPADIA S. Contagion in financial networks[C]//Proceedings of the Royal Society of London A: Mathematical, Physical and Engineering Sciences. London: The Royal Society, 2010: 2401. [3] LIN J Y, BAN Y F. Complex network topology of transportation systems[J]. Transport Reviews, 2013, 33(6):658-685. doi: 10.1080/01441647.2013.848955 [4] LEICHT E A, CLARKSON G, SHEDDEN K, et al. Large-scale structure of time evolving citation networks[J]. The European Physical Journal B-Condensed Matter and Complex Systems, 2007, 59(1):75-83. doi: 10.1140/epjb/e2007-00271-7 [5] DUNNE J A, WILLIAMS R J, MARTINEZ N D. Food-web structure and network theory:the role of connectance and size[J]. Proceedings of the National Academy of Sciences, 2002, 99(20):12917-12922. doi: 10.1073/pnas.192407699 [6] LÜ L Y, CHEN D B, REN X L, et al. Vital nodes identification in complex networks[J]. Physics Reports, 2016, 650:1-63. doi: 10.1016/j.physrep.2016.06.007 [7] 任晓龙, 吕琳媛.网络重要节点排序方法综述[J].科学通报, 2014, 59(13):1175-1197. https://www.researchgate.net/profile/Xiaolong_Ren3/publication/270461711_Review_of_ranking_nodes_in_complex_networks/links/5836f10a08aed45931c813c9/Review-of-ranking-nodes-in-complex-networks.pdf REN Xiao-long, LÜ Lin-yuan. Review of ranking nodes in complex networks[J]. Chinese Science Bulletin, 2014, 59(13):1175-1197. https://www.researchgate.net/profile/Xiaolong_Ren3/publication/270461711_Review_of_ranking_nodes_in_complex_networks/links/5836f10a08aed45931c813c9/Review-of-ranking-nodes-in-complex-networks.pdf [8] 刘建国, 任卓明, 郭强, 等.复杂网络中节点重要性排序的研究进展[J].物理学报, 2013, 62(17):178901-178901. doi: 10.7498/aps.62.178901 LIU Jian-guo, REN Zhuo-ming, GUO Qiang, et al. Node importance ranking of complex networks[J]. Acta Physica Sinica, 2013, 62(17):178901. doi: 10.7498/aps.62.178901 [9] LÜ L Y, ZHOU T, ZHANG Q M, et al. The H-index of a network node and its relation to degree and coreness[J]. Nature Communications, 2016, 7:10168. doi: 10.1038/ncomms10168 [10] KITSAK M, GALLOS L K, HAVLIN S, et al. Identification of influential spreaders in complex networks[J]. Nature Physics, 2010, 6(11):888-893. doi: 10.1038/nphys1746 [11] FREEMAN L C. A set of measures of centrality based on betweenness[J]. Sociometry, 1977, 40(1):35-41. doi: 10.2307/3033543 [12] SABIDUSSI G. The centrality index of a graph[J]. Psychometrika, 1966, 31(4):581-603. doi: 10.1007/BF02289527 [13] LEONTIEF W. Input-output economics[M]. Oxford:Oxford University Press, 1986. [14] SHEN Z, YANG L, PEI J, et al. Interrelations among scientific fields and their relative influences revealed by an input-output analysis[J]. Journal of Informetrics, 2016, 10(1):82-97. doi: 10.1016/j.joi.2015.11.002 [15] TEMURSHOEV U. Identifying optimal sector groupings with the hypothetical extraction method[J]. Journal of Regional Science, 2010, 50(4):872-890. doi: 10.1111/jors.2010.50.issue-4 [16] LÜ L Y, ZHANG Y C, CHI H Y, et al. Leaders in social networks, the delicious case[J]. Plos One, 2011, 6(6):e21202. https://www.researchgate.net/profile/Chi_Ho_Yeung/publication/51476359_Leaders_in_Social_Networks_the_Delicious_Case/links/004635183714f0b85f000000.pdf [17] GOLUB G H, VAN LOAN C F. Matrix computations(Vol. 3)[M]. Baltimore:Johns Hopkins University Press, 2012. [18] BRIN S, PAGE L. The anatomy of a large-scale hypertextual web search engine[J]. Computer Networks and ISDN Systems, 1998, 30(1-7):107-117. doi: 10.1016/S0169-7552(98)00110-X [19] DE DOMENICO M, NICOSIA V, ARENAS A, et al. Structural reducibility of multilayer networks[J]. Nature Communications, 2015, 6:6864. doi: 10.1038/ncomms7864