留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于TOPSIS的时序网络节点重要性研究

郭强 殷冉冉 刘建国

郭强, 殷冉冉, 刘建国. 基于TOPSIS的时序网络节点重要性研究[J]. 电子科技大学学报, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
引用本文: 郭强, 殷冉冉, 刘建国. 基于TOPSIS的时序网络节点重要性研究[J]. 电子科技大学学报, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
GUO Qiang, YIN Ran-ran, LIU Jian-guo. Node Importance Identification for Temporal Networks via the TOPSIS Method[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
Citation: GUO Qiang, YIN Ran-ran, LIU Jian-guo. Node Importance Identification for Temporal Networks via the TOPSIS Method[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021
基金项目: 

国家自然科学基金 61773248

国家自然科学基金 71771152

国家社会科学基金重大项目 18ZAD088

详细信息
    作者简介:

    郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

    通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn
  • 中图分类号: TP311;N94

Node Importance Identification for Temporal Networks via the TOPSIS Method

计量
  • 文章访问数:  4131
  • HTML全文浏览量:  1460
  • PDF下载量:  94
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-05-06
  • 修回日期:  2018-09-13
  • 刊出日期:  2019-03-30

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021
    基金项目:

    国家自然科学基金 61773248

    国家自然科学基金 71771152

    国家社会科学基金重大项目 18ZAD088

    作者简介:

    郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

    通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn
  • 中图分类号: TP311;N94

摘要: 时序网络考虑事件发生的顺序,可以更准确地刻画复杂系统的演化特征。本文采用多属性排序方法(TOPSIS)对时序网络不同时间片段节点的影响力进行综合评价。具体的思想是通过计算不同层间相似性指标值与正理想解和负理想解的欧式距离,根据其接近正理想解和远离负理想解的程度对层间耦合关系的度量方法进行排名。基于Workspace数据集的实验结果表明,以优先链接指标(PA)度量时序网络时间层耦合关系,所挖掘出的重要节点准确率最高,在各时间层上平均达到50.82%。该文的工作为从多属性角度分析时序网络提供了借鉴。

English Abstract

郭强, 殷冉冉, 刘建国. 基于TOPSIS的时序网络节点重要性研究[J]. 电子科技大学学报, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
引用本文: 郭强, 殷冉冉, 刘建国. 基于TOPSIS的时序网络节点重要性研究[J]. 电子科技大学学报, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
GUO Qiang, YIN Ran-ran, LIU Jian-guo. Node Importance Identification for Temporal Networks via the TOPSIS Method[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
Citation: GUO Qiang, YIN Ran-ran, LIU Jian-guo. Node Importance Identification for Temporal Networks via the TOPSIS Method[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 296-300. doi: 10.3969/j.issn.1001-0548.2019.02.021
  • 时序网络考虑节点之间的交互关系和次序,可以更加准确地刻画手机通讯、社交等复杂系统的交互关系[1-2]。通过研究时序网络的层间耦合关系,挖掘出时序网络中的重要节点,有利于人们对时序网络进一步了解,可以应用于疾病传播、谣言扩散、新产品的推广以及计算机病毒的治理等方面[1-3]

    目前,对时序网络层间耦合关系的研究有两种比较重要的思想:1)认为时序网络的层间耦合强度是一个固定的常数,常数的大小值即决定了层间耦合关系的强弱[3];2)时序网络中相邻时间切片间的耦合关系可以通过局部相似性指标来衡量。文献[4]提出了时序网络中相邻时间切片间耦合关系的度量方法,其实质是将静态网络中相似性的度量方法延伸到时序网络中。而静态网络中相似性的度量方法有很多,如:共同邻居(common neighbour, CN)、Salton指标(Salton index, SAL)[5]、Jaccard指标(Jaccard index, JAC)[6]等,这些局部结构相似性的指标[7]均可扩展至时序网络,以衡量相邻时间切片间的耦合关系。假定时序网络层间耦合强度为一固定参数时,强度系数的衡量并没有统一的界定方法,且在一定程度上忽略了节点间的差异性,所以本文主要研究基于局部相似性指标度量时序网络的层间耦合关系的方法。

    为了度量时序网络层间耦合关系的影响力,本文计算了不同时序网络层间耦合关系下挖掘重要节点的准备率,准确率越高,则对应的层间耦合关系的度量越准确。文献[3]应用多层耦合网络分析的方法,构造了超邻接矩阵(supra-adjacency matrix)模型以表示时序网络的层间关系和层内关系。层内关系为每个时间切片上的静态网络结构。随后,基于特征向量的中心性方法,超邻接矩阵最大特征值所对应的特征向量为各时间切片上对应节点的重要性。本文采用文献[3]提出的中心性方法,计算出不同层间耦合关系下各时间切片上对应节点的重要性。将此结果与删除节点后节点对网络的影响力结果作比较,求出kendall’s tau值[8],即为对应层间耦合关系度量方法下的各时间层所挖掘出重要节点的准确率。

    然而,因为时序网络的网络特性,很难有一种层间耦合关系的度量指标能保证其挖掘重要节点的准确率在各时间切片上都是最好的。本文介绍了综合考虑目标多属性的综合决策方法(TOPSIS)[9],对层间耦合关系影响力的评估问题进行了细致研究。本文将不同层间耦合关系的度量方法作为备选方案,各个时间片上的准确率作为属性值,利用TOPSIS方法即可确定最佳的时序网络层间耦合关系的度量方法。实验结果表明,基于TOPSIS方法求出以优先链接指标(PA)度量时序网络时间层耦合关系时,所挖掘出的重要节点准确率最高,在各时间层上平均达到50.82%。本文不仅解决了如何度量时序网络层间耦合关系的问题,并且解决了时序网络各时间层准确率不一,如何寻找最优指标的问题,准确地给出时序网络层间耦合关系的度量指标。

    • 已有的基于局部结构相似性的度量指标可以延伸至时序网络中,以度量时序网络层间耦合关系。

      基于局部结构的相似性指标主要分为两类,一类是基于相邻时间切片上节点自身邻居的考虑,具体思想是两个节点的共同邻居越多,两节点越相似。包括CN以及基于CN指标衍生的归一化指标:SAL[5]、JAC[6]、Sorensen指标(Sorensen index, SOR)[10]、大度节点有利指标(hub promoted index, HPI)[11]、大度节点不利指标(hub depressed index, HDI)、LHN-I指标(leicht-holme-newman index, LHN)[12]、优先链接指标(preferential attachment index, PA)。另一类是基于相邻时间切片上节点共同邻居的考虑,包括Adamic-Adar指标(Adamic-Adar index, AA)[13]、资源分配指标(resource allocation index, RA)[14]、质量扩散(the mass diffusion, MD)[15]、热传导(heat conduction, HC)[16]、改进热传导(improved heat conduction, IHC)[17]。在时序网络中,因为对应节点的共同邻居在相邻时间切片上的度并不一致,为了消除这种不一致,本文将相邻时间片$t$和$t + 1$上节点$i$的度$k_i^t$和$k_i^{t + 1}$分别进行了取最大值(max)、最小值(min)、均值(mean)、乘积(mul)、求和(sum)、以及度之和减去共同邻居(scn)的处理。

      本文用${{{\mathit{\boldsymbol{A}}}}^{{\text{(}}t{\text{)}}}} = \{ a_{ij}^t\} $表示在时间层$t$上的邻接关系,$a_{ij}^t = 1$表示在时间层$t$上节点$i$和节点$j$有连边;反之$a_{ij}^t = 0$。则:

      $$k_i^t = a_{ij}^ta_{ij}^{t + 1}\sum\limits_j {a_{ij}^t} $$ (1)
      $${\text{ }}k_i^{t + 1} = a_{ij}^ta_{ij}^{t + 1}\sum\limits_j {a_{ij}^{t + 1}} $$ (2)

      所以共同邻居节点$i$的度信息${k_i}$对应的6种计算方式分别为:

      $${k_i} = \min (k_i^t,k_i^{t + 1})$$ (3)
      $${k_i} = \max (k_i^t,k_i^{t + 1})$$ (4)
      $${k_i} = k_i^t + k_i^{t + 1}/2$$ (5)
      $${k_i} = k_i^tk_i^{t + 1}$$ (6)
      $${k_i} = k_i^t + k_i^{t + 1}$$ (7)
      $${k_i} = k_i^t + k_i^{t + 1} - \sum\limits_j {a_{ij}^ta_{ij}^{t + 1}} $$ (8)

      为此,节点$j$在相邻时间片$t$和$t + 1$的局部结构相似性度量指标的计算公式为:

      $${\text{CN}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} $$ (9)
      $${\text{SAL}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sqrt {\left[ {\sum\limits_i {a_{ij}^t} } \right]\left[ {\sum\limits_i {a_{ij}^{t + 1}} } \right]} }}$$ (10)
      $${\text{JAC}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sum\limits_i {a_{ij}^t} + \sum\limits_i {a_{ij}^{t + 1}} - \sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}$$ (11)
      $${\text{SOR}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{2\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sum\limits_i {a_{ij}^t} + \sum\limits_i {a_{ij}^{t + 1}} }}$$ (12)
      $${\text{HPI}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{2\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\min \left[ {\sum\limits_i {a_{ij}^t} ,\sum\limits_i {a_{ij}^{t + 1}} } \right]}}$$ (13)
      $${\text{HDI}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{2\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\max \left[ {\sum\limits_i {a_{ij}^t} ,\sum\limits_i {a_{ij}^{t + 1}} } \right]}}$$ (14)
      $${\text{LHN}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sum\limits_i {a_{ij}^t} \sum\limits_i {a_{ij}^{t + 1}} }}$$ (15)
      $${\text{PA}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {a_{ij}^t} \sum\limits_i {a_{ij}^{t + 1}} $$ (16)
      $${\text{AA}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {\frac{1}{{\log {k_i}}}} $$ (17)
      $${\text{RA}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {\frac{1}{{{k_i}}}} $$ (18)
      $${\text{MD}}:{\text{ }}c_j^{(t,t + 1)} = \frac{1}{{k_i^t}}\sum\limits_i {\frac{1}{{{k_i}}}} $$ (19)
      $${\text{HC}}:{\text{ }}c_j^{(t,t + 1)} = \frac{1}{{k_i^{t + 1}}}\sum\limits_i {\frac{1}{{{k_i}}}} $$ (20)
      $${\text{IHC}}:{\text{ }}c_j^{(t,t + 1)} = \frac{1}{{{{(k_i^{t + 1})}^2}}}\sum\limits_i {\frac{1}{{{k_i}}}} $$ (21)

      式(17)~式(21)中的节点$i$的度信息可以分别有6种定义方式(见式(3)~式(8)),则共有30种层间耦合关系的定义方式;加上式(9)~式(16)的8种方式,共有38种度量层间耦合关系的指标。

    • 本文运用上述38种层间耦合关系度量指标对Workspace数据集中所有员工的重要性进行量化,根据其量化后在各时间切片上排序的准确率情况,本文通过TOPSIS多属性排序方法选取最优的层间耦合关系度量指标。

      多属性排序方法TOPSIS[9]通过构造多属性问题的正理想解和负理想解,以接近正理想解和远离负理想解这两个基准作为评价各可行方案的依据,是一种逼近理想解的排序方法。其中正理想解指的是各属性值都达到各评价方案中的最优值,负理想解则为各属性值都达到各评价方案中的最差值。本文首先计算不同层间耦合关系挖掘重要节点在各时间切片上的准确率与正理想解和负理想解的距离,再根据算得的距离计算该准确率贴近正理想解的程度,对各层间相似性度量指标进行排名具体步骤如下。

    • 记$X = \{ {x_1},{x_2}, \cdots ,{x_n}\} $,$n = 38$表示层间耦合关系度量值标的个数,$Y = \{ {y_1},{y_2}, \cdots ,{y_m}\} $,$m = T$表示时间切片的数目,定义指标集$X$中的第$i$个度量指标${x_i}(i = 1,2, \cdots ,n)$在第$j$个时间切片${y_j}(j = 1,2, \cdots ,m)$下挖掘出重要节点准确率为${y_{ij}}$,则初始矩阵为:

      $${Y_{ij}} = \left[ {\begin{array}{*{20}{c}} {{y_{11}}}&{{y_{12}}}& \cdots &{{y_{1m}}} \\ {{y_{21}}}&{{y_{22}}}& \cdots &{{y_{2m}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{y_{n1}}}&{{y_{n2}}}& \cdots &{{y_{nm}}} \end{array}} \right]$$ (22)
    • 因为每种指标的量纲不同,初始矩阵应该转化为标准矩阵${{\mathit{\boldsymbol{Z}}}_{ij}} = \{ {z_{ij}}\} $,其中:

      $${z_{ij}} = {y_{ij}}/\sum\limits_{i = 1}^n {y_{ij}^2} $$ (23)
    • 本文认为各时间片上准确率的权重是一样的,则第$j$个时间切片的权重系数${\omega _j} = 1/m$,$j = 1,2, \cdots ,m$。构造加权标准化矩阵:

      $${{\mathit{\boldsymbol{R}}}_{ij}} = \{ {r_{ij}}\} = \{ {\omega _j}{z_{ij}}\} = \left[ {\begin{array}{*{20}{c}} {{\omega _1}{z_{11}}}&{{\omega _2}{z_{12}}}& \cdots &{{\omega _m}{z_{1m}}} \\ {{\omega _1}{z_{21}}}&{{\omega _2}{z_{22}}}& \cdots &{{\omega _m}{z_{2m}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{\omega _1}{z_{n1}}}&{{\omega _2}{z_{n2}}}& \cdots &{{\omega _m}{z_{nm}}} \end{array}} \right]$$ (24)
    • 本文将每种度量指标各个时间切片上计算得到的准确率的最大值和最小值分别作为对应时间切片的理想解$r_j^*$和负理想解$r_j^0(j = 1,2, \cdots ,m)$,根据加权标准化矩阵${R_{ij}}$,可求得理想解${A^*}$和负理想解${A^0}$分别为:

      $$ {A^*} = \{ r_j^*\} = \{ \mathop {\max }\limits_{i \in (1,2, \cdots ,n)} ({r_{i1}}),\mathop {\max }\limits_{i \in (1,2, \cdots ,n)} ({r_{i2}}),{\text{ }} \cdots ,\mathop {\max }\limits_{i \in (1,2, \cdots ,n)} ({r_{im}})\} $$ (25)
      $$ {A^0} = \{ r_j^0\} = \{ \mathop {\min }\limits_{i \in (1,2, \cdots ,n)} ({r_{i1}}),\mathop {\min }\limits_{i \in (1,2, \cdots ,n)} ({r_{i2}}),{\text{ }} \cdots ,\mathop {\min }\limits_{i \in (1,2, \cdots ,n)} ({r_{im}})\} $$ (26)
    • 记各度量指标到理想解和负理想解的距离分别为$d_i^*$和$d_i^0(i = 1,2, \cdots ,n)$:

      $$d_i^* = \sqrt {\sum\limits_{j = 1}^m {{{({r_{ij}} - r_j^*)}^2}} } $$ (27)
      $$d_i^{\text{0}} = \sqrt {\sum\limits_{j = 1}^m {{{({r_{ij}} - r_j^{\text{0}})}^2}} } $$ (28)
    • 根据上述所求距离可以计算各度量指标与理想方案的相对接近程度,记为${c_i}$:

      $${c_i} = d_i^0/(d_i^0 + d_i^*)\;\;\;\;\;\;i = 1,2, \cdots ,n$$ (29)

      ${c_i}$值越大,表示该度量指标所挖掘出重要节点的准确率越高。根据${c_i}$的值降序排序,即可评估各层间耦合关系度量指标对挖掘重要节点的影响力情况。

    • 本文使用Workspaces数据进行实证研究。Workspaces[18]为法国某公司通过移动射频技术获取的公司员工之间面对面交互产生的交互数据,该公司一共有92名员工,在2013年6月24日—2013年7月3日这10天间,有755对交互对象产生了9 827次交互记录。

    • 为了评价各度量方法挖掘重要节点的准确率,本文将各时间切片上由超邻接矩阵模型得到的节点重要性序列与删除节点后节点对网络的影响力序列做比较,求出Kendall’s tau值,即为各时间切片下挖掘出重要节点的准确率。

      Kendall’s tau值[8]被用来测量两序列之间排序的相关性程度,其取值范围为$[ - 1,1]$,该值越大,则两序列相关性越强,即说明节点重要性的排序更加准确。定义由超邻接矩阵模型求出的在时间层$t$上节点重要性序列$Y = \{ {y_{it}}\} $和时间层$t$上节点影响力序列$Z = \{ {z_{it}}\} $两序列间的Kendall’s tau-b值[20]为:

      $${\tau _t} = \frac{{\sum\limits_{i < j} {\operatorname{sgn} [({y_{it}} - {y_{jt}})({z_{it}} - {z_{jt}})]} }}{{\sqrt {(n(n - 1)/2 - {n_1})(n(n - 1)/2 - {n_2})} }}$$ (30)

      式中,$\operatorname{sgn} (x)$是一个符号函数,;$n$是序列的长度,${n_1} = \sum\limits_i {{t_i}({t_i} - 1)/2} $,${n_2} = \sum\limits_j {{u_j}({u_j} - 1)/2} $;${t_i}$为$Y$序列中第$i$个使得$\operatorname{sgn} (x) = 0$的${y_{it}}$值的个数;${u_j}$为$Z$序列中第$j$个使得$\operatorname{sgn} (x) = 0$的${z_{it}}$值的个数。

    • 为了更准确地挖掘出时序网络中的重要节点,本文的具体实验过程如下:

      1) 将Workspaces数据以天为单位进行切分,则原始数据转化为有10个时间层的时序网络;

      2) 根据不同层间耦合关系的度量标准,用超邻接矩阵${\mathit{\boldsymbol{A}}}$描述此时序网络中层内连接关系和层间耦合关系。超邻接矩阵是一个$NT \times NT$的分块矩阵,$N$为网络中节点个数,$T$为时间切片的个数。其中层内连接关系即为相应时间层网络的邻接关系,用${{\mathit{\boldsymbol{A}}}^{(1)}},{{\mathit{\boldsymbol{A}}}^{(2)}}, \cdots ,{{\mathit{\boldsymbol{A}}}^{(t)}}$表示,${{\mathit{\boldsymbol{A}}}^{(t)}} = \{ a_{ij}^t\} $表示在时间层$t$上的邻接关系,$a_{ij}^t = 1$表示在时间层$t$上节点$i$和节点$j$有连边;反之$a_{ij}^t = 0$。层间耦合关系用${{\mathit{\boldsymbol{C}}}^{(t,t + 1)}}$表示,即相邻时间层$t$和$t + 1$对应节点层间相似性的度量值。超邻接矩阵的具体表示如下:

      $${\mathit{\boldsymbol{A}}} = \left[ {\begin{array}{*{20}{c}} {{{\mathit{\boldsymbol{A}}}^{{\text{(1)}}}}}&{{{\mathit{\boldsymbol{C}}}^{{\text{(1,2)}}}}}&{\bf{0}}& \cdots \\ {{{\mathit{\boldsymbol{C}}}^{{\text{(1,2)}}}}}&{{{\mathit{\boldsymbol{A}}}^{{\text{(2)}}}}}&{{{\mathit{\boldsymbol{C}}}^{{\text{(2,3)}}}}}& \cdots \\ {\bf{0}}&{{{\mathit{\boldsymbol{C}}}^{{\text{(2,3)}}}}}&{{{\mathit{\boldsymbol{A}}}^{{\text{(3)}}}}}& \cdots \\ \vdots & \vdots & \vdots & \ddots \end{array}} \right]$$ (31)

      该超邻接矩阵最大特征值对应的特征向量即为每个节点在各个时间层上的重要性。

      3) 本文通过删除节点后网络连通性的变化程度来评价节点重要性排序结果。网络连通性的强弱通过网络全局效率$e$[19]度量,定义${d_{ij}}$为时序网络中节点$i$到节点的时序距离(即最短路径),则:

      $$ e = \frac{1}{{N(N - 1)}}\sum\limits_{ij} {\frac{1}{{{d_{ij}}}}} $$ (32)

      在时间层$t$上,删除节点$i$亦可求得此时的网络全局效率${e_{it}}$,与原网络全局效率$e$比较,其变化情况即为节点$i$在时间层$t$上的影响力,公式为:

      $${E'_{i,t}} = \left| {{e_{it}} - e} \right|$$ (33)

      4) 求出由超邻接矩阵模型得到的节点重要性序列与删除节点后节点对网络的影响力序列的Kendall’s tau值。

      5) 将不同的时序网络层间耦合关系的度量方法作为备选方案集$X$,将各时间切片上的节点重要排序的准确率作为属性向量${\mathit{\boldsymbol{Y}}}$,用TOPSIS方法选择最佳时序网络层间耦合关系度量方法。

    • 在Workspace数据集上,各度量指标求得的接近度结果如表 1所示:

      表 1  各度量方案的接近度

      度量指标 接近度 度量指标 接近度
      PA 0.759 226 CN 0.467 346
      RA_min 0.718 641 MD_sum 0.465 321
      RA_mean 0.688 931 MD_mean 0.464 066
      RA_max 0.612 184 MD_max 0.456 551
      RA_scn 0.596 408 MD_scn 0.445 884
      AA_mul 0.586 103 JAC 0.427 007
      RA_sum 0.552 626 HC_mul 0.384 527
      RA_mul 0.548 804 HC_min 0.373 235
      AA_sum 0.546 876 HC_max 0.349 460
      AA_max 0.509 832 HC_mean 0.345 482
      AA_scn 0.509 291 HC_sum 0.344 984
      HPI 0.505 885 HC_scn 0.340 985
      AA_mean 0.498 524 LHN 0.296 323
      AA_min 0.497 678 IHC_mul 0.267 036
      HDI 0.493 124 IHC_min 0.207 364
      SAL 0.481 920 IHC_max 0.202 630
      SOR 0.481 672 IHC_scn 0.201 834
      MD_min 0.476 004 IHC_sum 0.199 844
      MD_mul 0.469 859 IHC_mean 0.199 395

      该结果表明,当时序网络的层间耦合关系通过优先链接指标(PA)度量时,所挖掘出的重要节点最准确,其在各时间层上的准确率分别为60.96%、60.49%、66.92%、39.18%、47.66%、48.50%、47.58%、42.37%、41.52%和53.03%。

    • 本文首先通过超邻接矩阵模型描述时序网络的层间耦合关系和层内连接关系,基于特征向量中心性方法,超邻接矩阵最大特征值对应的特征向量即为各时间切片上对应节点的重要性。将此结果与删除节点后该节点对网络的影响力结果作比较,求出的kendall’s tau值即为各个时间片上节点重要性排序的准确率。本文综合考虑时序网络中不同层间耦合关系度量方法所挖掘出重要节点的准确率在各时间切片对整体的影响,将不同层间耦合关系的度量方法作为备选方案,各个时间片上的准确率作为属性值,应用TOPSIS方法即确定出最佳的层间耦合关系的度量方法是PA相似性度量指标,其挖掘出重要节点的准确率最高,平均达到50.82%。

      然而本文对时序网络拓扑结构的研究仅局限于对相邻时间层层间耦合关系考虑,而实际生活中,节点之间的联系不仅有层间的耦合,更有层内的关系结构值得研究,层间耦合关系的度量也不应只局限于相邻时间层间。并且本文的研究只适用于小规模的数据,大数据的情况下该如何研究也是一个需要探讨的问题。

参考文献 (20)

目录

    /

    返回文章
    返回