基于TOPSIS的时序网络节点重要性研究

郭强; 殷冉冉; 刘建国

doi:10.3969/j.issn.1001-0548.2019.02.021

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021

1.
上海理工大学复杂科学研究中心上海杨浦区 200093
2.
上海财经大学金融科技研究院上海杨浦区 200433

基金项目:

国家自然科学基金 61773248

国家自然科学基金 71771152

国家社会科学基金重大项目 18ZAD088

详细信息

作者简介:
郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn

中图分类号: TP311;N94

Node Importance Identification for Temporal Networks via the TOPSIS Method

1.
Complex Systems Science Research Center, University of Shanghai for Science and Technology Yangpu Shanghai 200093
2.
Fintech Institute, Shanghai University of Finance and Economics Yangpu Shanghai 200433

摘要: 时序网络考虑事件发生的顺序，可以更准确地刻画复杂系统的演化特征。本文采用多属性排序方法（TOPSIS）对时序网络不同时间片段节点的影响力进行综合评价。具体的思想是通过计算不同层间相似性指标值与正理想解和负理想解的欧式距离，根据其接近正理想解和远离负理想解的程度对层间耦合关系的度量方法进行排名。基于Workspace数据集的实验结果表明，以优先链接指标（PA）度量时序网络时间层耦合关系，所挖掘出的重要节点准确率最高，在各时间层上平均达到50.82%。该文的工作为从多属性角度分析时序网络提供了借鉴。
- 特征向量中心性 /
- 层间相似性 /
- 时序网络 /
- TOPSIS
Abstract: Temporal networks could describe the evolution characteristics of complex systems more accurately by considering the sequence of events. In this paper, the multi-attribute sorting method (TOPSIS) is introduced to comprehensively evaluate the influence of different time slices of temporal networks. By calculating the Euclidean distance of different inter-layer coupling indexes to the positive-ideal solution and the negative-ideal solution, this method ranks the indexes according to the measurement that the results are close to the positive-ideal solution and far away from the negative-ideal solution. The relevant experiments on Workspace datasets show that the Preferential Attachment Index (PA) to measure the temporal coupling relationship can dig out the highest accuracy, the average of 50.82% on each layer. Our work may shed some lights for analyzing temporal networks from multi-attribute perspective.
- eigenvector centrality /
- inter-layer similarity /
- temporal networks /
- TOPSIS

表 1 各度量方案的接近度

度量指标	接近度		度量指标	接近度
PA	0.759 226			CN	0.467 346
RA_min	0.718 641			MD_sum	0.465 321
RA_mean	0.688 931			MD_mean	0.464 066
RA_max	0.612 184			MD_max	0.456 551
RA_scn	0.596 408			MD_scn	0.445 884
AA_mul	0.586 103			JAC	0.427 007
RA_sum	0.552 626			HC_mul	0.384 527
RA_mul	0.548 804			HC_min	0.373 235
AA_sum	0.546 876			HC_max	0.349 460
AA_max	0.509 832			HC_mean	0.345 482
AA_scn	0.509 291			HC_sum	0.344 984
HPI	0.505 885			HC_scn	0.340 985
AA_mean	0.498 524			LHN	0.296 323
AA_min	0.497 678			IHC_mul	0.267 036
HDI	0.493 124			IHC_min	0.207 364
SAL	0.481 920			IHC_max	0.202 630
SOR	0.481 672			IHC_scn	0.201 834
MD_min	0.476 004			IHC_sum	0.199 844
MD_mul	0.469 859	IHC_mean		0.199 395

下载: 导出CSV

[1]	楼凤丹, 周银座, 庄晓丹, 等.时效网络结构及动力学研究进展综述[J].电子科技大学学报, 2017, 46(1):109-125. doi: 10.3969/j.issn.1001-0548.2017.01.017 LOU Feng-dan, ZHOU Yin-zuo, ZHUANG Xiao-dan, et al. Review on the research progress of the structure and dynamics of temporal networks[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(1):109-125. doi: 10.3969/j.issn.1001-0548.2017.01.017
[2]	HOLME P, SARAMAKI J. Temporal networks[J]. Physics Reports, 2011, 519(3):97-125 http://d.old.wanfangdata.com.cn/Periodical/rjxb200604015
[3]	TAYLOR D, MYERS S A, CLAUSET A, et al. Eigenvector-based centrality measures for temporal networks[J]. Multiscale Modeling & Simulation, 2017, 15(1):537-574. http://cn.bing.com/academic/profile?id=dc7aba9f2115fa88addf54613e9f89c8&encoded=0&v=paper_preview&mkt=zh-cn
[4]	CLAUSET A, EAGLE N. Persistence and periodicity in a dynamic proximity network[EB/OL]. (2012-11-30). http://arxiv.org/abs/1211.7343.
[5]	HAMERS L. Similarity measures in scientometric research:The Jaccard index versus Salton's cosine formula[J]. Information Processing and Management, 1989, 25(3):315-318. doi: 10.1016/0306-4573(89)90048-4
[6]	ETUDE P J. Comparative de la distribution florale dans une portion des Alpes et des Jura[J]. Bull Soc Vaud Sci Nat, 1901, 37:547.
[7]	LIU Jian-guo, HOU Lei. Stability of similarity measurements for bipartite networks[J]. Scientific Reports, 2016, 6:18653. doi: 10.1038/srep18653
[8]	KENDALL M G. A new measure of rank correlation[J]. Biometrika, 1938, 30(1/2):81-93. doi: 10.2307/2332226
[9]	ASSARI A, MAHESH T M, ASSARI E. Role of public participation in sustainability of historical city:Usage of TOPSIS method[J]. Indian Journal of Science and Technology, 2012, 5(3):2289-2294. http://cn.bing.com/academic/profile?id=67c5369ea5fa0e9108ab7c2f4a32b484&encoded=0&v=paper_preview&mkt=zh-cn
[10]	SPRENSE T A. A method of establishing groups of equal amplitude in plant sociology based on similarity of species content and its application to analysis of the vegetation on Danish commons[J]. Biol Skr, 1948, 5(4):1-34. https://www.worldcat.org/title/method-of-establishing-groups-of-equal-amplitude-in-plant-sociology-based-on-similarity-of-species-content-and-its-application-to-analyses-of-the-vegetation-on-danish-commons/oclc/4713331
[11]	RAVASZ E, SOMERA A L, MONGRU D A, et al. Hierarchical organization of modularity in metabolic networks[J]. Science, 2002, 297(5586):1551-1555. doi: 10.1126/science.1073374
[12]	LEICHT E A, HOLME P, NEWMAN M E J. Vertex similarity in networks[J]. Physical Review E, 2006, 73(2):026120. doi: 10.1103/PhysRevE.73.026120
[13]	ADAMIC L A, ADAR E. Friends and neighbors on the web[J]. Social Networks, 2003, 25(3):211-230. doi: 10.1016/S0378-8733(03)00009-1
[14]	ZHOU Tao, LÜ Lin-yuan, ZHANG Yi-cheng. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4):623-630. doi: 10.1140/epjb/e2009-00335-8
[15]	ZHOU Tao, REN Jie, MEDO M, et al. Bipartite network projection and personal recommendation[J]. Physical Review E, 2007, 76(4):046115. doi: 10.1103/PhysRevE.76.046115
[16]	LIU Jian-guo, ZHOU Tao, GUO Qiang. Information filtering via biased heat conduction[J]. Physical Review E, 2011, 84(3):037101. doi: 10.1103/PhysRevE.84.037101
[17]	GUO Q, LENG Rui, SHI Ke-rui, et al. Heat conduction information filtering via local information of bipartite networks[J]. The European Physical Journal B, 2012, 85(8):286. doi: 10.1140/epjb/e2012-30095-1
[18]	GÉNOIS M, VESTERGAARD C L, FOURNET J, et al. Data on face-to-face contacts in an office building suggest a low-cost vaccination strategy based on community linkers[J]. Network Science, 2015, 3(3):326-347. doi: 10.1017/nws.2015.10
[19]	TANG J, SCELLATO S, MUSOLESI M, et al. Small-world behavior in time-varying graphs[J]. Physical Review E, 2010, 81(5):055101. doi: 10.1103/PhysRevE.81.055101
[20]	AGRESTI A. Analysis of ordinal categorical data[M].[S.l.]: John Wiley & Sons, 2010.

[1]	李晨亮, 吴鸿涛. 基于梯度相似性的自动作文评分多主题联合预训练方法 . 电子科技大学学报, 2022, 51(4): 558-564. doi: 10.12178/1001-0548.2022061
[2]	周仁爽, 陈尧森, 郭兵, 沈艳, 李杰, 王炜. 基于模块相似性的超分网络剪枝 . 电子科技大学学报, 2022, 51(1): 108-116. doi: 10.12178/1001-0548.2021126
[3]	李艳丽, 周涛. 链路预测中的局部相似性指标 . 电子科技大学学报, 2021, 50(3): 422-427. doi: 10.12178/1001-0548.2021062
[4]	王哲, 郭强, 刘建国. 基于会计报表和网络中心性的指数增强策略研究 . 电子科技大学学报, 2021, 50(3): 459-466. doi: 10.12178/1001-0548.2020296
[5]	程静静, 樊瑛. 基于网络相似性测度的国际贸易产品分类 . 电子科技大学学报, 2021, 50(2): 303-310. doi: 10.12178/1001-0548.2020252
[6]	曹开臣, 陈明仁, 张千明, 蔡世民, 周涛. 基于网络节点中心性的新闻重要性评价研究 . 电子科技大学学报, 2021, 50(2): 285-293. doi: 10.12178/1001-0548.2020355
[7]	陈诗, 任卓明, 刘闯, 张子柯. 时序网络中关键节点的识别方法研究进展 . 电子科技大学学报, 2020, 49(2): 291-314. doi: 10.12178/1001-0548.2019054
[8]	梁耀洲, 郭强, 殷冉冉, 杨剑楠, 刘建国. 基于排名聚合的时序网络节点重要性研究 . 电子科技大学学报, 2020, 49(4): 519-523. doi: 10.12178/1001-0548.2019087
[9]	于晓琳, 张崇, 苏龙飞, 饶妮妮. 不同意识任务中心脑间谱相干分析 . 电子科技大学学报, 2018, 47(5): 770-774. doi: 10.3969/j.issn.1001-0548.2018.05.021
[10]	孙健, 廖丹, 李可, 巩玉, 孙罡. 基于排队论的异构数据中心性能及能源管理策略 . 电子科技大学学报, 2018, 47(2): 161-168. doi: 10.3969/j.issn.1001-0548.2018.02.001
[11]	牟建红, 黄格, 吕欣. 中国航空网络时序特征分析 . 电子科技大学学报, 2018, 47(3): 462-468. doi: 10.3969/j.issn.1001-0548.2018.03.022
[12]	牛伟纳, 张小松, 孙恩博, 杨国武, 赵凌园. 基于流相似性的两阶段P2P僵尸网络检测方法 . 电子科技大学学报, 2017, 46(6): 902-906, 948. doi: 10.3969/j.issn.1001-0548.2017.06.019
[13]	朱义鑫, 张凤荔, 王瑞锦, 秦志光. 时序网络上的随机游走免疫策略研究 . 电子科技大学学报, 2017, 46(1): 96-101. doi: 10.3969/j.issn.1001-0548.2017.01.015
[14]	杨凯, 郭强, 刘晓露, 刘建国. 基于多重特征向量的有向网络社团结构划分算法 . 电子科技大学学报, 2016, 45(6): 1014-1019, 1032. doi: 10.3969/j.issn.1001-0548.2016.06.024
[15]	徐保根, 谢伟, 万义和, 汤四龙, 龚辉, 丁学科. 一种基于广义特征向量的改进ESPRIT测向算法 . 电子科技大学学报, 2015, 44(2): 201-204. doi: 10.3969/j.issn.1001-0548.2015.02.007
[16]	李琳, 伍少梅, 唐宁九. 基于中心加权的局部核向量机算法 . 电子科技大学学报, 2014, 43(4): 612-617. doi: 10.3969/j.issn.1001-0548.2014.04.025
[17]	李静茹, 喻莉, 赵佳. 加权社交网络节点中心性计算模型 . 电子科技大学学报, 2014, 43(3): 322-328. doi: 10.3969/j.issn.1001-0548.2014.03.001
[18]	李迅波, 蒋东升, 王振林. 梯度相似性的椒盐图像加权中值滤波算法 . 电子科技大学学报, 2012, 41(1): 114-119. doi: 10.3969/j.issn.1001-0548.2012.01.022
[19]	朱维军, 邓淼磊, 周清雷, 张海宾. 扩展命题区间时序逻辑公式可满足性判定算法 . 电子科技大学学报, 2011, 40(5): 753-758. doi: 10.3969/j.issn.1001-0548.2011.05.023
[20]	王小兵, 段振华. 面向对象的时序逻辑语言 . 电子科技大学学报, 2009, 38(1): 97-101.

点击查看大图

表(1)

计量

文章访问数: 4131
HTML全文浏览量: 1460
PDF下载量: 94
被引次数: 0

全文HTML

时序网络考虑节点之间的交互关系和次序，可以更加准确地刻画手机通讯、社交等复杂系统的交互关系^[1-2]。通过研究时序网络的层间耦合关系，挖掘出时序网络中的重要节点，有利于人们对时序网络进一步了解，可以应用于疾病传播、谣言扩散、新产品的推广以及计算机病毒的治理等方面^[1-3]。

目前，对时序网络层间耦合关系的研究有两种比较重要的思想：1)认为时序网络的层间耦合强度是一个固定的常数，常数的大小值即决定了层间耦合关系的强弱^[3]；2)时序网络中相邻时间切片间的耦合关系可以通过局部相似性指标来衡量。文献[4]提出了时序网络中相邻时间切片间耦合关系的度量方法，其实质是将静态网络中相似性的度量方法延伸到时序网络中。而静态网络中相似性的度量方法有很多，如：共同邻居(common neighbour, CN)、Salton指标(Salton index, SAL)^[5]、Jaccard指标(Jaccard index, JAC)^[6]等，这些局部结构相似性的指标^[7]均可扩展至时序网络，以衡量相邻时间切片间的耦合关系。假定时序网络层间耦合强度为一固定参数时，强度系数的衡量并没有统一的界定方法，且在一定程度上忽略了节点间的差异性，所以本文主要研究基于局部相似性指标度量时序网络的层间耦合关系的方法。

为了度量时序网络层间耦合关系的影响力，本文计算了不同时序网络层间耦合关系下挖掘重要节点的准备率，准确率越高，则对应的层间耦合关系的度量越准确。文献[3]应用多层耦合网络分析的方法，构造了超邻接矩阵(supra-adjacency matrix)模型以表示时序网络的层间关系和层内关系。层内关系为每个时间切片上的静态网络结构。随后，基于特征向量的中心性方法，超邻接矩阵最大特征值所对应的特征向量为各时间切片上对应节点的重要性。本文采用文献[3]提出的中心性方法，计算出不同层间耦合关系下各时间切片上对应节点的重要性。将此结果与删除节点后节点对网络的影响力结果作比较，求出kendall’s tau值^[8]，即为对应层间耦合关系度量方法下的各时间层所挖掘出重要节点的准确率。

然而，因为时序网络的网络特性，很难有一种层间耦合关系的度量指标能保证其挖掘重要节点的准确率在各时间切片上都是最好的。本文介绍了综合考虑目标多属性的综合决策方法(TOPSIS)^[9]，对层间耦合关系影响力的评估问题进行了细致研究。本文将不同层间耦合关系的度量方法作为备选方案，各个时间片上的准确率作为属性值，利用TOPSIS方法即可确定最佳的时序网络层间耦合关系的度量方法。实验结果表明，基于TOPSIS方法求出以优先链接指标(PA)度量时序网络时间层耦合关系时，所挖掘出的重要节点准确率最高，在各时间层上平均达到50.82%。本文不仅解决了如何度量时序网络层间耦合关系的问题，并且解决了时序网络各时间层准确率不一，如何寻找最优指标的问题，准确地给出时序网络层间耦合关系的度量指标。

1. 时序网络的耦合关系度量

已有的基于局部结构相似性的度量指标可以延伸至时序网络中，以度量时序网络层间耦合关系。

基于局部结构的相似性指标主要分为两类，一类是基于相邻时间切片上节点自身邻居的考虑，具体思想是两个节点的共同邻居越多，两节点越相似。包括CN以及基于CN指标衍生的归一化指标：SAL^[5]、JAC^[6]、Sorensen指标(Sorensen index, SOR)^[10]、大度节点有利指标(hub promoted index, HPI)^[11]、大度节点不利指标(hub depressed index, HDI)、LHN-I指标(leicht-holme-newman index, LHN)^[12]、优先链接指标(preferential attachment index, PA)。另一类是基于相邻时间切片上节点共同邻居的考虑，包括Adamic-Adar指标(Adamic-Adar index, AA)^[13]、资源分配指标(resource allocation index, RA)^[14]、质量扩散(the mass diffusion, MD)^[15]、热传导(heat conduction, HC)^[16]、改进热传导(improved heat conduction, IHC)^[17]。在时序网络中，因为对应节点的共同邻居在相邻时间切片上的度并不一致，为了消除这种不一致，本文将相邻时间片$t$和$t + 1$上节点$i$的度$k_i^t$和$k_i^{t + 1}$分别进行了取最大值(max)、最小值(min)、均值(mean)、乘积(mul)、求和(sum)、以及度之和减去共同邻居(scn)的处理。

本文用${{{\mathit{\boldsymbol{A}}}}^{{\text{(}}t{\text{)}}}} = \{ a_{ij}^t\} $表示在时间层$t$上的邻接关系，$a_{ij}^t = 1$表示在时间层$t$上节点$i$和节点$j$有连边；反之$a_{ij}^t = 0$。则：

$$k_i^t = a_{ij}^ta_{ij}^{t + 1}\sum\limits_j {a_{ij}^t} $$

(1)

$${\text{ }}k_i^{t + 1} = a_{ij}^ta_{ij}^{t + 1}\sum\limits_j {a_{ij}^{t + 1}} $$

(2)

所以共同邻居节点$i$的度信息${k_i}$对应的6种计算方式分别为：

$${k_i} = \min (k_i^t,k_i^{t + 1})$$

(3)

$${k_i} = \max (k_i^t,k_i^{t + 1})$$

(4)

$${k_i} = k_i^t + k_i^{t + 1}/2$$

(5)

$${k_i} = k_i^tk_i^{t + 1}$$

(6)

$${k_i} = k_i^t + k_i^{t + 1}$$

(7)

$${k_i} = k_i^t + k_i^{t + 1} - \sum\limits_j {a_{ij}^ta_{ij}^{t + 1}} $$

(8)

为此，节点$j$在相邻时间片$t$和$t + 1$的局部结构相似性度量指标的计算公式为：

$${\text{CN}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} $$

(9)

$${\text{SAL}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sqrt {\left[ {\sum\limits_i {a_{ij}^t} } \right]\left[ {\sum\limits_i {a_{ij}^{t + 1}} } \right]} }}$$

(10)

$${\text{JAC}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sum\limits_i {a_{ij}^t} + \sum\limits_i {a_{ij}^{t + 1}} - \sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}$$

(11)

$${\text{SOR}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{2\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sum\limits_i {a_{ij}^t} + \sum\limits_i {a_{ij}^{t + 1}} }}$$

(12)

$${\text{HPI}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{2\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\min \left[ {\sum\limits_i {a_{ij}^t} ,\sum\limits_i {a_{ij}^{t + 1}} } \right]}}$$

(13)

$${\text{HDI}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{2\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\max \left[ {\sum\limits_i {a_{ij}^t} ,\sum\limits_i {a_{ij}^{t + 1}} } \right]}}$$

(14)

$${\text{LHN}}:{\text{ }}c_j^{(t,t + 1)} = \frac{{\sum\limits_i {a_{ij}^ta_{ij}^{t + 1}} }}{{\sum\limits_i {a_{ij}^t} \sum\limits_i {a_{ij}^{t + 1}} }}$$

(15)

$${\text{PA}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {a_{ij}^t} \sum\limits_i {a_{ij}^{t + 1}} $$

(16)

$${\text{AA}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {\frac{1}{{\log {k_i}}}} $$

(17)

$${\text{RA}}:{\text{ }}c_j^{(t,t + 1)} = \sum\limits_i {\frac{1}{{{k_i}}}} $$

(18)

$${\text{MD}}:{\text{ }}c_j^{(t,t + 1)} = \frac{1}{{k_i^t}}\sum\limits_i {\frac{1}{{{k_i}}}} $$

(19)

$${\text{HC}}:{\text{ }}c_j^{(t,t + 1)} = \frac{1}{{k_i^{t + 1}}}\sum\limits_i {\frac{1}{{{k_i}}}} $$

(20)

$${\text{IHC}}:{\text{ }}c_j^{(t,t + 1)} = \frac{1}{{{{(k_i^{t + 1})}^2}}}\sum\limits_i {\frac{1}{{{k_i}}}} $$

(21)

式(17)~式(21)中的节点$i$的度信息可以分别有6种定义方式(见式(3)~式(8))，则共有30种层间耦合关系的定义方式；加上式(9)~式(16)的8种方式，共有38种度量层间耦合关系的指标。

2. TOPSIS多属性排序方法

本文运用上述38种层间耦合关系度量指标对Workspace数据集中所有员工的重要性进行量化，根据其量化后在各时间切片上排序的准确率情况，本文通过TOPSIS多属性排序方法选取最优的层间耦合关系度量指标。

多属性排序方法TOPSIS^[9]通过构造多属性问题的正理想解和负理想解，以接近正理想解和远离负理想解这两个基准作为评价各可行方案的依据，是一种逼近理想解的排序方法。其中正理想解指的是各属性值都达到各评价方案中的最优值，负理想解则为各属性值都达到各评价方案中的最差值。本文首先计算不同层间耦合关系挖掘重要节点在各时间切片上的准确率与正理想解和负理想解的距离，再根据算得的距离计算该准确率贴近正理想解的程度，对各层间相似性度量指标进行排名具体步骤如下。

2.1. 构造初始矩阵

记$X = \{ {x_1},{x_2}, \cdots ,{x_n}\} $，$n = 38$表示层间耦合关系度量值标的个数，$Y = \{ {y_1},{y_2}, \cdots ,{y_m}\} $，$m = T$表示时间切片的数目，定义指标集$X$中的第$i$个度量指标${x_i}(i = 1,2, \cdots ,n)$在第$j$个时间切片${y_j}(j = 1,2, \cdots ,m)$下挖掘出重要节点准确率为${y_{ij}}$，则初始矩阵为:

$${Y_{ij}} = \left[ {\begin{array}{*{20}{c}} {{y_{11}}}&{{y_{12}}}& \cdots &{{y_{1m}}} \\ {{y_{21}}}&{{y_{22}}}& \cdots &{{y_{2m}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{y_{n1}}}&{{y_{n2}}}& \cdots &{{y_{nm}}} \end{array}} \right]$$

(22)

2.2. 标准化矩阵

因为每种指标的量纲不同，初始矩阵应该转化为标准矩阵${{\mathit{\boldsymbol{Z}}}_{ij}} = \{ {z_{ij}}\} $，其中：

$${z_{ij}} = {y_{ij}}/\sum\limits_{i = 1}^n {y_{ij}^2} $$ (23)

2.3. 加权标准化矩阵

本文认为各时间片上准确率的权重是一样的，则第$j$个时间切片的权重系数${\omega _j} = 1/m$，$j = 1,2, \cdots ,m$。构造加权标准化矩阵：

$${{\mathit{\boldsymbol{R}}}_{ij}} = \{ {r_{ij}}\} = \{ {\omega _j}{z_{ij}}\} = \left[ {\begin{array}{*{20}{c}} {{\omega _1}{z_{11}}}&{{\omega _2}{z_{12}}}& \cdots &{{\omega _m}{z_{1m}}} \\ {{\omega _1}{z_{21}}}&{{\omega _2}{z_{22}}}& \cdots &{{\omega _m}{z_{2m}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{\omega _1}{z_{n1}}}&{{\omega _2}{z_{n2}}}& \cdots &{{\omega _m}{z_{nm}}} \end{array}} \right]$$

(24)

2.4. 确定正理想解和负理想解

本文将每种度量指标各个时间切片上计算得到的准确率的最大值和最小值分别作为对应时间切片的理想解$r_j^*$和负理想解$r_j^0(j = 1,2, \cdots ,m)$，根据加权标准化矩阵${R_{ij}}$，可求得理想解${A^*}$和负理想解${A^0}$分别为：

$$ {A^*} = \{ r_j^*\} = \{ \mathop {\max }\limits_{i \in (1,2, \cdots ,n)} ({r_{i1}}),\mathop {\max }\limits_{i \in (1,2, \cdots ,n)} ({r_{i2}}),{\text{ }} \cdots ,\mathop {\max }\limits_{i \in (1,2, \cdots ,n)} ({r_{im}})\} $$

(25)

$$ {A^0} = \{ r_j^0\} = \{ \mathop {\min }\limits_{i \in (1,2, \cdots ,n)} ({r_{i1}}),\mathop {\min }\limits_{i \in (1,2, \cdots ,n)} ({r_{i2}}),{\text{ }} \cdots ,\mathop {\min }\limits_{i \in (1,2, \cdots ,n)} ({r_{im}})\} $$

(26)

2.5. 计算距离

记各度量指标到理想解和负理想解的距离分别为$d_i^*$和$d_i^0(i = 1,2, \cdots ,n)$：

$$d_i^* = \sqrt {\sum\limits_{j = 1}^m {{{({r_{ij}} - r_j^*)}^2}} } $$ (27)

$$d_i^{\text{0}} = \sqrt {\sum\limits_{j = 1}^m {{{({r_{ij}} - r_j^{\text{0}})}^2}} } $$ (28)

2.6. 计算接近度

根据上述所求距离可以计算各度量指标与理想方案的相对接近程度，记为${c_i}$：

$${c_i} = d_i^0/(d_i^0 + d_i^*)\;\;\;\;\;\;i = 1,2, \cdots ,n$$ (29)

${c_i}$值越大，表示该度量指标所挖掘出重要节点的准确率越高。根据${c_i}$的值降序排序，即可评估各层间耦合关系度量指标对挖掘重要节点的影响力情况。

3. 数据实验与结果分析

3.1. 数据描述

本文使用Workspaces数据进行实证研究。Workspaces^[18]为法国某公司通过移动射频技术获取的公司员工之间面对面交互产生的交互数据，该公司一共有92名员工，在2013年6月24日—2013年7月3日这10天间，有755对交互对象产生了9 827次交互记录。

3.2. 评价指标

为了评价各度量方法挖掘重要节点的准确率，本文将各时间切片上由超邻接矩阵模型得到的节点重要性序列与删除节点后节点对网络的影响力序列做比较，求出Kendall’s tau值，即为各时间切片下挖掘出重要节点的准确率。

Kendall’s tau值^[8]被用来测量两序列之间排序的相关性程度，其取值范围为$[ - 1,1]$，该值越大，则两序列相关性越强，即说明节点重要性的排序更加准确。定义由超邻接矩阵模型求出的在时间层$t$上节点重要性序列$Y = \{ {y_{it}}\} $和时间层$t$上节点影响力序列$Z = \{ {z_{it}}\} $两序列间的Kendall’s tau-b值^[20]为:

$${\tau _t} = \frac{{\sum\limits_{i < j} {\operatorname{sgn} [({y_{it}} - {y_{jt}})({z_{it}} - {z_{jt}})]} }}{{\sqrt {(n(n - 1)/2 - {n_1})(n(n - 1)/2 - {n_2})} }}$$

(30)

式中，$\operatorname{sgn} (x)$是一个符号函数，；$n$是序列的长度，${n_1} = \sum\limits_i {{t_i}({t_i} - 1)/2} $，${n_2} = \sum\limits_j {{u_j}({u_j} - 1)/2} $；${t_i}$为$Y$序列中第$i$个使得$\operatorname{sgn} (x) = 0$的${y_{it}}$值的个数；${u_j}$为$Z$序列中第$j$个使得$\operatorname{sgn} (x) = 0$的${z_{it}}$值的个数。

3.3. 实验过程

为了更准确地挖掘出时序网络中的重要节点，本文的具体实验过程如下：

1) 将Workspaces数据以天为单位进行切分，则原始数据转化为有10个时间层的时序网络；

2) 根据不同层间耦合关系的度量标准，用超邻接矩阵${\mathit{\boldsymbol{A}}}$描述此时序网络中层内连接关系和层间耦合关系。超邻接矩阵是一个$NT \times NT$的分块矩阵，$N$为网络中节点个数，$T$为时间切片的个数。其中层内连接关系即为相应时间层网络的邻接关系，用${{\mathit{\boldsymbol{A}}}^{(1)}},{{\mathit{\boldsymbol{A}}}^{(2)}}, \cdots ,{{\mathit{\boldsymbol{A}}}^{(t)}}$表示，${{\mathit{\boldsymbol{A}}}^{(t)}} = \{ a_{ij}^t\} $表示在时间层$t$上的邻接关系，$a_{ij}^t = 1$表示在时间层$t$上节点$i$和节点$j$有连边；反之$a_{ij}^t = 0$。层间耦合关系用${{\mathit{\boldsymbol{C}}}^{(t,t + 1)}}$表示，即相邻时间层$t$和$t + 1$对应节点层间相似性的度量值。超邻接矩阵的具体表示如下：

$${\mathit{\boldsymbol{A}}} = \left[ {\begin{array}{*{20}{c}} {{{\mathit{\boldsymbol{A}}}^{{\text{(1)}}}}}&{{{\mathit{\boldsymbol{C}}}^{{\text{(1,2)}}}}}&{\bf{0}}& \cdots \\ {{{\mathit{\boldsymbol{C}}}^{{\text{(1,2)}}}}}&{{{\mathit{\boldsymbol{A}}}^{{\text{(2)}}}}}&{{{\mathit{\boldsymbol{C}}}^{{\text{(2,3)}}}}}& \cdots \\ {\bf{0}}&{{{\mathit{\boldsymbol{C}}}^{{\text{(2,3)}}}}}&{{{\mathit{\boldsymbol{A}}}^{{\text{(3)}}}}}& \cdots \\ \vdots & \vdots & \vdots & \ddots \end{array}} \right]$$

(31)

该超邻接矩阵最大特征值对应的特征向量即为每个节点在各个时间层上的重要性。

3) 本文通过删除节点后网络连通性的变化程度来评价节点重要性排序结果。网络连通性的强弱通过网络全局效率$e$^[19]度量，定义${d_{ij}}$为时序网络中节点$i$到节点的时序距离(即最短路径)，则:

$$ e = \frac{1}{{N(N - 1)}}\sum\limits_{ij} {\frac{1}{{{d_{ij}}}}} $$

(32)

在时间层$t$上，删除节点$i$亦可求得此时的网络全局效率${e_{it}}$，与原网络全局效率$e$比较，其变化情况即为节点$i$在时间层$t$上的影响力，公式为：

$${E'_{i,t}} = \left| {{e_{it}} - e} \right|$$

(33)

4) 求出由超邻接矩阵模型得到的节点重要性序列与删除节点后节点对网络的影响力序列的Kendall’s tau值。

5) 将不同的时序网络层间耦合关系的度量方法作为备选方案集$X$，将各时间切片上的节点重要排序的准确率作为属性向量${\mathit{\boldsymbol{Y}}}$，用TOPSIS方法选择最佳时序网络层间耦合关系度量方法。

3.4. 实验结果

在Workspace数据集上，各度量指标求得的接近度结果如表 1所示：

表 1 各度量方案的接近度

度量指标	接近度		度量指标	接近度
PA	0.759 226			CN	0.467 346
RA_min	0.718 641			MD_sum	0.465 321
RA_mean	0.688 931			MD_mean	0.464 066
RA_max	0.612 184			MD_max	0.456 551
RA_scn	0.596 408			MD_scn	0.445 884
AA_mul	0.586 103			JAC	0.427 007
RA_sum	0.552 626			HC_mul	0.384 527
RA_mul	0.548 804			HC_min	0.373 235
AA_sum	0.546 876			HC_max	0.349 460
AA_max	0.509 832			HC_mean	0.345 482
AA_scn	0.509 291			HC_sum	0.344 984
HPI	0.505 885			HC_scn	0.340 985
AA_mean	0.498 524			LHN	0.296 323
AA_min	0.497 678			IHC_mul	0.267 036
HDI	0.493 124			IHC_min	0.207 364
SAL	0.481 920			IHC_max	0.202 630
SOR	0.481 672			IHC_scn	0.201 834
MD_min	0.476 004			IHC_sum	0.199 844
MD_mul	0.469 859	IHC_mean		0.199 395

该结果表明，当时序网络的层间耦合关系通过优先链接指标(PA)度量时，所挖掘出的重要节点最准确，其在各时间层上的准确率分别为60.96%、60.49%、66.92%、39.18%、47.66%、48.50%、47.58%、42.37%、41.52%和53.03%。

4. 结束语

本文首先通过超邻接矩阵模型描述时序网络的层间耦合关系和层内连接关系，基于特征向量中心性方法，超邻接矩阵最大特征值对应的特征向量即为各时间切片上对应节点的重要性。将此结果与删除节点后该节点对网络的影响力结果作比较，求出的kendall’s tau值即为各个时间片上节点重要性排序的准确率。本文综合考虑时序网络中不同层间耦合关系度量方法所挖掘出重要节点的准确率在各时间切片对整体的影响，将不同层间耦合关系的度量方法作为备选方案，各个时间片上的准确率作为属性值，应用TOPSIS方法即确定出最佳的层间耦合关系的度量方法是PA相似性度量指标，其挖掘出重要节点的准确率最高，平均达到50.82%。

然而本文对时序网络拓扑结构的研究仅局限于对相邻时间层层间耦合关系考虑，而实际生活中，节点之间的联系不仅有层间的耦合，更有层内的关系结构值得研究，层间耦合关系的度量也不应只局限于相邻时间层间。并且本文的研究只适用于小规模的数据，大数据的情况下该如何研究也是一个需要探讨的问题。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021

作者简介:
郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn

Node Importance Identification for Temporal Networks via the TOPSIS Method

计量

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021

1. 上海理工大学复杂科学研究中心上海杨浦区 200093

2. 上海财经大学金融科技研究院上海杨浦区 200433

作者简介:
郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn

English Abstract

Node Importance Identification for Temporal Networks via the TOPSIS Method

1. Complex Systems Science Research Center, University of Shanghai for Science and Technology Yangpu Shanghai 200093

2. Fintech Institute, Shanghai University of Finance and Economics Yangpu Shanghai 200433

全文HTML

2.1. 构造初始矩阵

2.2. 标准化矩阵

2.3. 加权标准化矩阵

2.4. 确定正理想解和负理想解

2.5. 计算距离

2.6. 计算接近度

3.1. 数据描述

3.2. 评价指标

3.3. 实验过程

3.4. 实验结果

目录

期刊在线

编辑办公

友情链接

留言板

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021

作者简介: 郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn

Node Importance Identification for Temporal Networks via the TOPSIS Method

计量

出版历程

基于TOPSIS的时序网络节点重要性研究

doi: 10.3969/j.issn.1001-0548.2019.02.021

1. 上海理工大学复杂科学研究中心 上海 杨浦区 200093 2. 上海财经大学金融科技研究院 上海 杨浦区 200433

作者简介: 郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

通讯作者: 刘建国, 教授, E-mail:liu.jianguo@sufe.edu.cn

English Abstract

Node Importance Identification for Temporal Networks via the TOPSIS Method

1. Complex Systems Science Research Center, University of Shanghai for Science and Technology Yangpu Shanghai 200093 2. Fintech Institute, Shanghai University of Finance and Economics Yangpu Shanghai 200433

全文HTML

2.1. 构造初始矩阵

2.2. 标准化矩阵

2.3. 加权标准化矩阵

2.4. 确定正理想解和负理想解

2.5. 计算距离

2.6. 计算接近度

3.1. 数据描述

3.2. 评价指标

3.3. 实验过程

3.4. 实验结果

目录

期刊在线

编辑办公

友情链接

作者简介:
郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

1. 上海理工大学复杂科学研究中心上海杨浦区 200093

2. 上海财经大学金融科技研究院上海杨浦区 200433

作者简介:
郭强(1975-), 女, 教授, 主要从事复杂网络、数据挖掘和科学知识图谱分析等方面的研究

1. Complex Systems Science Research Center, University of Shanghai for Science and Technology Yangpu Shanghai 200093

2. Fintech Institute, Shanghai University of Finance and Economics Yangpu Shanghai 200433