基于邻层传播的相对重要节点挖掘方法

赵娜; 李杰; 王剑; 彭西阳; 景铭; 聂永杰; 郁湧

doi:10.12178/1001-0548.2020283

基于邻层传播的相对重要节点挖掘方法

doi: 10.12178/1001-0548.2020283

赵娜^{1, 2, 3},
李杰^{1, 2},
王剑⁴,
彭西阳¹,
景铭^{1, 2},
聂永杰^3,,
郁湧^{1, 2, ,}

1.
云南大学软件学院　昆明　650091
2.
云南大学云南省软件工程重点实验室　昆明　650091
3.
云南电网有限责任公司电力科学研究院　昆明　650217
4.
昆明理工大学信息工程及自动化学院　昆明　650504

基金项目: 国家重点研发计划(2018YFB2100100)；国家自然科学基金(62066048)；中国博士后科学基金(2020M673312)；云南省科技厅面上项目(202001BB050063)；云南省教育厅科学研究基金(2019J0010，2019J0008)

详细信息

作者简介:
赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究

通讯作者: 郁湧，E-mail：yuy1219@163.com

中图分类号: TP301

Relatively Important Nodes Mining Method Based on Neighbor Layer Diffuse

ZHAO Na^{1, 2, 3},
LI Jie^{1, 2},
WANG Jian⁴,
PENG Xi-yang¹,
JING Ming^{1, 2},
NIE Yong-jie^3
,,
YU Yong^{1, 2
, ,}

1.
School of Software, Yunnan University　Kunming　650091
2.
Key Laboratory in Software Engineering of Yunnan Province Yunnan University　Kunming　650091
3.
Electric Power Research Institute of Yunnan Power Grid　Kunming　650217
4.
College of Information Engineering and Automation, Kunming University of Science and Technology　Kunming　650504

摘要: 目前针对复杂网络中相对重要节点的挖掘方法已有一些成果，但方法的效率和准确性仍有待提高。该文基于如下假设—如果一个节点具有某种特征的邻居节点越多，则该节点具有此特征的可能性越大—提出了一种基于邻层传播(NLD)的相对重要节点挖掘算法，并通过实验比较与分析，验证了该方法的准确性与适用性。
- 复杂网络 /
- 邻层传播 /
- 相对重要性 /
- 相对重要节点
Abstract: At present, there have been some achievements in mining methods for relatively important nodes in complex networks, but the efficiency and accuracy of the methods still need to be improved. Based on the assumption that if a node has more neighbor nodes with certain characteristics, the more likely this node has such characteristics. This paper proposes a relatively important node mining algorithm based on neighbor layer diffuse (NLD), and verifies the accuracy and applicability of the method through experimental comparison and analysis.
- complex network /
- neighbor layer diffuse /
- relative importance /
- relatively important nodes
图 1 示例网络

下载: 全尺寸图片幻灯片

图 2 网络的AUC结果

下载: 全尺寸图片幻灯片

表 1 网络基本拓扑特征

网络基本拓扑特征

$N$ $N'$ $M$ $K$ $C$

SARS 224 18 2 247 20.06 0.65
PPI 9 642 284 40 513 8.40 0.12
Human 3 574 186 6 002 3.36 0.15
Mouse 1 187 67 1 557 2.62 0.09

下载: 导出CSV

表 2 不同的方法在4个网络的平均准确率

网络方法
KSmar PPR PHITS NLD

SARS 0.183 0.175 0.179 0.183
PPI 0.110 0.106 0.127 0.109
Human 0.338 0.342 0.279 0.353
Mouse 0.280 0.274 0.261 0.284

下载: 导出CSV

表 3 不同的方法在4个网络的平均召回率

网络方法
KSmar PPR PHITS NLD

SARS 0.175 0.159 0.215 0.178
PPI 0.050 0.051 0.059 0.051
Human 0.083 0.088 0.075 0.092
Mouse 0.068 0.065 0.067 0.072

下载: 导出CSV

[1]	赫南, 李德毅, 淦文燕, 等. 复杂网络中重要性节点发掘综述[J]. 计算机科学, 2007(12): 1-5. doi: 10.3969/j.issn.1002-137X.2007.12.001 HE Nan, LI De-Yi, GAN Wen-Yan, et al. Mining vital nodes in complex networks[J]. Computer Science, 2007(12): 1-5. doi: 10.3969/j.issn.1002-137X.2007.12.001
[2]	CHEN D, LÜ L, SHANG M S, et al. Identifying influential nodes in complex networks[J]. Physica A, 2012, 391(4): 1777-1787. doi: 10.1016/j.physa.2011.09.017
[3]	LÜ L Y, CHEN D B, REN X L, et al. Vital nodes identification-in complex networks[J]. Phys Rep, 2016, 650: 1-63. doi: 10.1016/j.physrep.2016.06.007
[4]	朱军芳, 陈端兵, 周涛, 等. 网络科学中相对重要节点挖掘方法综述[J]. 电子科技大学学报, 2019, 48(4): 595-603. doi: 10.3969/j.issn.1001-0548.2019.04.018 ZHU Jun-fang, CHEN Duan-bing, ZHOU Tao, et al. A survey on mining relatively important nodes in network science[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(4): 595-603. doi: 10.3969/j.issn.1001-0548.2019.04.018
[5]	ALZAABI M. CISRI: A crime investigation system using the relative importance of information spreaders in networks depicting criminals communications[J]. IEEE T Inf Foren Sec, 2015, 10(2): 2196-2211.
[6]	MAGALINGAM P, DAVID S, RAO A. Ranking the importance level of intermediaries to a criminal using a reliance measure[EB/OL]. (2015-07-07). https://arxiv.org/abs/1506.06221v3.
[7]	MAGALINGAM P. Complex network tools to enable identification of a criminal community[J]. Bull Aust Math Soc, 2016, 94: 350-352. doi: 10.1017/S000497271600040X
[8]	赵静, 林丽梅. 基于分子网络的疾病基因预测方法综述[J]. 电子科技大学学报, 2017, 46(5): 755-765. doi: 10.3969/j.issn.1001-0548.2017.05.019 ZHAO Jing, LIN Li-mei. A survey of disease gene prediction methods based on molecular networks[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(5): 755-765. doi: 10.3969/j.issn.1001-0548.2017.05.019
[9]	周涛, 汪秉宏, 韩晓璞, 等. 社会网络分析及其在舆情和疫情防控中的应用[J]. 系统工程学报, 2010, 25(6): 742-754. ZHOU Tao, WANG Bing-hong, HAN Xiao-pu, et al. Social network analysis and its application in the prevention and control of propagation for public opinion and the epidemic[J]. Journal of Systems Engineering, 2010, 25(6): 742-754.
[10]	CHANG H, COHN D, MCCALLUM A. Learning to create customized authority lists[C]//Proceedings of the 17th International Conference on Machine Learning. [S.l.]: ACM, 2000: 127-134.
[11]	HAVELIWALA, TAHER H. Topic-sensitive pagerank: A context-sensitive ranking algorithm for web search[C]//IEEE Transactions on Knowledge and Data Engineering. [S.l.]: IEEE, 2003, 15(4): 784-796.
[12]	JEH G, WIDOM J. Scaling personalized web search[C]//Proceedings of the 12th International Conference on World Wide Web. [S.l.]: ACM, 2003: 271-279.
[13]	WHITE S, SMYTH P. Algorithms for estimating relative importance in networks[C]//The 3th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Washington DC, USA: ACM, 2003: 266-275.
[14]	WANG H, CHANG C K, YANG H I, et al. Estimating the relative importance of nodes in social networks[J]. J Inf Process, 2013, 21(3): 414-422.
[15]	RODRIGUEZ M A, BOLLEN J. An algorithm to determine peer-reviewers[C]//The 17th ACM Conference on Information and Knowledge Management. Napa Valley: ACM, 2008: 319-328.
[16]	MAGALINGAM P, DAVIS S, RAO A. Using shortest path to discover criminal community[J]. Digital Investigate, 2015, 15: 1-17. doi: 10.1016/j.diin.2015.08.002
[17]	LANGOHAR L. Methods for finding interesting nodes in weighted graphs[D]. Finland: University of Helsinki, 2014.
[18]	MAGALINGAM P, DAVID S, RAO A. Ranking the importance level of intermediaries to a criminal using a reliance measure[EB/OL]. [2015-07-07]. https://arxiv.org/abs/1506.06221v3.
[19]	TIV M, SNEL B, HUYNEN M A, et al. Predicting disease genes using protein-protein interactions[J]. Journal of Medical Genetics, 2006, 43(8): 691-698. doi: 10.1136/jmg.2006.041376
[20]	JANI P. Airport, airline and route data[DB/OL]. (2017-01-02). https://openflights.org/data.html.
[21]	PRASAD T S. Human protein reference database[DB/OL]. [2020-05-13]. http://www.hprd.org/sentDataRequest.
[22]	XENARIOS I, RICE D W, SALWINSKI L, et al. DIP: The data-base of interacting proteins[J]. Nucleic Acids Research, 2000, 32(1): 289-291.
[23]	HAVELIWALA T H. Topic-sensitive pagerank: A context-sensitive ranking algorithm for Web search[J]. IEEE Trans Knowl Data Eng, 2003, 15(4): 784-796. doi: 10.1109/TKDE.2003.1208999

[1]	王磊, 陈端兵, 周俊临, 傅彦. 弹性异质电网的重要目标识别算法 . 电子科技大学学报, 2023, 52(2): 280-288. doi: 10.12178/1001-0548.2022077
[2]	龚志豪, 蒋沅, 代冀阳, 杨智翔. 基于交叉熵的节点重要性排序算法 . 电子科技大学学报, 2023, 52(6): 944-953. doi: 10.12178/1001-0548.2023058
[3]	谢怡燃, 李国华, 杨波. 基于站点线路数的城市公交网络鲁棒性研究 . 电子科技大学学报, 2022, 51(4): 630-640. doi: 10.12178/1001-0548.2021336
[4]	潘侃, 尹春林, 王磊, 陈端兵. 基于特征工程的重要节点挖掘方法 . 电子科技大学学报, 2021, 50(6): 930-937. doi: 10.12178/1001-0548.2021106
[5]	赵娜, 柴焰明, 尹春林, 杨政, 王剑, 苏适. 基于最大连通子图相对效能的相依网络鲁棒性分析 . 电子科技大学学报, 2021, 50(4): 627-633. doi: 10.12178/1001-0548.2020440
[6]	赵紫娟, 李小珂, 郭强, 杨凯, 刘建国. 基于LDA的复杂网络整体研究态势主题分析 . 电子科技大学学报, 2019, 48(6): 931-938. doi: 10.3969/j.issn.1001-0548.2019.06.019
[7]	邵鹏, 胡平. 复杂网络特殊用户对群体观点演化的影响 . 电子科技大学学报, 2019, 48(4): 604-612. doi: 10.3969/j.issn.1001-0548.2019.04.019
[8]	孙晓璇, 吴晔, 冯鑫, 肖井华. 高铁-普铁的实证双层网络结构与鲁棒性分析 . 电子科技大学学报, 2019, 48(2): 315-320. doi: 10.3969/j.issn.1001-0548.2019.02.024
[9]	朱军芳, 陈端兵, 周涛, 张千明, 罗咏劼. 网络科学中相对重要节点挖掘方法综述 . 电子科技大学学报, 2019, 48(4): 595-603. doi: 10.3969/j.issn.1001-0548.2019.04.018
[10]	吴宗柠, 樊瑛. 复杂网络视角下国际贸易研究综述 . 电子科技大学学报, 2018, 47(3): 469-480. doi: 10.3969/j.issn.1001-0548.2018.03.023
[11]	朱为华, 刘凯, 闫小勇, 汪明, 吴金闪. 识别流网络关键节点的虚拟外界投入产出分析法 . 电子科技大学学报, 2018, 47(2): 292-297. doi: 10.3969/j.issn.1001-0548.2018.02.021
[12]	顾亦然, 朱梓嫣. 基于LeaderRank和节点相似度的复杂网络重要节点排序算法 . 电子科技大学学报, 2017, 46(2): 441-448. doi: 10.3969/j.issn.1001-0548.2017.02.020
[13]	王伟, 舒盼盼, 唐明, 高辉. 网络传播动力学模拟方法评述 . 电子科技大学学报, 2016, 45(2): 288-294.
[14]	汤蓉, 唐常杰, 徐开阔, 杨宁. 基于局部聚合的复杂网络自动聚簇算法 . 电子科技大学学报, 2014, 43(3): 329-335. doi: 10.3969/j.issn.1001-0548.2014.03.002
[15]	周涛, 张子柯, 陈关荣, 汪小帆, 史定华, 狄增如, 樊瑛, 方锦清, 韩筱璞, 刘建国, 刘润然, 刘宗华, 陆君安, 吕金虎, 吕琳媛, 荣智海, 汪秉宏, 许小可, 章忠志. 复杂网络研究的机遇与挑战 . 电子科技大学学报, 2014, 43(1): 1-5. doi: 10.3969/j.issn.1001-0548.2014.01.001
[16]	唐雪飞, 杨陈皓, 牛新征. 复杂网络链路危险度预测模型研究 . 电子科技大学学报, 2013, 42(3): 442-447. doi: 10.3969/j.issn.1001-0548.2013.03.024
[17]	王伟, 杨慧, 龚凯, 唐明, 都永海. 复杂网络上的局域免疫研究 . 电子科技大学学报, 2013, 42(6): 817-830.
[18]	张昊, 陈超, 王长春. 基于空穴理论的复杂网络传染病传播控制 . 电子科技大学学报, 2011, 40(4): 491-496.
[19]	吕琳媛. 复杂网络链路预测 . 电子科技大学学报, 2010, 39(5): 651-661. doi: 10.3969/j.issn.1001-0548.2010.05.002
[20]	汪小帆, 刘亚冰. 复杂网络中的社团结构算法综述 . 电子科技大学学报, 2009, 38(5): 537-543. doi: 10.3969/j.issn.1001-0548.2009.05.007

点击查看大图

图(2) / 表(3)

计量

文章访问数: 4828
HTML全文浏览量: 1469
PDF下载量: 59
被引次数: 0

全文HTML

分析复杂网络中的节点重要性，是一个被广泛关注且具有重要意义的研究方向。目前，节点重要性的研究方法主要是针对网络中的所有节点做全局排序，以判断节点重要性^[1-3]。然而，“相对于一个或一组特定的节点，网络中哪些节点是最重要的?”这类问题显示了节点的相对重要性、局部重要性同样具有较强的现实意义，尤其是当网络的规模非常大的时候。解决这类问题的一种典型办法就是先量化一个节点相对于一个已知重要节点的重要性(称为相对重要性，有时也称为接近性或者相似性)，再计算一个节点相对已知的重要节点集的重要性，从而找到相对重要节点，即相对重要节点挖掘^[4]。如在罪犯关系网络中，通过已知罪犯查找其余罪犯^[5-7]；在蛋白质网络中，通过已知致病基因查找未知致病基因^[8]，或通过已知染病节点查找或预测风险节点^[9]；在传染病网络中，可针对已知感染人员，优先找出易感人群进行治疗、隔离，有效防止病毒的传播和扩散；在电力网络中，通过已知重要断路器或发电单元找出相对重要的断路器、发电单元等进行保护，可有效防止由相继故障引起的大范围停电。可见，挖掘网络中的相对重要节点具有重要的应用价值。

4. 结　束　语

本文提出了一种挖掘相对重要节点的方法——NLD，该方法基于与越多已知重要节点关联，其为相对重要节点的概率越大的假设。本文将NLD与已有的挖掘相对重要节点较好的方法KSmar、PPR、PHITS进行对比，实验结果证明NLD在一定程度优于这些方法。同时，NLD方法也为网络信息挖掘提供了新思路。在今后的工作中仍然有很多问题值得深入研究：1) 现有的各种度量网络中节点相对重要性的指标，比如路径长度的倒数、介数等，它们之间是否具有一定的联系。2) 现实世界中虽然很多网络都可以抽象为复杂网络，但针对不同网络设计其适用的挖掘算法仍是亟待研究的。

本文研究工作得到昆明市卫健委项目(2020-09-04-112)的资助，在此表示感谢。

参考文献 (23)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于邻层传播的相对重要节点挖掘方法

doi: 10.12178/1001-0548.2020283

作者简介:
赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究

通讯作者: 郁湧，E-mail：yuy1219@163.com

Relatively Important Nodes Mining Method Based on Neighbor Layer Diffuse

计量

基于邻层传播的相对重要节点挖掘方法

doi: 10.12178/1001-0548.2020283

1. 云南大学软件学院　昆明　650091

2. 云南大学云南省软件工程重点实验室　昆明　650091

3. 云南电网有限责任公司电力科学研究院　昆明　650217

4. 昆明理工大学信息工程及自动化学院　昆明　650504

作者简介:
赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究

通讯作者: 郁湧，E-mail：yuy1219@163.com

English Abstract

Relatively Important Nodes Mining Method Based on Neighbor Layer Diffuse

全文HTML

2.1. 问题定义

2.2. NLD算法中的分层

2.3. NLD算法的传播

2.4. 方法示例

3.1. 数据集

3.2. 评价指标

3.3. 实证比较

目录

期刊在线

编辑办公

友情链接

网络	基本拓扑特征
网络	$N$	$N'$	$M$	$K$	$C$
SARS	224	18	2 247	20.06	0.65
PPI	9 642	284	40 513	8.40	0.12
Human	3 574	186	6 002	3.36	0.15
Mouse	1 187	67	1 557	2.62	0.09

网络	方法
网络	KSmar	PPR	PHITS	NLD
SARS	0.183	0.175	0.179	0.183
PPI	0.110	0.106	0.127	0.109
Human	0.338	0.342	0.279	0.353
Mouse	0.280	0.274	0.261	0.284

网络	方法
网络	KSmar	PPR	PHITS	NLD
SARS	0.175	0.159	0.215	0.178
PPI	0.050	0.051	0.059	0.051
Human	0.083	0.088	0.075	0.092
Mouse	0.068	0.065	0.067	0.072

网络	方法
网络	KSmar	PPR	PHITS	NLD
SARS	0.175	0.159	0.215	0.178
PPI	0.050	0.051	0.059	0.051
Human	0.083	0.088	0.075	0.092
Mouse	0.068	0.065	0.067	0.072

留言板

基于邻层传播的相对重要节点挖掘方法

doi: 10.12178/1001-0548.2020283

作者简介: 赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究

通讯作者: 郁湧，E-mail：yuy1219@163.com

Relatively Important Nodes Mining Method Based on Neighbor Layer Diffuse

计量

出版历程

基于邻层传播的相对重要节点挖掘方法

doi: 10.12178/1001-0548.2020283

1. 云南大学软件学院 昆明 650091 2. 云南大学云南省软件工程重点实验室 昆明 650091 3. 云南电网有限责任公司电力科学研究院 昆明 650217 4. 昆明理工大学信息工程及自动化学院 昆明 650504

作者简介: 赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究

通讯作者: 郁湧，E-mail：yuy1219@163.com

English Abstract

Relatively Important Nodes Mining Method Based on Neighbor Layer Diffuse

全文HTML

2.1. 问题定义

2.2. NLD算法中的分层

2.3. NLD算法的传播

2.4. 方法示例

3.1. 数据集

3.2. 评价指标

3.3. 实证比较

目录

期刊在线

编辑办公

友情链接

作者简介:
赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究

1. 云南大学软件学院　昆明　650091

2. 云南大学云南省软件工程重点实验室　昆明　650091

3. 云南电网有限责任公司电力科学研究院　昆明　650217

4. 昆明理工大学信息工程及自动化学院　昆明　650504

作者简介:
赵娜(1982-)，女，博士，副教授，主要从事复杂性科学、软件工程及数据挖掘方面的研究