基于部分路径的社交网络信息源定位方法

张聿博; 张锡哲; 徐超

doi:10.3969/j.issn.1001-0548.2017.01.012

基于部分路径的社交网络信息源定位方法

doi: 10.3969/j.issn.1001-0548.2017.01.012

东北大学计算机科学与工程学院沈阳 110819

基金项目:

中央高校基本科研业务费 N140404011

国家自然科学基金 60093009

详细信息

作者简介:
张聿博(1984-),男,博士,主要从事社交网络方面的研究

中图分类号: TP391

Source Localization Algorithm Based on Partial Paths for Social Networks

College of Computer Science and Engineering, Northeastern University Shenyang 110819

摘要: 随着微博、微信等在线社交网络的快速发展，社交网络上的不实信息呈现爆发式的传播，往往会引起严重的后果，如何寻找谣言等不实信息在社交网络中的传播源头具有重要的应用意义。该文提出一种面向在线社交网络的信息源点定位方法，与现有的基于观察点的定位方法不同，该方法考虑了传播过程中信息普遍带有的部分传播路径，并以此重构传播过程，修正传播子图，从而更准确地定位信息源点。在模型网络及实际网络上进行实验，说明了该算法的有效性。
- 信息传播 /
- 部分路径 /
- 社交网络 /
- 源点定位
Abstract: With the rapidly growth of online social networks such as microblog and WeChat, the false information breaks out on the social network and often brings serious consequences. How to locate the rumor source is of great importance for many applications. This paper proposes a source localization algorithm on online social network. We consider the characteristic that the information often contains some partial spreading, and design a more accurate algorithm to locate the information source. The results show that the improved algorithm can provide a more accurate spreading trees and improve the localization accuracy. Experiments on model and real network show the effectiveness of the improved algorithm.
- information diffusion /
- partial paths /
- social network /
- source localization

图 1 构建广度优先生成树举例

下载: 全尺寸图片幻灯片

图 2 模型网络命中率比较

下载: 全尺寸图片幻灯片

图 3 SinaWeibo网络命中率比较

下载: 全尺寸图片幻灯片

图 4 Twitter网络命中率比较

下载: 全尺寸图片幻灯片

图 5 不同部分路径长度的定位准确率

下载: 全尺寸图片幻灯片

表 1 网络数据集

名称	N	L	<k>	d	Apl
ERNETWORK1	500	3 748	7.496	10	3.089
ERNETWORK2	500	5 041	10.082	10	2.81
ERNETWORK3	500	6 258	12.516	9	2.633
ERNETWORK4	500	7 403	14.806	8	2.489
BANETWORK1	500	3 750	7.5	7	3.339
BANETWORK2	500	5 000	10.082	6	2.974
BANETWORK3	500	6 300	12.5	5	2.761
BANETWORK4	500	7 400	14.806	5	2.628
SinaWeibo	3 861	3 528	0.914	3	1.109
Twitter	3 656	188 712	51.617	12	3.764

下载: 导出CSV

[1]	BUDAK C, AGRAWAL D, EI ABBADI A. Limiting the spread of misinformation in social networks[C]//Proceedings of the 20th International Conference on World Wide Web.[S.l.]:ACM, 2011:665-674
[2]	BUDAK D, EL ABBADI A. Information diffusion in social networks:Observing and influencing societal interests[J]. Proceedings of the VLDB Endowmen, 2011(4):1512-1513. http://cn.bing.com/academic/profile?id=0fbe966af1e579bf082605a179a560d4&encoded=0&v=paper_preview&mkt=zh-cn
[3]	BUDAK C, AGRAWAL D, EL ABBADI A. Structural trend analysis for online social networks[J]. Proceedings of the VLDB Endowment, 2011, 4(10):646-656. doi: 10.14778/2021017
[4]	SHAH D, ZAMAN T. Detecting sources of computer viruses in networks:theory and experiment[J]. ACM Sigmetrics Performance Evaluation Review, 2010, 38(1):203-214. doi: 10.1145/1811099
[5]	BROCKMANN D, HELBING D. The hidden geometry of complex, network-driven contagion phenomena[J]. Science, 2013, 342(6164):1337-1342. doi: 10.1126/science.1245200
[6]	LOKHOV A Y, MEZARD M, OHTA H. Inferring the origin of an epidemic with dynamic message-passing algorithm[J]. Phys Rev E, 2014, 90(1):012801. doi: 10.1103/PhysRevE.90.012801
[7]	PRAKASH B A, VREEKEN J, FALOUTSOS C. Spotting culprits in epidemics:How many and which ones?[C]//ICDM.[S.l.]:IEEE, 2012, 12:11-20.
[8]	COMIN C H, COSTA L F. Identification of starting points in sampling of complex networks[J]. Phys Rev E, 2011, 84(5):056105. doi: 10.1103/PhysRevE.84.056105
[9]	ZHU K, YING L. Information source detection in the SIR model:a sample path based approach[J]. IEEE/ACM Transactions on Networking, 2013, 24(1):408-421. http://cn.bing.com/academic/profile?id=f540677f37b3a9450fa3048cdf2d6038&encoded=0&v=paper_preview&mkt=zh-cn
[10]	PINTO P C, THIRAN P, VETTERLI M. Locating the source of diffusion in large-scale networks[J]. Physical Review Letters, 2012, 109(6):068702. doi: 10.1103/PhysRevLett.109.068702
[11]	ERDOS P, RENYI A. On the evolution of random graphs[J]. Publ Math Inst Hungar Acad Sci, 1960, 5:17-61.
[12]	BARABASI A L, ALBERT R. Emergence of scaling in random networks[J]. Science, 1999, 286(5439):509-512. doi: 10.1126/science.286.5439.509

[1]	张广胜, 康昭, 田玲. 面向网络安全治理的用户身份识别技术与挑战 . 电子科技大学学报, 2023, 52(3): 398-412. doi: 10.12178/1001-0548.2022106
[2]	于运铎, 徐铭达, 许小可. 基于多尺度时效模体度的虚假信息传播机制 . 电子科技大学学报, 2023, 52(1): 154-160. doi: 10.12178/1001-0548.2021354
[3]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[4]	许楠楠, 胡海波. 基于Lotka-Volterra模型的淘汰机制下的信息相互作用 . 电子科技大学学报, 2022, 51(3): 464-472. doi: 10.12178/1001-0548.2021166
[5]	聂敏, 罗炜敏, 邓辉, 王伟, 夏虎, 周涛. 高校学生心理健康情况对其社交网络结构的影响研究 . 电子科技大学学报, 2021, 50(2): 317-320. doi: 10.12178/1001-0548.2020032
[6]	巩云超, 李发旭, 周丽娜, 胡枫. 在线社交超网络的信息全局传播模型 . 电子科技大学学报, 2021, 50(3): 437-445. doi: 10.12178/1001-0548.2020401
[7]	肖海林, 刘小兰, 林潇瑜, 欧阳缮, 邱斌. C-V2X下基于信用卡风险评估的中继选择算法 . 电子科技大学学报, 2020, 49(1): 71-80. doi: 10.12178/1001-0548.2018102
[8]	阚佳倩, 马闯, 张海峰. 警觉与疾病的传播次序性对动力学的影响 . 电子科技大学学报, 2020, 49(3): 431-437. doi: 10.12178/1001-0548.2019163
[9]	张永棠, 罗海波. 考虑用户-发布者关系的个性化微博搜索模型 . 电子科技大学学报, 2018, 47(4): 626-632. doi: 10.3969/j.issn.1001-0548.2018.04.024
[10]	赵倩文, 吴晔, 王胜烽. 人在社交网络中的投资行为研究 . 电子科技大学学报, 2018, 47(2): 298-302. doi: 10.3969/j.issn.1001-0548.2018.02.022
[11]	周冬梅, 陈婷, 赵闻文. 众筹平台的双层网络信息传播模型研究 . 电子科技大学学报, 2018, 47(1): 132-138. doi: 10.3969/j.issn.1001-0548.2018.01.020
[12]	刘晶, 王峰, 胡亚慧, 李石君. 基于微博行为数据的不活跃用户探测 . 电子科技大学学报, 2015, 44(3): 410-414. doi: 10.3969/j.issn.1001-0548.2015.03.016
[13]	任晓龙, 朱燕燕, 王思云, 廖好, 韩筱璞, 吕琳媛. 在线社交网络结构与区域经济关联性研究 . 电子科技大学学报, 2015, 44(5): 643-651. doi: 10.3969/j.issn.1001-0548.2015.05.001
[14]	陈玟宇, 贾贞, 祝光湖. 社交网络上基于信息驱动的行为传播研究 . 电子科技大学学报, 2015, 44(2): 172-177. doi: 10.3969/j.issn.1001-0548.2015.02.002
[15]	毕娟, 秦志光. 基于概率主题模型的社交网络层次化社区发现算法 . 电子科技大学学报, 2014, 43(6): 898-903. doi: 10.3969/j.issn.1001-0548.2014.06.018
[16]	李静茹, 喻莉, 赵佳. 加权社交网络节点中心性计算模型 . 电子科技大学学报, 2014, 43(3): 322-328. doi: 10.3969/j.issn.1001-0548.2014.03.001
[17]	阚佳倩, 谢家荣, 张海峰. 社会强化效应及连边权重对网络信息传播的影响分析 . 电子科技大学学报, 2014, 43(1): 21-25. doi: 10.3969/j.issn.1001-0548.2014.01.003
[18]	陆豪放, 张千明, 周莹, 喻星, 周涛, 张子柯. 微博中的信息传播: 媒体效应与社交影响 . 电子科技大学学报, 2014, 43(2): 167-173. doi: 10.3969/j.issn.1001-0548.2014.02.002
[19]	赵伟, 曾勇. 股票互自相关与反转收益的实证研究 . 电子科技大学学报, 2008, 37(1): 157-160.
[20]	高俊波, 杨静. 在线论坛中的意见领袖分析 . 电子科技大学学报, 2007, 36(6): 1249-1252.

点击查看大图

图(5) / 表(1)

计量

文章访问数: 4338
HTML全文浏览量: 1227
PDF下载量: 71
被引次数: 0

全文HTML

随着社交网络规模激增，信息的受众面不断扩大，社交网络已经成为一种非常重要的信息传播平台。用户在分享信息的同时，也要面临谣言等有害信息带来的不良影响。因此，如何控制谣言信息的传播已经成为当前的研究热点之一^[1-2]。

现有的控制谣言信息传播方法，一类是采用链接预测^[3]，通过现有的谣言传播信息，预测谣言的进一步传播趋势，并将可能产生的传播链路切断，来达到抑制谣言传播的目的。另一类有效的方法是找到谣言的源头^[4-6]，这对于有效地控制谣言传播具有重要帮助。

对于传播源点定位问题，一种典型的方法是基于网络传播快照进行源点定位。如文献^[7]针对易感染病毒传播模型(SI模型)提出一种基于最小描述长度的定位方法，能够自动地确定传播源点的数目，并识别网络中的多个传播源点。文献^[8]给出了基于度、介数、紧密度和特征向量等拓扑度量的传播源点定位算法，由于源节点多数趋向于具有最高的中心度，因此这种方法对于雪球传播模型非常有效。文献^[9]采用样本路径方法，寻找最有可能形成网络快照中样本路径的根节点作为信息源点。

虽然基于网络快照的定位方法具有不错的定位精度，但其需要获取网络全部节点的传播状态，对于在线社交网络这类大规模网络，很难实现。不同于此类方法，文献^[10]提出了一种可以用于大型复杂网络的信息源定位方法，在网络中选取少量节点作为观察点，记录这些节点的传播状态，利用最大似然估计找出传播源点。该方法可以有效地减小数据需求，能够用于大规模网络上的源点定位。

但是，这种基于观察点的信息源定位方法，只考虑了网络中节点只能记录与其直接相关的传播信息(包括接收消息的时间、传入方向等)的情况，通过这些信息很难了解消息的真实传播过程。在线社交网络中，由于用户间存在信息互动，信息在传播的过程中可能会附加上一些与该信息传播过程有关的附加内容。

本文提出一种基于部分传播路径的信息源定位算法，与现有的基于观察点的定位方法不同，该方法考虑观察点所收到信息中附加的部分传播路径，并以此重构传播过程，筛选可能的信息源点，从而准确定位信息传播源点。并在大规模网络上进行实验，结果表明，利用部分传播路径可以有效地提高定位准确率。

1. 信息传播模型

在线社交网络的信息传播具有方向性，即只有“关注者”用户节点才能从“被关注者”用户节点收到信息，因此本文采用有向图G(V,E,W)对社交网络进行建模。其中，V为节点集合，E为边集，W为权集，表示每条边上信息传播的延迟时间。

对于节点u∈V，$\gamma (u)$表示其邻居节点集合，${{t}_{u}}$表示u首次收到某一指定信息的时间；对于边${{e}_{ij}}\in E$，${{e}_{ij}}$为节点i和节点j之间的连边；${{w}_{ij}}\in W$为随机变量，表示边${{e}_{ij}}$的传播延迟，本文考虑传播延迟服从均值为$\mu $和方差为${{\sigma }^{2}}$的高斯分布的情况^[10]。

在某一未知时刻t^*，未知源点${{s}^{*}}\in V$发送消息M给其邻居节点$\gamma ({{s}^{*}})$。节点u有两种可能状态：

1) 知情状态，该节点已经接收到信息。

2) 不知情状态，该节点没有接收到信息。当节点u收到指定消息M时，若此时u为知情状态，则不做变化；否则由不知情状态变为知情状态，并将消息M发送给$\gamma (u)$。

选取社交网络上部分节点记录其传播状态，称这些节点为观察点，记为$O=\{{{o}_{k}}\}_{k=1}^{K}$，观察点会记录3类信息：1) 发送者，表示消息是从哪个节点传入的。2) 时间，信息首次到达该节点的时间。3) 消息内容，包括消息之前传播所附加的部分路径信息。

4. 结束语

本文分析了在线社交网络中的信息传播过程，发现消息中携带的部分传播路径可以有效地提高信息源点定位的准确度。因此，提出一种基于部分传播路径的源点定位算法，根据观察点记录的信息，提取部分传播路径，并基于部分传播路径的约束，建立更接近信息传播过程的广度优先搜索树，从而定位信息源。

本文提出的方法利用了在线社交网络上的信息传播特点，有效地提高了信息源点的定位准确率。在模型网络和实际网络上的实验结果表明，改进算法的定位准确率明显高于原有算法，充分验证了该方法的有效性。并且，从部分路径长度和观察点记录部分路径比例两个方面，分析了对该方法定位准确率产生影响的因素。本文提出的方法，对于有效定位在线社交网络中谣言等信息源点具有重要的应用意义。

参考文献 (12)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于部分路径的社交网络信息源定位方法

doi: 10.3969/j.issn.1001-0548.2017.01.012

作者简介:
张聿博(1984-),男,博士,主要从事社交网络方面的研究

Source Localization Algorithm Based on Partial Paths for Social Networks

计量

基于部分路径的社交网络信息源定位方法

doi: 10.3969/j.issn.1001-0548.2017.01.012

东北大学计算机科学与工程学院沈阳 110819

作者简介:
张聿博(1984-),男,博士,主要从事社交网络方面的研究

English Abstract

Source Localization Algorithm Based on Partial Paths for Social Networks

College of Computer Science and Engineering, Northeastern University Shenyang 110819

全文HTML

2.1. 算法思路

2.2. 算法描述

3.1. 实验数据

3.2. 实验过程及结果分析

目录

期刊在线

编辑办公

友情链接

留言板

基于部分路径的社交网络信息源定位方法

doi: 10.3969/j.issn.1001-0548.2017.01.012

作者简介: 张聿博(1984-),男,博士,主要从事社交网络方面的研究

Source Localization Algorithm Based on Partial Paths for Social Networks

计量

出版历程

基于部分路径的社交网络信息源定位方法

doi: 10.3969/j.issn.1001-0548.2017.01.012

东北大学计算机科学与工程学院 沈阳 110819

作者简介: 张聿博(1984-),男,博士,主要从事社交网络方面的研究

English Abstract

Source Localization Algorithm Based on Partial Paths for Social Networks

College of Computer Science and Engineering, Northeastern University Shenyang 110819

全文HTML

2.1. 算法思路

2.2. 算法描述

3.1. 实验数据

3.2. 实验过程及结果分析

目录

期刊在线

编辑办公

友情链接

作者简介:
张聿博(1984-),男,博士,主要从事社交网络方面的研究

东北大学计算机科学与工程学院沈阳 110819

作者简介:
张聿博(1984-),男,博士,主要从事社交网络方面的研究