基于会面合并事件的社会关系强度度量模型

陈增; 王科人; 杨铮

doi:10.3969/j.issn.1001-0548.2019.01.016

基于会面合并事件的社会关系强度度量模型

doi: 10.3969/j.issn.1001-0548.2019.01.016

陈增¹,
王科人^1, ,,
杨铮²

1.
盲信号处理重点实验室成都 610041
2.
清华大学软件学院北京海淀区 100084

基金项目:

国家自然科学基金 61361166009

详细信息

作者简介:
陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

通讯作者: 王科人, E-mail:cfan662003@163.com

中图分类号: TP391;N94

A Social Relationship Strength Measurement Model Based on Merged Meeting Events

1.
National Key Laboratory of Science and Technology on Blind Signal Processing Chengdu 610041
2.
School of Software, Tsinghua University Haidian Beijing 100084

摘要: 针对时空数据条件下的网络用户社会关系挖掘，该文提出了一种社会关系强度度量模型—EPTDD（熵-个人-时间-时长-直径）模型，在会面合并事件基础上，从位置、时间、用户等多方面综合考虑会面事件对社会关系强度的贡献。首先，对用户之间会面事件进行检测，并将发生时间相近的会面事件进行合并处理，得到更加接近现实情况的会面合并事件；之后，以位置熵、位置个人背景、时间、时长和直径5种要素对会面合并事件的权重进行刻画；最后综合上述要素，分别实现社会关系强度度量的无监督和有监督方法。在3个真实数据集上的实验结果表明，该文提出的EPTDD模型能够有效度量用户之间的社会关系强度，且优于现有方法。
- 数据挖掘 /
- 会面合并事件 /
- 社会关系度量 /
- 时空数据
Abstract: In order to mining the social relationship between users based on spatio-temporal data, a novel entropy-personal-time-duration-diameter (EPTDD) model is proposed for measuring relationship strength in this paper. The model considers the effect on relationship measurement of meeting events from several different sides including location, time and user on the basis of merged meeting events. Firstly, meeting events are merged according to their occurring times to obtain merged meeting events that are more correlated with real life. Each merged meeting event is then weighted from location entropy factor, location personal factor, time factor, duration factor and diameter factor. Finally, the five factors are synthesized to obtain unsupervised and supervised methods for measuring social relationship. Experimental results on three different real datasets demonstrate that our methods perform significantly more favorable than existing methods on the effectiveness.
- data mining /
- merged meeting events /
- social science computing /
- spatiotemporal

图 1 基于EPTDD模型的社会关系强度度量框架

下载: 全尺寸图片幻灯片

图 2 用户社会关系强度度量P-R曲线比较

下载: 全尺寸图片幻灯片

表 1 基于EPTDD模型的有监督方法特征描述

	特征	维数
总体描述特征	对$E_{i,j}^x(x = 0,1,2,3)$分别求取的MF、$\max ({\text{interval}})$、$\overline {{\text{interval}}} $	34
5种要素特征	对$E_{i,j}^x(x = 0,1,2,3)$分别按每种要素加权的最大值、平均值和标准差	345

下载: 导出CSV

表 2 提取后数据集的统计数据

数据	数据集
数据	MIT	Gowalla	Brightkite
提取用户数	87	5 000	5 000
朋友数	47	27 678	68 228
记录总条数	291 176	2 563 771	3 508 326
平均记录条数	3 346	512	701

下载: 导出CSV

表 3 用户社会关系强度度量性能比较

方法	MIT					Gowalla					Brightkite
方法	F1	AUC	AP	Acc	G_m	F1	AUC	AP	Acc	G_m	F1	AUC	AP	Acc	G_m
MF	18.82	61.10	8.39	98.60	59.53	32.21	70.07	31.06	94.75	64.69	41.25	64.06	38.40	75.14	62.48
PGT	28.57	64.10	14.46	98.64	63.21	46.81	84.09	52.24	95.08	77.63	60.60	78.69	64.59	76.68	75.56
EPTDD-U	35.48	71.14	22.89	98.69	69.79	52.58	84.97	55.10	95.52	78.07	65.11	83.15	72.46	80.00	75.56
VLoc	25.91	64.51	17.87	98.65	60.67	49.67	88.64	53.69	95.17	80.64	67.50	86.09	75.03	80.62	77.41
EPTDD-S	39.22	78.04	32.06	98.73	73.17	59.91	89.48	63.86	95.91	82.04	70.46	86.75	79.43	83.57	78.89

下载: 导出CSV

[1]	ASGARI F, GAUTHIER V, BECKER M. A survey on human mobility and its applications[EB/OL].[2017-03-01]. https://www.researchgate.net/publication/244989928_A_survey_on_Human_Mobility_and_its_applications.
[2]	BAO J, ZHENG Y, WILKIE D, et al. Recommendations in location-based social networks:a survey[J]. Geoinformatica, 2015, 19(3):525-565. doi: 10.1007/s10707-014-0220-8
[3]	WANG D, PEDRESCHI D, SONG C, et al. Human mobility, social ties, and link prediction[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Diego, USA: ACM, 2011: 1100-1108.
[4]	DHAR S, VARSHNEY U. Challenges and business models for mobile location-based services and advertising[J]. Communications of the ACM, 2011, 54(5):121-128. doi: 10.1145/1941487
[5]	ZHENG V W, ZHENG Y, XIE X, et al. Collaborative location and activity recommendations with gps history data[C]//International Conference on World Wide Web. Raleigh, North Carolina, USA: [s.n.], 2010: 1029-1038.
[6]	HOLZBAUER B O, SZYMANSKI B K, NGUYEN T, et al. Social ties as predictors of economic development[M].[S.l.]: Springer International Publishing, 2016: 178-185.
[7]	GE Y, XIONG H, LIU C, et al. A taxi driving fraud detection system[C]//International Conference on Data Mining. Vancouver: IEEE Computer Society, 2011: 181-190.
[8]	DESCIOLI P, KURZBAN R, KOCH N, et al. Best friends alliances, friend ranking, and the myspace social network[J]. Perspect Psychol SCI, 2011, 6(1):6-8. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=955abad9076d91e9326630b165e0a0eb
[9]	ZHANG D, VASILAKOS A V, XIONG H. Predicting location using mobile phone calls[J]. ACM Sigcomm Computer Communication Review, 2012, 42(4):295-296. doi: 10.1145/2377677
[10]	PANG J, ZHANG Y. Exploring communities for effective location prediction[C]//International World Wide Web Conference. Florence: ACM, 2015: 87-88.
[11]	TANG J, CHANG Y, LIU H. Mining social media with social theories:a survey[J]. ACM Sigkdd Explorations Newsletter, 2014, 15(2):20-29. doi: 10.1145/2641190
[12]	CHO E, MYERS S A, LESKOVEC J. Friendship and mobility: User movement in location-based social networks[C]//Proceedings of the 17th ACM SIGKDD International Conference On Knowledge Discovery And Data Mining.[S.l.]: ACM, 2011: 1082-1090.
[13]	EAGLE N, PENTLAND A, LAZER D. Inferring friendship network structure by using mobile phone data[J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(36):15274-15278. doi: 10.1073/pnas.0900282106
[14]	CRANDALL D, BACKSTROM L, COSLEY D, et al. Inferring social ties from geographic coincidences[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010, 107(52):22436-22441. doi: 10.1073/pnas.1006155107
[15]	PHAM H, SHAHABI C, LIU Y. EBM: an entropy-based model to infer social strength from spatiotemporal data[C]//ACM SIGMOD International Conference on Management of Data.[S.l.]: ACM, 2013: 265-276.
[16]	WANG H, LI Z, LEE W C. PGT: Measuring mobility relationship using personal, global and temporal factors[C]//International Conference on Data Mining. Atlantic: IEEE Computer Society, 2014: 570-579.
[17]	ZHANG Y, PANG J. Distance and friendship:a distance-based model for link prediction in social networks[M].[S.l.]:Springer International Publishing, 2015.
[18]	VALVERDE-REBAZA J, ROCHE M, PONCELET P, et al. Exploiting social and mobility patterns for friendship prediction in location-based social networks[C]//International Conference on Pattern Recognition. Cancún, Mexico: IEEE, 2016: 2526-2531.
[19]	CHENG R, PANG J, ZHANG Y. Inferring friendship from check-in data of location-based social networks[C]//IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining.[S.l.]: IEEE, 2015: 1284-1291.
[20]	HE H, GARCIA E A. Learning from imbalanced data[J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(9):1263-1284. doi: 10.1109/TKDE.2008.239

[1]	李海林, 张丽萍. 时间序列数据挖掘中的聚类研究综述 . 电子科技大学学报, 2022, 51(3): 416-424. doi: 10.12178/1001-0548.2022055
[2]	邢玲, 邓凯凯, 吴红海, 谢萍. 复杂网络视角下跨社交网络用户身份识别研究综述 . 电子科技大学学报, 2020, 49(6): 905-917. doi: 10.12178/1001-0548.2019182
[3]	聂敏, 张杨, 邓辉, 王伟, 夏虎, 周涛. 利用基本信息和行为数据发现高校贫困学生 . 电子科技大学学报, 2020, 49(5): 795-800. doi: 10.12178/1001-0548.2020139
[4]	郑文, 赵偲, 李泽堃, 武啸泽, 胡涛. 基于Web数据挖掘的COVID-19流行病学特征分析 . 电子科技大学学报, 2020, 49(3): 408-414. doi: 10.12178/1001-0548.2020079
[5]	李海林, 万校基. 基于簇中心群的时间序列数据分类方法 . 电子科技大学学报, 2017, 46(3): 625-630. doi: 10.3969/j.issn.1001-0548.2017.03.024
[6]	龙文, 马坤, 辛阳, 杨义先. 适用于协议特征提取的关联规则改进算法 . 电子科技大学学报, 2010, 39(2): 302-305. doi: 10.3969/j.issn.1001-0548.2010.02.032
[7]	杨珺, 曹阳, 马秦生, 王敏. 人工免疫行为轮廓取证分析方法 . 电子科技大学学报, 2010, 39(6): 911-914,919. doi: 10.3969/j.issn.1001-0548.2010.06.022
[8]	童彬, 秦志光, 贾伟峰, 宋健伟. 采用数据挖掘的拒绝服务攻击防御模型 . 电子科技大学学报, 2008, 37(4): 586-589.
[9]	朵春红, 王翠茹. 网格和密度的聚类算法在CRM中的应用 . 电子科技大学学报, 2007, 36(6): 1289-1291,1314.
[10]	王金龙, 徐从富, 徐娇芬, 骆国靖. 利用销售数据的商品影响关系挖掘研究 . 电子科技大学学报, 2007, 36(6): 1282-1285.
[11]	桑永胜, 陆鑫. 基于数据挖掘的Internet远程教学研究 . 电子科技大学学报, 2006, 35(6): 953-955,959.
[12]	文琪, 彭宏. 小波变换的离群时序数据挖掘分析 . 电子科技大学学报, 2005, 34(4): 556-558.
[13]	叶茂, 陈勇. 基于分布模型的层次聚类算法 . 电子科技大学学报, 2004, 33(2): 171-174.
[14]	曾异平, 朱宏, 龙文光. 趋势分析中的一种增量数据挖掘方法研究 . 电子科技大学学报, 2004, 33(4): 464-467.
[15]	黄羽, 黄迪明, 何险峰, 武明. 遗传算法在入侵检测中的应用 . 电子科技大学学报, 2003, 32(6): 679-682.
[16]	黄进, 尹治本. 关联规则挖掘的Apriori算法的改进 . 电子科技大学学报, 2003, 32(1): 76-79.
[17]	方英武, 张广鹏, 吴德伟, 黄玉美, 赵修斌, 王轶. 分布式数据挖掘计算过程——DDCP算法研究 . 电子科技大学学报, 2003, 32(1): 80-84.
[18]	詹瑾瑜, 熊光泽, 孙明. 基于DM的入侵检测系统结构方案 . 电子科技大学学报, 2002, 31(5): 502-506.
[19]	刘学生, 何跃, 贺昌政. 模糊规则归纳法及GDP主要影响因素分析 . 电子科技大学学报, 2002, 31(1): 92-96.
[20]	张凤荔, 葛晓峰, 卢显良. 基于数据仓库的综合查询系统的设计和实现 . 电子科技大学学报, 1999, 28(2): 207-210.

点击查看大图

图(2) / 表(3)

计量

文章访问数: 3844
HTML全文浏览量: 1193
PDF下载量: 73
被引次数: 0

全文HTML

随着手机和空间定位技术的发展和广泛应用，大量位置信息的获取成为可能。目前对手机的位置信息获取与记录主要有两种方式：1)手机可以利用基站信息来确定其所处的位置并进行记录，例如基站号就可以认为是手机所处位置的标识^[1]；2)越来越多的手机应用允许用户分享他们的位置和移动信息，例如在Facebook、微信等上，用户可以上传带有位置标签的文字和图片，而Foursquare等应用记录了大量用户的签到数据，其中包含位置信息^[2]。

大规模时空数据吸引研究人员针对时空数据与用户社会关系的相关性开展研究^[3]。这些研究工作对于广告投放^[4]、朋友推荐^[5]、经济发展^[6]甚至犯罪检测^[7]等大量应用具有重要的现实意义。文献[8]发现用户之间的社会关系与物理距离具有很强的相关关系，即距离较近的用户之间更有可能存在较强的社会关系。大量的研究主要通过社会关系理解人类的移动行为^[9-11]，如文献[12]通过对用户的移动距离和社会关系的分析，发现短距离的周期移动与社会网络结构几乎没有关联，而长距离移动则受社会关系影响很大。

本文基于时空数据对用户之间的社会关系强度进行度量。针对此研究目标，文献[13]发现在相近时间出现在同一个地方(即会面)是表征朋友关系的一个重要指标。文献[14]提出社会关系强度与会面事件的频次具有强正相关关系，即会面频次越高，则两个用户是朋友的概率更大。

进一步研究发现，在基于会面事件度量社会关系时，一对用户的不同会面事件并不是等权重的。文献[15]提出了一种基于位置熵的度量模型，该模型使用会面地点的信息熵对发生在热门地点的会面事件进行惩罚，这样可以降低偶然相遇对度量社会关系的影响。在文献[15]的基础上，文献[16]提出了一种综合了位置熵、个人背景和时间要素的方法，表现出比文献[15]更优的度量效果。除此之外，文献[17]提出了一种基于用户移动轨迹之间的距离的社交关系预测方法，这种方法可以用于预测不存在会面事件的用户之间的朋友关系，然而这种方法的应用场景受到一定的限制，无法应用到以离散基站标号记录位置的场景中。文献[18]则将会面特征与共现(两个用户出现在同一地点)特征进行结合，并使用地点的熵进行加权，取得了很好的效果。除此之外，还有一些研究将时间维度、空间维度和社交网络结合，通过有监督方法对朋友关系进行预测^[19]。

考虑到两个用户发生会面时的时间、地点、时长以及会面过程中移动距离等要素的不同，表征着会面事件对于度量用户之间的社会关系强度的重要性也不同，本文在文献[15-16]的基础上综合多种要素，提出EPTDD模型用来描述和度量不同要素条件下会面事件的重要性。该模型首先对会面事件进行合并，然后基于会面合并事件的5个要素对会面事件的权重进行定量描述。实验表明，EPTDD模型可以更好地用于度量用户之间的社会关系强度。

2. 基于EPTDD模型的社会关系强度度量

为了对社会关系强度进行度量，本节分别针对无监督和有监督情况，提出基于EPTDD模型的社会关系强度度量方法。其中，无监督方法适用于无任何先验知识的情况，而在有监督方法中，则利用已知社会关系强弱或是否具有真实社会关系(例如朋友关系)的用户对进行训练。

2.1. 基于EPTDD模型的无监督方法

记两个用户${U_i}$和${U_j}$的所有会面事件集合为${\text{O}}{{\text{E}}_{i,j}} = \{ o{e_h},h = 1,2, \cdots ,R_{i,j}^o\} $，其中$R_{i,j}^o \geqslant R_{i,j}^e$。大量相关研究基于会面事件集合进行社会关系强度的度量和预测^{[11, 15-16]}。比如，一种最简单的度量方法就是直接使用会面事件的频次作为度量值^[14]，即：

$${G_{o,{\text{MF}}}}({\text{O}}{{\text{E}}_{i,j}}) = \;|{\text{O}}{{\text{E}}_{i,j}}|$$

(14)

后续研究发现，不同会面事件对度量社会关系应该具有不同的权重^[15-16]，EPTDD模型也反应了这一点。通过对会面合并事件的5种要素进行综合，实现用户之间社会关系的强度度量。文献[16]使用位置个人要素的最大值对位置个人权重进行建模，但最大值过分强调了单次特殊会面的重要性，放大了数据采集阶段和会面事件检测阶段误差所导致的影响。因而本文使用平均值与标准差的和来代替最大值，得到度量值为：

$${G_{e,{\text{EPTDD}}}}({E_{i,j}}) = \prod\limits_{x \in \{ p,t,d,m\} } {{K_{{e_h}}}(\omega _{i,j}^x({e_h}))} \sum\nolimits_{{e_h}} {\omega _{i,j}^e({e_h})} $$

(15)

式中，${K_{{e_h}}}( \cdot )$表示两个用户所有会面合并事件单一权重的平均值与标准差的和。

2.2. 基于EPTDD模型的有监督方法

5种要素隐含了有利于度量用户之间社会关系强度的若干信息。为了尽可能地保留这些信息，在有监督方法中，针对5种要素分别提取多维统计特征，并结合分类器从已标注数据中学习训练分类器参数，期望得到更好的社会关系强度度量结果。

给定用户${U_i}$和${U_j}$的所有会面事件的集合${E_{i,j}} = \{ {e_h},h = 1,2, \cdots ,R_{i,j}^e\} $，提取5种要素所有权重的最大值、平均值和标准差以及会面频次(meeting frequency, MF)、不同会面之间的最大时间间隔($\max ({\text{interval}})$)和平均时间间隔($\overline {{\text{interval}}} $)作为有监督方法的18维特征。除此之外，会面发生时间段的不同也一定程度上表征了会面事件对于关系强度度量权重的不同。比如，朋友之间在周末发生会面事件的频次更高。将所有会面事件按照发生的时间分为工作日的白天、工作日的晚上和周末3个时间段内的集合，并分别提取以上18维特征。

将一周的时间记为${\text{se}}{{\text{g}}_0} = [0,7)$，其中0表示周一零时，则3个时间段集合${\text{se}}{{\text{g}}_i}(i = 1,2,3)$分别为：

$$ \left\{ \begin{array}{l} {\rm{se}}{{\rm{g}}_1} = \left\{ {t:t \in [0,5)且t\% 1 \in \left[ {\frac{7}{{24}},\frac{{17}}{{24}}} \right)} \right\}\\ {\rm{se}}{{\rm{g}}_2} = \left\{ {t:t \notin {\rm{se}}{{\rm{g}}_1} \cup {\rm{se}}{{\rm{g}}_3}} \right\}\\ {\rm{se}}{{\rm{g}}_3} = \left\{ {t:t \in \left[ {4\frac{{17}}{{24}},7} \right) \cup \left[ {0,\frac{7}{{24}}} \right)} \right\} \end{array} \right. $$

(16)

则时间段${\text{se}}{{\text{g}}_i}(i = 0,1,2,3)$内的会面事件集合可以记为：$E_{i,j}^x = \{ {e_h} \in {E_{i,j}}:{t_h} \in {\text{se}}{{\text{g}}_x},x = 0,1,2,3\} $。从中提取的72维特征的简单描述如表 1所示。

表 1 基于EPTDD模型的有监督方法特征描述

	特征	维数
总体描述特征	对$E_{i,j}^x(x = 0,1,2,3)$分别求取的MF、$\max ({\text{interval}})$、$\overline {{\text{interval}}} $	34
5种要素特征	对$E_{i,j}^x(x = 0,1,2,3)$分别按每种要素加权的最大值、平均值和标准差	345

在应用时，若训练数据标签为{“弱关系”“强关系”}信息，可利用随机森林等分类器对其进行训练，并将识别阶段输出的预测概率作为社会关系强度度量值；若训练数据集中用户之间关系强度为连续值，则可以通过回归方法进行训练。

4. 结束语

针对基于时空数据的用户社会关系强度度量问题，本文提出了基于会面合并事件的EPTDD模型。该模型在对会面事件进行检测、合并的基础上，从5个要素对会面事件进行加权。通过综合这些要素，本文提出了基于EPTDD模型的无监督和有监督方法用于度量用户社会关系强度的度量。实验结果表明，在社会关系强度度量上，本文提出的EPTDD模型优于已有方法，且在精确而密集的时空数据条件下表现更优。一方面，精确位置数据条件降低了会面事件检测阶段引起的误差；另一方面，密集时空数据条件为本文EPTDD模型的基础——会面事件的合并提供了有效的支撑，提高了会面合并事件的会面时长和伴随移动距离的可信度。

考虑到网络用户之间除了在时空数据层面上会发生会面事件外，还可能会存在一定通联关系，因而本文下一步的研究将围绕时空数据与通联数据结合条件下的社会关系强度度量展开。

参考文献 (20)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于会面合并事件的社会关系强度度量模型

doi: 10.3969/j.issn.1001-0548.2019.01.016

作者简介:
陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

通讯作者: 王科人, E-mail:cfan662003@163.com

A Social Relationship Strength Measurement Model Based on Merged Meeting Events

计量

基于会面合并事件的社会关系强度度量模型

doi: 10.3969/j.issn.1001-0548.2019.01.016

1. 盲信号处理重点实验室成都 610041

2. 清华大学软件学院北京海淀区 100084

作者简介:
陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

通讯作者: 王科人, E-mail:cfan662003@163.com

English Abstract

A Social Relationship Strength Measurement Model Based on Merged Meeting Events

1. National Key Laboratory of Science and Technology on Blind Signal Processing Chengdu 610041

2. School of Software, Tsinghua University Haidian Beijing 100084

全文HTML

1.1. 会面合并事件

1.2. 度量会面合并事件权重

1.2.1. 位置熵要素和位置个人要素

1.2.2. 时间要素

1.2.3. 时长要素

1.2.4. 直径要素

2.1. 基于EPTDD模型的无监督方法

2.2. 基于EPTDD模型的有监督方法

3.1. 数据集

3.2. 实验方法及参数配置

3.3. 评价指标

3.4. 实验结果

目录

期刊在线

编辑办公

友情链接

留言板

基于会面合并事件的社会关系强度度量模型

doi: 10.3969/j.issn.1001-0548.2019.01.016

作者简介: 陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

通讯作者: 王科人, E-mail:cfan662003@163.com

A Social Relationship Strength Measurement Model Based on Merged Meeting Events

计量

出版历程

基于会面合并事件的社会关系强度度量模型

doi: 10.3969/j.issn.1001-0548.2019.01.016

1. 盲信号处理重点实验室 成都 610041 2. 清华大学软件学院 北京 海淀区 100084

作者简介: 陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

通讯作者: 王科人, E-mail:cfan662003@163.com

English Abstract

A Social Relationship Strength Measurement Model Based on Merged Meeting Events

1. National Key Laboratory of Science and Technology on Blind Signal Processing Chengdu 610041 2. School of Software, Tsinghua University Haidian Beijing 100084

全文HTML

1.1. 会面合并事件

1.2. 度量会面合并事件权重

1.2.1. 位置熵要素和位置个人要素

1.2.2. 时间要素

1.2.3. 时长要素

1.2.4. 直径要素

2.1. 基于EPTDD模型的无监督方法

2.2. 基于EPTDD模型的有监督方法

3.1. 数据集

3.2. 实验方法及参数配置

3.3. 评价指标

3.4. 实验结果

目录

期刊在线

编辑办公

友情链接

作者简介:
陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

1. 盲信号处理重点实验室成都 610041

2. 清华大学软件学院北京海淀区 100084

作者简介:
陈增(1995-), 男, 主要从事时空数据挖掘和社会网络分析方面的研究

1. National Key Laboratory of Science and Technology on Blind Signal Processing Chengdu 610041

2. School of Software, Tsinghua University Haidian Beijing 100084