基于图卷积神经网络的位置语义推断

吴睿智; 朱大勇; 王春雨; 秦科

doi:10.12178/1001-0548.2020152

基于图卷积神经网络的位置语义推断

doi: 10.12178/1001-0548.2020152

电子科技大学计算机科学与工程学院　成都　611731

基金项目: 国家重点研发计划(2018YFC0807501)；四川省科技厅项目(2018JY0605, 2018GZDZX0048)

详细信息

作者简介:
吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

通讯作者: 朱大勇，E-mail： cnzdy@uestc.edu.cn

中图分类号: TP182

Location Semantics Inference with Graph Convolutional Networks

School of Computer Science and Engineering, University of Electronic Science and Technology of China　Chengdu　611731

摘要: 挖掘位置社交网络(LBSNs)中的签到数据背后所蕴藏的信息是城市计算、智慧城市的重要研究方向，其中一个关键的任务是推断位置语义。位置语义因其在位置检索、位置推荐、数据预处理等领域的广泛应用而受到越来越多的关注。现有的推断方法倾向于手工提取位置的时空特征或用户签到活动的时空模式训练分类器进而推断位置语义。然而，提取有价值的时空模式或时空特征是一项困难的任务。该文提出一种新的基于图卷积神经网络的位置语义推理模型(SI-GCN)。SI-GCN利用node2vec和变分自编码器来学习位置的空间和时间特征。构建用户−位置访问二部图，利用图卷积神经网络来捕获用户签到活动中的高阶信息。此外，SI-GCN引入自注意力机制区分用户−位置访问二部图中不同邻居节点的贡献。SI-GCN在两个真实签到数据集上的实验表明，SI-GCN比现有3种算法具有更好的推断性能。
- 数据挖掘 /
- 图卷积神经网络 /
- 位置社交网络 /
- 自注意力机制 /
- 语义推断
Abstract: Data mining on check-in data inlocation based social networks (LBSNs) is an important research direction of urban computing and smart city, and a critical task is to infer location semantic. The study of location semantics has attracted increasing attention in diverse fields due to its wide applications such as location retrieval, location recommendation, data preprocessing and so on. Established inference approaches tend to manually discover the spatiotemporal pattern of unique location as features for training classifiers. However, extracting valuable spatiotemporal patterns or features is a non-trivial task. In this paper, we propose a novel location semantic inference with graph convolutional networks (SI-GCN). We introduce node2vec and variational autoencoder to learn spatial and temporal features of location, respectively. Furthermore, we leverage graph convolutional networks to capture high order relations in user’s check-in activity with building a user-location bipartite network. And leveraging self-attention mechanism is allowed to distinguish contributions of the different nodes. Extensive experiments on several real-world check-in data sets show that our proposed framework outperforms than three state-of-art algorithms.
- data mining /
- GCN /
- LBSNs /
- self-attention mechanism /
- semantics inference

图 1 SI-GCN框架图

下载: 全尺寸图片幻灯片

图 2 变分自编码器提取时间特征的图示

下载: 全尺寸图片幻灯片

图 3 SI-GCN与3种基准算法在NYC数据集对比结果

下载: 全尺寸图片幻灯片

表 1 实验所用数据集统计信息

数据集	用户数	位置数	语义类别	签到数
NYC	1083	5135	321	147938
Tokyo	2293	7873	292	447570

下载: 导出CSV

表 2 SI-GCN在NYC和Tokyo两个数据集的实验结果

数据集	语义类别测试数据比例	10				20
数据集	语义类别测试数据比例	20%	30%	40%	50%	20%	30%	40%	50%
NYC	Acc	0.709	0.684	0.613	0.504	0.551	0.476	0.439	0.388
	microF1	0.587	0.545	0.490	0.424	0.519	0.454	0.411	0.345
	macrof1	0.534	0.452	0.419	0.372	0.477	0.399	0.374	0.295
Tokyo	Acc	0.719	0.670	0.623	0.573	0.643	0.563	0.504	0.418
	microF1	0.591	0.533	0.479	0.419	0.511	0.483	0.414	0.365
	macrof1	0.505	0.482	0.409	0.368	0.469	0.417	0.344	0.222

下载: 导出CSV

表 3 SI-GCN模型变体在Tokyo签到数据集的结果

参数	SI-GCN-S			SI-GCN-T
参数	20%	30%	40%	20%	30%	40%
Acc	0.527	0.464	0.435	0.497	0.420	0.383
microF1	0.417	0.378	0.290	0.425	0.324	0.294
macrof1	0.381	0.317	0.267	0.352	0.257	0.174

下载: 导出CSV

[1]	ZHENG Y. Trajectory data mining: an overview[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2015, 6(3), DOI: 10.1145/2743025
[2]	RODRIGUES F, MARKOU I, PEREIRA F C. Combining time-series and textual data for taxi demand prediction in event areas: A deep learning approach[J]. Information Fusion, 2019, 49: 120-129. doi: 10.1016/j.inffus.2018.07.007
[3]	ZHENG Y. Methodologies for cross-domain data fusion: An overview[J]. IEEE Transactions on Big Data, 2015, 1(1): 16-34. doi: 10.1109/TBDATA.2015.2465959
[4]	ZHENG Y, CAPRA L, WOLFSON O, et al. Urban computing: Concepts, methodologies, and applications[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2014, 5(3): 1-55.
[5]	PARENT C, SPACCAPIETRA S, RENSO C, et al. Semantic trajectories modeling and analysis[J]. ACM Computing Surveys (CSUR), 2013, 45(4): 1-32.
[6]	YANG D, ZHANG D, ZHENG V W, et al. Modeling user activity preference by leveraging user spatial temporal characteristics in LBSNs[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2014, 45(1): 129-142.
[7]	YE M, SHOU D, LEE W C, et al. On the semantic annotation of places in location-based social networks[C] //Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Diego, USA: ACM, 2011: 520-528.
[8]	LI Y, ZHAO X, ZHANG Z, et al. Annotating semantic tags of locations in location-based social networks[J]. GeoInformatica, 2020, 24(1): 133-152. doi: 10.1007/s10707-019-00367-w
[9]	WANG Y, QIN Z, PANG J, et al. Semantic annotation for places in LBSN through graph embedding [C]//Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. New York, USA: ACM, 2017: 2343-2346.
[10]	KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. [2018-10-15]. https://arxiv.org/abs/1609.02907.
[11]	GROVER A, LESKOVEC J. Node2vec: Scalable feature learning for networks[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, USA: ACM, 2016: 855-864.
[12]	ZHANG D, YIN J, ZHU X, et al. Network representation learning: A survey[J]. IEEE Transactions on Big Data, 2018, 6(1): 3-28. doi: 10.1089/big.2017.0083
[13]	XU W, SUN H, DENG C, et al. Variational autoencoder for semi-supervised text classification[C]//Proceedings of the 31st AAAI Conference on Artificial Intelligence. San Francisco, USA: [s.n.], 2017: 3358-3364.
[14]	VELIČKOVIĆ P, CUCURULL G, CASANOVA A, et al. Graph attention networks[EB/OL]. [2018-10-20]. https://arxiv.org/abs/1710.10903.

[1]	崔少国, 独潇, 张宜浩. 基于兴趣注意力网络的会话推荐算法 . 电子科技大学学报, 2024, 53(1): 67-75. doi: 10.12178/1001-0548.2022307
[2]	陈欣, 李闯, 金凡. 量子自注意力神经网络的时间序列预测 . 电子科技大学学报, 2024, 53(1): 110-118. doi: 10.12178/1001-0548.2022340
[3]	张少东, 杨兴耀, 于炯, 李梓杨, 刘岩松. 基于对比学习和傅里叶变换的序列推荐算法 . 电子科技大学学报, 2023, 52(4): 610-619. doi: 10.12178/1001-0548.2022164
[4]	李海林, 张丽萍. 时间序列数据挖掘中的聚类研究综述 . 电子科技大学学报, 2022, 51(3): 416-424. doi: 10.12178/1001-0548.2022055
[5]	刘楠, 张凤荔, 王瑞锦, 张志扬, 赖金山. 融合元路径学习和胶囊网络的社交媒体谣言检测方法 . 电子科技大学学报, 2022, 51(4): 608-614. doi: 10.12178/1001-0548.2021219
[6]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[7]	聂敏, 张杨, 邓辉, 王伟, 夏虎, 周涛. 利用基本信息和行为数据发现高校贫困学生 . 电子科技大学学报, 2020, 49(5): 795-800. doi: 10.12178/1001-0548.2020139
[8]	郑文, 赵偲, 李泽堃, 武啸泽, 胡涛. 基于Web数据挖掘的COVID-19流行病学特征分析 . 电子科技大学学报, 2020, 49(3): 408-414. doi: 10.12178/1001-0548.2020079
[9]	邢玲, 邓凯凯, 吴红海, 谢萍. 复杂网络视角下跨社交网络用户身份识别研究综述 . 电子科技大学学报, 2020, 49(6): 905-917. doi: 10.12178/1001-0548.2019182
[10]	李海林, 万校基. 基于簇中心群的时间序列数据分类方法 . 电子科技大学学报, 2017, 46(3): 625-630. doi: 10.3969/j.issn.1001-0548.2017.03.024
[11]	龙文, 马坤, 辛阳, 杨义先. 适用于协议特征提取的关联规则改进算法 . 电子科技大学学报, 2010, 39(2): 302-305. doi: 10.3969/j.issn.1001-0548.2010.02.032
[12]	杨珺, 曹阳, 马秦生, 王敏. 人工免疫行为轮廓取证分析方法 . 电子科技大学学报, 2010, 39(6): 911-914,919. doi: 10.3969/j.issn.1001-0548.2010.06.022
[13]	童彬, 秦志光, 贾伟峰, 宋健伟. 采用数据挖掘的拒绝服务攻击防御模型 . 电子科技大学学报, 2008, 37(4): 586-589.
[14]	王金龙, 徐从富, 徐娇芬, 骆国靖. 利用销售数据的商品影响关系挖掘研究 . 电子科技大学学报, 2007, 36(6): 1282-1285.
[15]	桑永胜, 陆鑫. 基于数据挖掘的Internet远程教学研究 . 电子科技大学学报, 2006, 35(6): 953-955,959.
[16]	文琪, 彭宏. 小波变换的离群时序数据挖掘分析 . 电子科技大学学报, 2005, 34(4): 556-558.
[17]	曾异平, 朱宏, 龙文光. 趋势分析中的一种增量数据挖掘方法研究 . 电子科技大学学报, 2004, 33(4): 464-467.
[18]	黄进, 尹治本. 关联规则挖掘的Apriori算法的改进 . 电子科技大学学报, 2003, 32(1): 76-79.
[19]	方英武, 张广鹏, 吴德伟, 黄玉美, 赵修斌, 王轶. 分布式数据挖掘计算过程——DDCP算法研究 . 电子科技大学学报, 2003, 32(1): 80-84.
[20]	张凤荔, 葛晓峰, 卢显良. 基于数据仓库的综合查询系统的设计和实现 . 电子科技大学学报, 1999, 28(2): 207-210.

点击查看大图

图(3) / 表(3)

计量

文章访问数: 6079
HTML全文浏览量: 1824
PDF下载量: 63
被引次数: 0

全文HTML

随着基于位置的社交网络(LBSNs)的发展，用户能够在签到位置发布评论分享自己的感受。理解用户活动的语义对分析用户行为起着重要的作用^[1-2]。如，一位用户发布一条评论“愿你在天堂安好！”。如果这条评论附加一个医院的位置语义，将有利于更好地理解用户的悲伤体验。同时，位置语义对城市生活中一些基于位置的服务如位置检索和位置推荐有所帮助^[3-4]。如，当用户到达一个新城市时，用户将搜索目的地附近的酒店或餐馆等语义信息。智能手机中的应用程序，如城市旅行中的导航，都依赖于位置语义^[5-6]。位置语义对于跨越网络和现实环境之间的鸿沟起着重要的作用。然而，据统计，至少有30%的位置在LBSNs中缺乏语义标签^[7]。另一方面，尽管地图服务提供商的业务增长迅速，但位置语义标签查询服务的成本却很高。谷歌提供语义搜索服务，每1000个地点收费超过千元。

位置语义研究一直是轨迹数据挖掘研究中的热点，位置语义推断也得到了许多研究者的广泛关注。一般的研究思路为通过手工提取用户签到活动中的时空模式，或通过手工定义位置的时空特征，利用分类器推断位置语义。如文献[7]提取特定位置的显式模式(explicit patterns, EP)和相似位置之间的隐式关联(implicit relatedness, IR)。基于EP和IR特征，训练支持向量机分类器推断位置语义。文献[8]提出一种新的位置特征，称为相似用户模式(similar user pattern, SUP)，同时考虑个人用户活动的规律性，以及不同用户之间的相似性。提取SUP后，利用SUP度量位置间的相似性，训练分类器学习每个未标注语义的位置的语义标签。文献[9]提出一种基于图表征学习的位置语义推断算法，称为预测位置嵌入(predictive place embedded, PPE)。PPE首先构造用户−标签二部图，通过用户−标签二部图获得用户向量表征。优化每个位置作为其签到用户向量的质心嵌入表征的方式，将用户相似度转换为位置相似度，获取位置语义标签。

现有位置语义推理算法目标是提取签到活动中所隐含的位置时空特征或用户签到时空模式，并将语义推理转化为分类问题。但度量位置间的相似度或提取长效稳定的用户签到模式是一项困难的任务。为了克服这种局限性，本文提出一种基于图卷积神经网络的位置语义推理框架(semantic inferences with graph convolutional networks, SI-GCN)。SI-GCN通过无监督的方式提取位置的时空特征，利用图卷积神经网络(graph convolutional networks, GCN^[10])推断位置的语义类别标签。具体来说，SI-GCN通过node2vec^[11-12]和变分自编码器(variational autoencoder, VAE^[13])自动提取位置时空特征。然后，SI-GCN利用图卷积网络来捕获用户−位置访问二部图中的高阶访问关系，同时利用自注意力机制来学习用户−位置访问二部图中相邻节点的不同贡献。实验结果表明，相较于传统的位置语义推断算法，SI-GCN取得了更好的位置语义推断结果。

3. 结束语

本文提出一种基于图卷积神经网络的位置语义推断模型。与现有的方法不同，SI-GCN避免手工提取签到活动中时空特征的局限。同时，SI-GCN引入图卷积神经网络获取签到活动中的高阶信息。此外，为了区分用户−位置访问二部图中不同邻居节点的影响，引入自注意力机制计算邻居节点的影响力大小。SI-GCN在两个签到数据集上的实验结果表明，SI-GCN优于现有方法。

参考文献 (14)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于图卷积神经网络的位置语义推断

doi: 10.12178/1001-0548.2020152

作者简介:
吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

通讯作者: 朱大勇，E-mail： cnzdy@uestc.edu.cn

Location Semantics Inference with Graph Convolutional Networks

计量

基于图卷积神经网络的位置语义推断

doi: 10.12178/1001-0548.2020152

电子科技大学计算机科学与工程学院　成都　611731

作者简介:
吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

通讯作者: 朱大勇，E-mail： cnzdy@uestc.edu.cn

English Abstract

Location Semantics Inference with Graph Convolutional Networks

School of Computer Science and Engineering, University of Electronic Science and Technology of China　Chengdu　611731

全文HTML

1.1. 时空特征提取

1.2. 位置语义推断

2.1. 实验设置

2.2. 实验结果

目录

期刊在线

编辑办公

友情链接

留言板

基于图卷积神经网络的位置语义推断

doi: 10.12178/1001-0548.2020152

作者简介: 吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

通讯作者: 朱大勇，E-mail： cnzdy@uestc.edu.cn

Location Semantics Inference with Graph Convolutional Networks

计量

出版历程

基于图卷积神经网络的位置语义推断

doi: 10.12178/1001-0548.2020152

电子科技大学计算机科学与工程学院 成都 611731

作者简介: 吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

通讯作者: 朱大勇，E-mail： cnzdy@uestc.edu.cn

English Abstract

Location Semantics Inference with Graph Convolutional Networks

School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731

全文HTML

1.1. 时空特征提取

1.2. 位置语义推断

2.1. 实验设置

2.2. 实验结果

目录

期刊在线

编辑办公

友情链接

作者简介:
吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

电子科技大学计算机科学与工程学院　成都　611731

作者简介:
吴睿智(1991-)，男，博士生，主要从事轨迹数据挖掘方面的研究

School of Computer Science and Engineering, University of Electronic Science and Technology of China　Chengdu　611731