基于时空轨迹的热点区域提取

王侃; 梅克进; 朱家辉; 牛新征

doi:10.3969/j.issn.1001-0548.2019.06.018

基于时空轨迹的热点区域提取

doi: 10.3969/j.issn.1001-0548.2019.06.018

1.
中国电子科技集团公司第十研究所成都 610000
2.
电子科技大学计算机科学与工程学院成都 611731

基金项目:

四川省科技计划 2017FZ0094

详细信息

作者简介:
王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

中图分类号: TP301.6

Hotspots Extraction Based on Spatial-Temporal Trajectory Data

1.
The 10 th Research Institute of China Electronics Technology Group Corporation Chengdu 610000
2.
School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731

摘要: 轨迹聚类算法可以广泛地应用在交通管理中，利用轨迹聚类算法找出车辆轨迹热点区域对交通部门规划管理交通出行有重要指导意义。目前的轨迹聚类算法多以空间相似性进行度量，不能体现不同时间段的轨迹热点区域划分情况。针对上述问题，该文结合时间因素，提出了一种时空轨迹的热点区域提取算法。首先，对传统的密度峰值聚类算法进行了改进，考虑了计算密度的线性和非线性部分，改进了密度的计算方法；同时，改进了簇类中心的选取方法，能够自动地选取簇类中心；在此基础上，提出了聚类融合算法，过滤了不合适的聚类和多余聚类；最后利用DB检验量来检测提取效果。实验结果表明，相比于传统的聚类算法，本文算法能更有效地提取时空轨迹的热点区域。
- 聚类 /
- 密度 /
- 热点区域 /
- 时空轨迹
Abstract: Trajectory clustering algorithm can be widely used in traffic management. Finding the vehicle trajectory hotspots by using trajectory clustering algorithm has important guiding significance for traffic planning and management of traffic travel. Current trajectory clustering algorithms are mostly measured by spatial similarity, which cannot reflect the division of trajectory hotspots in different time periods. In response to the above problems, this paper proposes a hotspot region extraction algorithm for spatio-temporal trajectory, combined with the factor of time. Firstly, the traditional density peak clustering algorithm and the density calculation method are improved by considering the linear and nonlinear parts of the calculated density. At the same time, the method of choosing cluster center is modified to enable it to automatically select the cluster center. On the basis of the above, we propose a clustering fusion algorithm to filter inappropriate clusters and redundant clusters and use the DB index to detect the division results. The experimental results show that our algorithm can extract the hot spots of spatio-temporal trajectories more effectively than the traditional clustering algorithms.
- clustering /
- density /
- hotspots /
- spatio-temporal trajectory
图 1 热点区域

下载: 全尺寸图片幻灯片

图 2 ${\rho _i}$与${\sigma _i}$排序值的序列图

下载: 全尺寸图片幻灯片

图 3 聚类融合

下载: 全尺寸图片幻灯片

图 4 TSTHE算法的热点区域提取结果

下载: 全尺寸图片幻灯片

图 5 3种算法的结果对比

下载: 全尺寸图片幻灯片

图 6 3种算法的结果对比

下载: 全尺寸图片幻灯片

[1]	JAMES M Q. Some methods for classification and analysis of multivariate observations[C]//Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability. Oakland, USA: [s.n.], 1967, 1: 281-297.
[2]	HUANG Zhe-xue, NG M K. A fuzzy kmodes algorithm for clustering categorical data[J]. IEEE Transactions on Fuzzy Systems, 1999, 7(4):446-452. doi: 10.1109/91.784206
[3]	WANG Bo-wen, YIN Jun, HUA Qi, et al. Parallelizing k-means-based clustering on spark[C]//2016 International Conference on In Advanced Cloud and Big Data (CBD).[S.l.]: IEEE, 2016: 31-36.
[4]	MARTIN E, KRIEGEL H P, SANDER J, et al. Density-based spatial clustering of applications with noise[C]//International Conference Knowledge Discovery and Data Mining. 1996, 240: 226-231.
[5]	MIHAEL A, BREUNIG MM, KRIEGEL H P. Optics: Ordering points to identify the clustering structure[C]//Proceedings ACM SIGMOD International Conference on Management of Data. Philadelphia, Pennsylvania, USA: ACM, 1999, 28: 49-60.
[6]	KAI M T, MARK J C. Density-ratio based clustering for discovering clusters with varying densities[J]. Pattern Recognition, 2016, 60:983-997. doi: 10.1016/j.patcog.2016.07.007
[7]	ALEX R, ALESSANDRO L. Machine learning clustering by fast search and find of density peaks[J]. Science, 2014, 344(6191):1492. doi: 10.1126/science.1242072
[8]	PAN Qi-ming, CHENG Yong-mei, TAO Yang, et al. Automatic validating and clustering method for trajectories of moving objects in real scene[J]. Application Research of Computers, 2007, 24(4):158-154. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyyyj200704046
[9]	YUAN Guan, XIA Shi-xiong, ZHANG Lei, et al. Trajectory clustering algorithm based on structural similarity[J]. Journal on Communications, 2011, 32(9):103-110. http://d.old.wanfangdata.com.cn/Periodical/mkaq201902024
[10]	DI W U, DU Y Y, YI J W, et al. Density-based spatiotemporal clustering analysis of trajectories[J]. Journal of Geo-Information Science, 2015, 17(10):1162-1172. http://d.old.wanfangdata.com.cn/Periodical/dqxxkx201510004
[11]	SHI Lu-kui, ZHANG Yan-ru, ZHANG Xin. Trajectory data clustering algorithm based on spatio-temporal pattern[J]. Journal of Computer Applications, 2017, 37(3):854-859. http://d.old.wanfangdata.com.cn/Conference/WFHYXW654361
[12]	WANG Shu-liang, WANG Da-kui, LI Cao-yuan, et al. Clustering by fast search and find of density peaks with data field[J]. Chinese Journal of Electronics, 2016, 25(3):397-402. doi: 10.1049/cje.2016.05.001

[1]	张林兵, 郭强, 吴行斌, 梁耀洲, 刘建国. 基于多维行为分析的用户聚类方法研究 . 电子科技大学学报, 2020, 49(2): 315-320. doi: 10.12178/1001-0548.2018212
[2]	谢梅, 周涛. 中国学前教育水平的区域差异以及时空格局演变分析 . 电子科技大学学报, 2020, 1(1): 1-6. doi: 10.12178/1001-0548.2022226
[3]	钱志森, 黄瑞章, 魏琴, 秦永彬, 陈艳平. 半监督语义动态文本聚类算法 . 电子科技大学学报, 2019, 48(6): 803-808. doi: 10.3969/j.issn.1001-0548.2019.06.001
[4]	李海林, 魏苗. 自适应属性加权近邻传播聚类算法 . 电子科技大学学报, 2018, 47(2): 247-255. doi: 10.3969/j.issn.1001-0548.2018.02.014
[5]	叶娅兰, 何文文, 程云飞, 侯孟书, 李云霞. 面向压缩感知的基于相关性字典学习算法 . 电子科技大学学报, 2017, 46(5): 703-708. doi: 10.3969/j.issn.1001-0548.2017.05.011
[6]	张淯舒, 王慧强, 冯光升, 吕宏武, 温秀秀. 基于两阶段聚类的机会社会网络路由算法 . 电子科技大学学报, 2017, 46(4): 607-613. doi: 10.3969/j.issn.1001-0548.2017.04.021
[7]	邓晓政, 焦李成. 流形距离的自动免疫克隆聚类图像分割算法 . 电子科技大学学报, 2014, 43(5): 742-748. doi: 10.3969/j.issn.1001-0548.2014.05.019
[8]	乔少杰, 彭京, 李天瑞, 朱焱, 刘良旭. 基于CTBN的移动对象不确定轨迹预测算法 . 电子科技大学学报, 2012, 41(5): 759-763. doi: 10.3969/j.issn.1001-0548.2012.05.022
[9]	高辉, 王沙沙, 傅彦. Web舆情的长期趋势预测方法 . 电子科技大学学报, 2011, 40(3): 440-445. doi: 10.3969/j.issn.1001-0548.2011.03.022
[10]	王杰. 利用盲信号分离的自然梯度盲均衡算法 . 电子科技大学学报, 2008, 37(2): 181-183.
[11]	高俊波, 杨静. 在线论坛中的意见领袖分析 . 电子科技大学学报, 2007, 36(6): 1249-1252.
[12]	郑晓鸣, 吕士颖, 王晓东. 免疫接种粒子群的聚类算法 . 电子科技大学学报, 2007, 36(6): 1264-1267.
[13]	牛强, 夏士雄, 周勇, 张磊. 改进的模糊C-均值聚类方法 . 电子科技大学学报, 2007, 36(6): 1257-1259,1272.
[14]	祝金荣, 胡望斌. 聚类电价预测方法研究 . 电子科技大学学报, 2007, 36(6): 1278-1281.
[15]	朵春红, 王翠茹. 网格和密度的聚类算法在CRM中的应用 . 电子科技大学学报, 2007, 36(6): 1289-1291,1314.
[16]	董韵涵, 杨万麟. 改进最优聚类中心雷达目标识别法 . 电子科技大学学报, 2006, 35(2): 183-185,192.
[17]	耿技, 印鉴. 改进的共享型最近邻居聚类算法 . 电子科技大学学报, 2006, 35(1): 70-72.
[18]	马义德, 钱志柏, 陈娜. 基于FCM的动态结合全局图像阈值分割 . 电子科技大学学报, 2006, 35(3): 349-351.
[19]	叶茂, 陈勇. 基于分布模型的层次聚类算法 . 电子科技大学学报, 2004, 33(2): 171-174.
[20]	李秀森, 韩静轩, 马力. 增长因素为聚类变量的因素分析 . 电子科技大学学报, 2002, 31(2): 204-206.

点击查看大图

图(6)

计量

文章访问数: 4462
HTML全文浏览量: 1528
PDF下载量: 67
被引次数: 0

全文HTML

近年来，交通路网不断扩张，交通出行压力逐渐增加，尤其在上下班高峰期间，经常出现大面积拥堵的现象。对车辆轨迹进行分析，找出车辆的运行规律，有助于交通运营部门协调交通运输。随着配备了GPS传感器和存储硬件的WiFi嵌入式移动设备的大量使用，每天都会产生大量的存储着移动对象位置及时间戳的GPS轨迹数据。如何从大量的轨迹数据中挖掘出有用的价值是一个重要问题。轨迹聚类是分析GPS数据特征的主要方法之一，路网上的轨迹可以划分为许多不同的簇，通过对轨迹内部运动模式和特征信息的分析，确定轨迹间的相似度，将相似度较高的轨迹归入一簇，通过对轨迹簇的分析找出时空轨迹热点区域，从而挖掘出轨迹中的潜在规律，进而解决复杂路网中存在的实际问题。时空轨迹热点区域的主要特点即是在一段时间内存在许多空间相似性高的轨迹簇，因此在时空轨迹热点区域的提取问题中经常用到轨迹聚类的相关算法。目前的轨迹聚类算法多基于传统的空间聚类方法，其不足之处在于经常将某一时间段内没有轨迹或只有少量轨迹的区域识别为轨迹热点区域。对此，本文提出了一种基于聚类的时空轨迹热点区域提取算法，在传统的空间聚类方法的基础上，考虑了时间维度的特性，能够提取不同时段的轨迹热点区域。

1. 相关工作

聚类分析是数据挖掘用于知识发现的一个常用手段。它的目标是将数据集划分为一些组，这些组通常被称为簇，同一个簇中的数据点之间的相似度要高于其他簇中的数据点。目前，轨迹聚类方法多采用传统的空间聚类方法^[1-3]，如K-means通过不断更新簇类中心，将数据点聚类到相近的簇中，达到划分聚类的目的。然而它存在3个问题：1)必须用户事先指定划分簇类数量k，存在较大的主观因素；2)初始簇心的选择差异，直接影响最终的聚类结果；3)不能识别非球形的簇，存在着局限性。而基于密度聚类算法^[4-6]能识别任意形状的簇，但密度阈值的设定比较关键，对于不同的数据集，密度阈值调整十分困难。对此，文献[7]提出了选取数据点距离升序排序的前2%作为阈值来对高密度点进行选取，然而它的参数并不具有适应性，对不同的数据的划分效果差异较大。此外，部分研究通过数据预处理，消除冗余数据的影响；改变提取轨迹中特征点的方法，将对数据点的提取转变为提取轨迹段，从而更好地保留数据的结构特征；通过改变距离度量，更好地度量数据点之间的相似度，找出相似度较高的数据点(轨迹段)。如文献[8]对真实场景目标轨迹的有效性判断与聚类进行研究，通过轨迹的预处理，消除噪声影响。同时基于轨迹上点坐标值的方差、目标相邻两帧的运动方向以及角度、轨迹的长度3种信息来确定轨迹的有效性，当确认轨迹有效后，采取K-means算法将空间距离相近的轨迹聚到一个聚类中。文献[9]基于传统的空间聚类算法中选取轨迹采样点的局限性，提出了基于轨迹结构相似性的聚类算法，其通过计算轨迹的每个拐角，利用拐角阈值将轨迹划分为轨迹段，对目标轨迹进行结构化处理，计算结构化相似度，将具有相似度较高的轨迹段聚成一个类组。该方法从全局角度把握轨迹的特性和运动趋势，提高了轨迹聚类的精度。但上述方法并没有解决在实际交通中轨迹出现在不同时间段的问题。

为了解决上述问题，相关工作者在研究轨迹聚类问题中加入了时间度量。文献[10]定义了时间和空间距离，结合时间和空间邻域形成时空邻域，计算空间和时间阈值，在时空领域内找到满足空间和时间阈值长度的轨迹，将它们作为聚类核心，通过扩展其领域内直接密度可达的线段，得到最终的聚类结果。文献[11]通过对时间进行预处理，解决了时间和空间度量不同的问题，通过计算找出具有时空相似性的轨迹，将它们聚成一个聚类。上述方法通过重新定义距离等方式，利用密度峰值聚类算法找出轨迹的时空相似性，得到轨迹的热点区域，但在高密度点的选取上偏向人为因素，有时会存在较大误差。因此，本文提出一种基于时空轨迹的热点区域提取算法，首先对传统的密度峰值聚类算法^{[7, 12]}做了两个改进：1)改进密度的计算方法，采用加权密度计算的方法，考虑线性和非线性因素，使得密度点的区分更加明显；2)改进了簇类中心的选取方法，将轨迹点的密度值和与更高密度点之间的距离值相乘，选取比拐点大的值作为簇类中心进行聚类。最后采用聚类融合算法，过滤距离较近的聚类或者多余聚类，从而划分出一系列的热点区域。

5. 结束语

本文提出的基于时空轨迹的热点区域提取算法，采用密度加权方式改进了传统的轨迹算法中相似性度量单一的问题，同时利用聚类融合方法将轨迹集自动划分成恰当的簇类，解决了聚类簇数难以确定的问题。实验结果表明，与现有算法相比，本文的划分效果有了较大提升。通过对车辆轨迹数据进行聚类分析，找出具有时空相似性的轨迹区域，进而将轨迹区域划分为一系列热点区域，对合理分配警力，缓解交通高峰期的压力有重要指导意义。

参考文献 (12)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于时空轨迹的热点区域提取

doi: 10.3969/j.issn.1001-0548.2019.06.018

作者简介:
王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

Hotspots Extraction Based on Spatial-Temporal Trajectory Data

计量

基于时空轨迹的热点区域提取

doi: 10.3969/j.issn.1001-0548.2019.06.018

1. 中国电子科技集团公司第十研究所成都 610000

2. 电子科技大学计算机科学与工程学院成都 611731

作者简介:
王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

English Abstract

Hotspots Extraction Based on Spatial-Temporal Trajectory Data

1. The 10 th Research Institute of China Electronics Technology Group Corporation Chengdu 610000

2. School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731

全文HTML

目录

期刊在线

编辑办公

友情链接

留言板

基于时空轨迹的热点区域提取

doi: 10.3969/j.issn.1001-0548.2019.06.018

作者简介: 王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

Hotspots Extraction Based on Spatial-Temporal Trajectory Data

计量

出版历程

基于时空轨迹的热点区域提取

doi: 10.3969/j.issn.1001-0548.2019.06.018

1. 中国电子科技集团公司第十研究所 成都 610000 2. 电子科技大学计算机科学与工程学院 成都 611731

作者简介: 王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

English Abstract

Hotspots Extraction Based on Spatial-Temporal Trajectory Data

1. The 10 th Research Institute of China Electronics Technology Group Corporation Chengdu 610000 2. School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731

全文HTML

目录

期刊在线

编辑办公

友情链接

作者简介:
王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

1. 中国电子科技集团公司第十研究所成都 610000

2. 电子科技大学计算机科学与工程学院成都 611731

作者简介:
王侃(1986-), 男, 博士, 高级工程师, 主要从事信号、开源以及地理空间情报方面的研究.E-mail:306616278@qq.com

1. The 10 th Research Institute of China Electronics Technology Group Corporation Chengdu 610000

2. School of Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731