-
交通异常状态检测是当前交通领域中一个非常重要的研究方向。迄今为止,国内外已有的相关研究多数利用了线圈[1-2]、视频[3-5]、红外传感装置[6]等固定传感设备采集数据。然而,由固定传感设备采集的数据多限于检测器断面[7],使交通异常检测受到了很大局限。随着全球定位系统(GPS)的日益普及,许多城市已可以实现对移动对象的实时跟踪,用装有GPS接收器的车辆作为移动传感器来采集交通状态信息,具有成本低、灵活性强、数据量大等优点[8]。近年来,基于车载GPS数据的研究主要集中于车辆路径选择模式及路段异常判别两个方面。
在车辆路径的选择模式方面,文献[9]将路径分割为若干子路径,通过比较子路径组成的相关多维向量,找出其中的异常子路径,从而发现城市的异常路径选择行为;文献[10]挖掘相同OD之间的不同路径,提出了用流量构成描述向量的方法,挖掘人类出行异常模式子图,并利用社交媒体数据进行异常信息的补充;文献[11]提出了基于车辆移动轨迹在线检测异常轨迹的算法。这类方法研究重点在于发现人类的出行规律。
在路段异常判别方面,文献[12]通过比较观测路段与其他路段的相似性,构造包含历史趋势信息的状态向量,提取出离群点作为异常值;文献[13]通过比较路段真实值流量和期望值流量,判断路段是否为异常路段。基于路段的异常判断能直观清晰地反映路段通行情况,但缺乏对路段之间内在联系和相互作用的融合,难以确定异常产生的根源并进行疏导;文献[14]针对车辆运行状态如速度、加速度等的变化,推测当前行驶路段是否异常,但这类方法需要考虑不同等级路段固有属性对车辆通行状态的限制,应用难度较大。
为了解决现有交通异常检测方法遇到的难点,本文提出一种基于路径旅行时间分析的交通网络异常检测算法。该算法以Map-matching技术和DBSCAN聚类算法为基础,且与传统方法相比具有以下特点:
1) 以路径为研究对象。
与基于路段的交通异常检测方法相比,基于路径的交通异常检测具有以下优点:首先,该方法可以获得更多样本量,减小偶发情况对整体检测结果的影响。其次,该方法能综合考虑连续路段交通状况的累加影响,对不同程度交通状况的检测结果更为精确。最后,异常路径的发现能直观显示交通异常状况影响区域,多个异常路径的累加更容易形成交通异常子网,便于发现交通异常的影响程度及传播规律。
2) 以旅行时间为判断标准。
本文利用浮动车GPS数据得到的路径旅行时间数据能够避免路段固有属性比如车道数、路面状况等对上述指标的影响,无需相应的路段参数即可对交通状况进行判断,方法简单,通用性强。
HTML
-
交通事故或交通拥堵等交通异常事件的显著特点是造成路段通行速度降低,因此,大量的研究基于路段的速度、流量等属性进行路段状态识别。然而,这种异常识别方法也存在一些不足。一些路段的速度表现出不规则的波动给交通异常判断带来困难,如图 5a和图 5b所示。因此,选择路径的旅行时间作为研究对象,能综合考虑多个邻接路段的通行情况,减小异常检测误差,如图 4b所示。
使用上一节阐述的方法计算各路径的异常阈值,图 6为某地理子区中检测出的4条异常路径旅行时间随时间的变化,4条路径的旅行时间均在第6个时间窗开始突增并超出异常阈值,于第8个时间窗附近达到相对高峰之后逐步恢复正常。由图 6a可知,该条路径正常通行时的旅行时间约50 s,而旅行时间异常值最高达280 s。
为衡量异常路径覆盖路段受影响程度,引入R值进行计算:计算路径在各个时间窗的受影响程度=平均旅行时间/$\left\langle t \right\rangle $,取受影响程度最大的时间窗进行各路段$R$值的计算:
式中,${v_r}$为一个月中该时间窗的平均通行速度;${v_a}$为受影响程度最大时间窗的平均通行速度。图 7a所示为路径1在第8个时间窗依次经过路段${v_r}$和${v_a}$的对比。
图 7b中加粗路段为异常路径覆盖路段,由$R$值分布可看出各路段受影响的程度。
为验证该交通异常检测结果,从新浪微博中搜索信息,发现如表 1所示事件。
微博发出时间 初始坐标 内容 October 17 11:28 114.077 22 528 11时25分,滨河大道福田南路西往东方向,发生两小车事故,占据中间车道,导致车多缓行,交警正赶往现场,请途经车友注意避让 该事件初始定位在图 7b所示的地理图标位置,事件描述与所测交通异常基本相符,微博所反映的事件发生在11:28,为图 6中箭头所示位置。而算法在11:00就检测出交通异常,比微博发出提前28分钟,微博发出时间基本位于路径旅行时间最大的时间窗内,从微博内容可看出此时交警还在赶往途中。图 6b展示了交通异常的产生和消散过程,图 7b展示了交通异常的集中区域。
将地理子区内所有交通异常路径经过的节点和边组成的网络定义为“基于路径的交通异常子网”,如图 8a中的粗线所示。建立基于路段的交通异常子网用于比较。定义路段在检测时间窗的车辆行驶平均速度${\mu _c}$,路段在工作日相同时段的车辆行驶平均速度为${\mu _m}$,标准差为${\sigma _e}$,当${\mu _c} < {\mu _m} - 3 \times {\sigma _e}$时认为路段的车辆行驶速度发生异常。提取车辆行驶速度发生异常的边组成的网络,得到“基于路段的交通异常子网”,如图 8b、图 8d所示。
在发生交通事故的时间窗:基于路径的交通子网连成一个大团簇,如图 8a所示;而基于路段的交通异常子网分布较为杂乱,有几个零散的团簇,如图 8b所示。在交通运行正常的时间窗:基于路径的交通子网根本不存在,如图 8c所示;而基于路段的交通异常子网还是有一些零散的小团簇存在,这是由于个别路段偶发速度波动引起的,如图 8d所示。可以看出,基于路径的交通异常子网在交通正常与异常状态下的区别更为明显,有助于提高交通异常判断的准确性,上述结果也体现了基于路径的交通异常检测方法的优势:有利于减小偶发情况对整体检测结果的影响。