基于因果分析的群体行为识别

王军; 夏利民

doi:10.3969/j.issn.1001-0548.2018.02.015

基于因果分析的群体行为识别

doi: 10.3969/j.issn.1001-0548.2018.02.015

王军,
夏利民

中南大学信息科学与工程学院长沙 410075

基金项目:

国家自然科学基金 51678075

国家863项目 2009AA11Z205

详细信息

作者简介:
王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究

中图分类号: TP391

Group Activity Recognition in Crowd via Causality Analysis

School of Information Science and Engineering, Central South University ChangSha 410075

摘要: 该文提出一种基于因果分析的群体行为识别方法，利用Grange因果检验分析个体行为间的因果关系，在此基础上，结合个体间的因果关系、空间位置关系和视觉注意力范围，利用基于主集的聚类法检测行为群体。为了有效地表示群体行为，用方向梯度直方图和光流直方图描述个体行为，用因果特征描述个体间的交互行为。采用稀疏表示进行群体行为识别，在公共数据库BEHAVE和collective activity上对该方法进行验证，并与其他方法进行对比试验，结果表明了该方法的有效性。
- 因果分析 /
- 主集 /
- 群体行为识别 /
- 群体检测 /
- 稀疏表示
Abstract: A novel method for group activity recognition in crowd is proposed using causality analysis. The Granger Causality Test is used to analyze the causality between individual actions. On this basis, we adopt a dominant set based clustering algorithm to detect interacting groups in crowded scenes using causality, spatial and directional relationships among people. To effectively represent group activity, low level visual features and causality features are used. The low level visual features, which included histograms of oriented gradients (HOG) and histograms of optical flow (HOF), are applied to describe the properties of individual activity, and the causality features obtained by causality analysis are introduced to depict the interaction information of people. Sparse representation is employed to recognize group activities in crowd. Experiments are performed on the BEHAVE and collective activity databases to test and evaluate the proposed method. The experiments results show that the proposed method is more effective than other state-of-the-art methods.
- causality analysis /
- dominant set /
- group activity recognition /
- group detection /
- sparse representation

图 1 BEHAVE数据库

下载: 全尺寸图片幻灯片

图 2 CAD数据库

下载: 全尺寸图片幻灯片

表 1 在BEHAVE数据库上的识别率

行为	识别率/%
行为	文献[10]	文献[12]	文献[13]	本文方法
Approach	83.3	83.3	85.4	88.5
Split	76.9	91.4	92.3	94.6
WalkTogether	96.0	91.6	96.0	96.2
RunTogether	91.3	89.2	90.7	92.5
Fighting	88.7	88.9	89.4	90.6
InGroup	96.2	93.4	94.5	97.0
平均	88.5	90.6	91.2	94.7

下载: 导出CSV

表 2 在BEHAVE数据库上的平均识别时间

方法	文献[10]	文献[12]	文献[13]	本文方法
识别时间/s	0.88	0.92	0.91	0.86

下载: 导出CSV

表 3 有行为群体检测混淆对比

行为	A	S	W	R	F	I
A	88.5	0.00	0.00	0.00	0.00	11.5
S	0.00	94.6	2.20	1.00	1.20	1.00
W	0.00	0.00	96.2	3.80	0.00	0.00
R	0.00	0.00	5.20	92.5	0.00	2.30
F	9.50	0.00	0.00	0.00	90.5	0.00
I	3.00	0.00	0.00	0.00	0.00	97.0

下载: 导出CSV

表 4 无行为群体检测混淆对比

行为	A	S	W	R	F	I
A	82.5	0.00	6.50	0.00	0.00	11.0
S	0.00	90.6	3.40	2.50	2.25	1.25
W	1.30	0.00	91.8	4.20	0.00	2.70
R	0.00	0.00	6.50	88.3	0.00	5.20
F	8.70	1.60	0.00	0.00	89.7	0.00
I	4.00	0.00	2.40	3.60	0.00	90.0

下载: 导出CSV

表 5 在CAD数据库上的识别率

行为	识别率/%
行为	文献[10]	文献[12]	文献[13]	本文方法
Crossing	72.3	69.3	78.4	79.5
Walking	83.4	81.5	81.5	84.3
Waiting	67.6	71.6	77.8	78.4
Talking	85.7	89.2	100	100
Queueing	71.5	76.3	85.9	87.5
平均	76.2	79.8	84.2	86.7

下载: 导出CSV

表 6 在CAD数据库上的平均识别时间

方法	文献[10]	文献[12]	文献[13]	本方法
识别时间/s	0.98	1.21	1.12	0.94

下载: 导出CSV

表 7 有行为群体检测混淆对比

行为	Crossing	Waiting	Queueing	Walking	Talking
Crossing	79.5	5.80	1.00	13.7	0.00
Waiting	3.10	78.4	1.00	16.5	1.00
Queueing	0.00	0.00	87.5	12.5	0.00
Walking	12.0	2.00	1.00	84.3	0.00
Talking	0.00	0.00	0.00	0.00	100

下载: 导出CSV

表 8 无行为群体检测混淆对比

行为	Crossing	Waiting	Queueing	Walking	Talking
Crossing	67.5	6.50	3.50	22.5	0.00
Waiting	5.40	64.6	3.40	24.1	2.50
Queueing	0.00	0.00	81.4	18.6	0.00
Walking	22.6	4.00	2.00	71.2	0.00
Talking	0.00	1.30	0.00	0.00	98.7

下载: 导出CSV

[1]	KANEKO T, SHIMOSAKA M, ODASHIMA S. A fully connected model for consistent collective activity recognition in videos[J]. Pattern Recognition Letters, 2014, 43(1):109-118. doi: 10.1007/978-3-642-33885-4_26
[2]	AMER M R, TODOROVIC S. A chains model for localizing participantsof group activities in videos[C]//IEEE International Conference on Computer Vision. Barcelona: IEEE, 2011: 786-793.
[3]	ZHU G, YAN S, HAN T, et al. Generative group activity analysis with quaternion descriptor[J]. Adv Multimed Model, 2011, 6524:1-11. doi: 10.1007/978-3-642-17829-0
[4]	STEPHENS K, BORS A G. Group activity recognition on outdoor scenes[C]//IEEE International Conference on Advanced Video and Signal Based Surveillance. Colorado Springs: IEEE, 2016: 59-65.
[5]	ZHOU Y, HUANG T S, NI B, et al. Recognizing pair-activities by causality analysis[J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(5):1-20. doi: 10.1145/1889681.1889686
[6]	NI B, YAN S, KASSIM A. Recognizing human group activities with localized causalities[C]//IEEE Conference on Computer Vision and Pattern Recognition. Miam: IEEE, 2009: 1470-1477.
[7]	CHENG Z, QIN L, HUANG Q. Group activity recognition by gaussian processes estimation[C]//IEEE International Conference on Pattern Recognition. Istanbul: IEEE, 2010.
[8]	YIN Y, YANG G, XU J. Small group human activity recognition[C]//IEEE International Conference on Image Processing. Lake Buena Vista: IEEE, 2012: 2709-2712.
[9]	ZHANG C, YANG X, LIN W, et al. Recognizing human group behaviors with multi-group causalities[C]//International Conference on Web Intelligence and Intelligent Agent Technology Workshops. Macau: IEEE, 2012: 44-48.
[10]	JU J, YANG C, SCHERER S. Recognition of human group activity for video analytics[C]//Pacific-Rim Conference on Multimedia. Gwangju: IEEE, 2015.
[11]	KIM Y J, CHO N G, LEE S W. Group activity recognition with group interaction zone[C]//International Conference on Pattern Recognition. Stockholm: IEEE, 2014: 3517-3521.
[12]	CHO N G, KIM Y J, PARK U. Group activity recognition with group interaction zone based on relative distance between human objects[J]. International Journal Pattern Recognition and Artificial Intelligence, 2015, 29(5):1-10. doi: 10.1142/S0218001415550071
[13]	TRAN K N, YAN Xu, KAKADIARIS I A, et al. A hybrid approach for individual and group activity analysis in crowded scene[J]. Communications in Computer and Information Science, 2016, 598:189-204. doi: 10.1007/978-3-319-29971-6
[14]	GRANGER C. Investigating causal relations by econometric models and cross-spectral methods[J]. Econometrica, 1969, 37(3):424-438. doi: 10.2307/1912791
[15]	PAVAN M, PELILLO M. Dominant sets and pairwise clustering[J]. IEEE Transactions on PAMI, 2007, 29(1):167-172. doi: 10.1109/TPAMI.2007.250608
[16]	BULO S R, BOMZE I M. Infection and immunization:a new class of evolutionary game dynamics[J]. GAMES and Economic Behavior, 2011, 71(1):193-211. doi: 10.1016/j.geb.2010.06.004
[17]	MILAN A, SCHINDLER K, ROTH S. Multi-target tracking by discrete-continuous energy minimization[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38(10):2054-2068. doi: 10.1109/TPAMI.2015.2505309
[18]	ZHANG Y S, GUO Y. 2D OMP algorithm for space-time parameters estimation of moving targets[J]. Electronics Letters, 2015, 51(22):1809-1820. doi: 10.1049/el.2015.1039
[19]	MUKHERJEE S, BASU R, SEELAMANTULA C S. 1-K-SVD:a robust dictionary learning algorithm with simultaneous update[J]. Signal Processing, 2016, 123:42-52. doi: 10.1016/j.sigpro.2015.12.008

[1]	张婷婷, 杨红雨, 林毅. 融合表示学习的中医面部穴位检测框架 . 电子科技大学学报, 2023, 52(2): 175-181. doi: 10.12178/1001-0548.2022392
[2]	杨彦祥, 张翔引, 李波, 秦开宇. 基于群体智能算法的无人机蜂群拓扑构型方法 . 电子科技大学学报, 2023, 52(2): 203-208. doi: 10.12178/1001-0548.2022091
[3]	刘欣然, 徐雅斌. “类人”社交机器人检测数据集扩充方法研究 . 电子科技大学学报, 2022, 51(1): 130-137. doi: 10.12178/1001-0548.2021160
[4]	王兆滨, 马一鲲, 崔子婧. 基于引导滤波与稀疏表示的医学图像融合 . 电子科技大学学报, 2022, 51(2): 264-273. doi: 10.12178/1001-0548.2021165
[5]	张天一, 李文昌, 肖金玉, 刘剑. 基于稀疏字典学习的VLSI温度场重构技术 . 电子科技大学学报, 2021, 50(4): 502-507. doi: 10.12178/1001-0548.2020417
[6]	唐贤伦, 刘雨微, 万亚利, 马艺玮. 堆叠稀疏降噪自编码的脑电信号识别 . 电子科技大学学报, 2019, 48(1): 62-67. doi: 10.3969/j.issn.1001-0548.2019.01.011
[7]	李润东, 李立忠, 李少谦, 宋熙煜, 何鹏. 基于稀疏滤波神经网络的智能调制识别 . 电子科技大学学报, 2019, 48(2): 161-167. doi: 10.3969/j.issn.1001-0548.2019.02.001
[8]	程石磊, 赵雷, 钮孟洋, 廖炳焱, 解梅, 顾菘, 张跃飞. 判别分析字典在行为识别中的算法研究 . 电子科技大学学报, 2019, 48(5): 767-773. doi: 10.3969/j.issn.1001-0548.2019.05.017
[9]	邵鹏, 胡平. 复杂网络特殊用户对群体观点演化的影响 . 电子科技大学学报, 2019, 48(4): 604-612. doi: 10.3969/j.issn.1001-0548.2019.04.019
[10]	曹晖, 张秦正. 基于FSL数据集的去重性能分析 . 电子科技大学学报, 2018, 47(4): 621-625. doi: 10.3969/j.issn.1001-0548.2018.04.023
[11]	李厚彪, 樊庆宇, 耿广磊. 基于自适应同时稀疏表示的鲁棒性目标追踪 . 电子科技大学学报, 2018, 47(1): 1-12. doi: 10.3969/j.issn.1001-0548.2018.01.001
[12]	陈思宝, 徐丹洋, 罗斌. 一种非负稀疏近邻表示的多标签学习算法 . 电子科技大学学报, 2015, 44(6): 899-904. doi: 10.3969/j.issn.1001-0548.2015.06.018
[13]	李晓峰, 曾蕾, 徐进, 马世琪. 基于特征表征的单幅图像超分辨方法 . 电子科技大学学报, 2015, 44(1): 22-27. doi: 10.3969/j.issn.1001-0548.2015.01.003
[14]	程建, 黎兰, 王海旭. 稀疏表示框架下的SAR目标识别 . 电子科技大学学报, 2014, 43(4): 524-529. doi: 10.3969/j.issn.1001-0548.2014.04.009
[15]	赵贻玖, 王厚军, 戴志坚. 高速模拟信号压缩采样实现 . 电子科技大学学报, 2012, 41(4): 537-540. doi: 10.3969/j.issn.1001-0548.2012.04.011
[16]	刘昶, 周激流, 何坤, 张健. 正交非负CP分解的图像表示和识别 . 电子科技大学学报, 2011, 40(6): 905-910. doi: 10.3969/j.issn.1001-0548.2011.06.019
[17]	刘才铭, 张雁, 赵辉, 彭凌西, 曾金全. 多级免疫检测器集在分布式入侵检测中的应用 . 电子科技大学学报, 2007, 36(6): 1179-1182.
[18]	彭宏. 基于粗糙集理论的入侵检测方法研究 . 电子科技大学学报, 2006, 35(1): 108-110,136.
[19]	陈怀新, 南建设, 肖先赐. 基于统计特征主分量的信号调制识别 . 电子科技大学学报, 2004, 33(3): 231-234,238.
[20]	胡绍湘, 丁杰雄, 蔡重庆. 汽车后桥主锥总成综合检测和评判方法 . 电子科技大学学报, 2000, 29(5): 518-521.

点击查看大图

图(2) / 表(8)

计量

文章访问数: 3965
HTML全文浏览量: 1342
PDF下载量: 125
被引次数: 0

全文HTML

行为识别是计算机视觉领域的一个重要研究方向，在人机交互、智能视频监控等方面有着广阔的应用前景。近年来人体行为识别取得了显著进展，但主要工作还是集中在单人行为识别和两人交互行为识别上，群体行为识别仍是一项挑战性的工作。

目前，大多数群体行为识别方法主要分为基于特征的方法和基于轨迹的方法。在基于特征的群体行为识别方面，文献[1]用位置、形状、运动以及时序等特征表示群体行为。文献[2]采用局部视觉信息和群体行为链模型识别群体行为。文献[3]利用局部表面信息作为群体行为描述子。文献[4]利用运动信息和外观信息作为行为特征，采用核密度估计法建立群内个体间的交互关系。基于轨迹的群体行为识别^[5-7]是通过分析个体轨迹间的相互影响来识别群体行为。文献[5]利用Granger因果检验分析两个行为轨迹间的相互作用，并以此识别双人间的交互行为。文献[6]将该方法推广到群体行为识别。文献[7]用高斯过程表示人体运动轨迹，设计个体、双人、群体行为描述子进行群体行为识别。

然而，这些方法假设场景中只有一种群体行为，但实际环境中，可能同时存在个体行为、两人的交互行为以及群体行为，如果将整个行为视频看成是一个群体行为进行识别，将会影响群体行为的识别率。为了解决这一问题，文献[8-13]首先将行为群体从人群中检测出来，然后识别群体行为。文献[10]利用运动轨迹信息和外观信息定义了3种群体行为描述子，分别描述子群内、子群间的内在交互行为，采用SVM进行群体行为识别，但该方法很难检测出子群。文献[11-12]利用群交互区域检测场景中有意义的群体，用群体交互能量特征、吸引和排斥特征来描述GIZ中的群体行为，采用SVM进行群体行为识别。文献[13]利用图聚类算法检测人群中的群体，设计了一种表示运动和交互作用的描述子，采用SVM识别群体行为。但这些方法仅仅依靠个体间的空间关系来检测行为群体，这使得群体检测率不是很高，从而影响群体行为识别；同时，只是用视觉特征描述群体行为，而这些特征不能有效描述群体行为，因此也限制了群体行为识别率。

本文提出一种新的基于因果分析的群体行为识别方法。利用Grange因果检验对个体行为间关系进行分析，给出了个体间因果关系，在此基础上，首先，根据个体间的空间位置关系、视觉注意力方向以及因果关系，利用基于主集的聚类算法检测人群中的行为群体；然后，结合低层视觉特征和因果特征描述群体行为，由于不同群体行为个体数目不同，从而对应的轨迹数不同，导致整个特征长度不同。为了解决该问题，采用词包法将特征转化为行为视觉词表示；最后, 采用稀疏表示进行群体行为识别。

1. Grange因果检验

文献[14]提出了Grange因果检验，揭示不同经济因素之间的因果关系和反馈关系。Granger认为如果加入另一个时间序列X²，当前时间序列X₁的自回归预测误差的方差减小，那么X₂对X₁有因果影响。

设有两个联合平稳随机过程分别为X_i^(t)和X_j^(t)，其对应的自回归模型分别表示为：

$$ \begin{array}{*{20}{c}} {{X_i}(t) = \sum\limits_{k = 1}^n {{a_{1k}}} {X_i}(t - k) + {\varepsilon _1}}\\ {{\rm{var}}({\varepsilon _1}) = {\mathit{\Sigma }_1}} \end{array} $$

(1)

$$ \begin{array}{c} {X_j}(t) = \sum\limits_{k = 1}^n {{d_{1k}}} {X_j}(t-k) + {\eta _1}\\ {\mathop{\rm var}} ({\eta _1}) = {\mathit{\Gamma }_1} \end{array} $$

(2)

式中，ε₁、η₁分别为模型噪声；Σ₁和Γ₁为方差。

X_i^(t)和X_j^(t)的联合自回归模型可写为：

$$ \begin{array}{c} {X_i}(t) = \sum\limits_{k = 1}^n {{a_{2k}}} {X_i}(t-k) + \sum\limits_{k = 1}^n {{b_{2k}}} {X_j}(t-k) + {\varepsilon _2}\\ {\mathop{\rm var}} ({\varepsilon _2}) = {\mathit{\Sigma }_2} \end{array} $$

(3)

$$ \begin{array}{c} {X_j}(t) = \sum\limits_{k = 1}^n {{c_{2k}}} {X_j}(t-k) + \sum\limits_{k = 1}^n {{d_{2k}}} {X_i}(t-k) + {\eta _2}\\ {\mathop{\rm var}} ({\eta _2}) = {\mathit{\Gamma }_2} \end{array} $$

(4)

根据Grange因果检验，可以得到下列结论：

1) 因果关系：如果Σ₂ < Σ₁, 则X₂是X₁的Granger因果关系。

2) 反馈：如果X₂是X₁的Granger因果关系，而X₁是X₂的Granger因果关系，则X₁与X₂具有反馈。

3) 因果率F_c：

$$ {F_{cij}} = In\left( {\frac{{{\mathit{\Sigma }_1}}}{{{\mathit{\Sigma }_2}}}} \right) $$

(5)

因果率F_c测量因果关系的强度，因果影响越强，F_cij也越大；若X₂对X₁没有因果影响，则F_cij = 0。

4) 反馈率F_fij表示反馈强度：

$$ {F_{fij}} = {\rm{In}}\left( {\frac{{{\mathit{\Gamma }_1}}}{{{\mathit{\Gamma }_2}}}} \right) $$

(6)

本文利用Grange因果检验分析群体行为。对于一对个体，根据其运动轨迹，由最小二乘法可估计运动模型式(1)~式(4)中的系数及方差，再利用式(5)~(6)求得他们之间的因果律和反馈率，根据这些因果关系进行群体检测和群体行为表示。

2. 行为群体检测

由于复杂场景中可能存在独立的个体行为、双人交互行为和群体行为，为了有效地识别群体行为，首先必须检测出有意义的群体，为此利用因果关系和基于主集的聚类方法进行行为群体检测。

2.1. 主集

主集^[15]是最大团到无向加权图的推广。考虑一个无向加权图G =(V，E)，V={1, 2, , n}是所有顶点的集合，E∈V×V是所有边的集合，设S$\subseteq $V是顶点的一个非空子集，i∈S，则i关于S的平均加权度为：

$$ {\rm{awde}}{{\rm{g}}_S}(i) = \frac{1}{{\left| S \right|}}\sum\limits_{j \in S} {{a_{ij}}} $$

(7)

式中，|S|表示S的基数；a_ij为节点j和i之间的相似度。如果节点j$\notin $S，则节点j和i的相似性为：

$$ {\phi _S}(i, j) = {a_{ij}}-{\rm{awde}}{{\rm{g}}_S}(i) $$

(8)

i关于S的权值为：

$$ {w_S}(i) = \left\{ \begin{array}{l} 1\quad \quad \quad \quad \quad \quad \quad \quad {\mkern 1mu} \left| S \right| = 1\\ \sum\nolimits_{j \in S\backslash \{ i\} } {{\phi _{{\rm{S}}\backslash \{ i\} }}(j,i){w_{{\rm{S}}\backslash \{ i\} }}(j)} \;\;其他 \end{array} \right. $$

(9)

S的整体相似性定义为：

$$ W(S) = \sum\limits_{i \in S} {{w_S}(i)} $$

(10)

满足下列条件的非空子集S$\subseteq $V称为主集：

$$ {w_S}(i) > 0\;\;\;{\rm{ }}\forall i \in S $$

(11)

$$ {w_{S \cup \{ i\} }}(i) < 0\;\;\;{\rm{ }}\forall i \notin S $$

(12)

这表明主集等同类。求解下列优化问题可得到主集：

$$ \begin{array}{l} {\rm{Maximize}}\;f(\mathit{\boldsymbol{x}}) = {\mathit{\boldsymbol{x}}^{\rm{T}}}\mathit{\boldsymbol{Ax}}\\ {\rm{subject}}\;{\rm{to}}\;\mathit{\boldsymbol{x}} \in {\mathit{\Delta }_n} \end{array} $$

(13)

式中，${\mathit{\Delta }_n} = \left\{ {\mathit{\boldsymbol{x}} \in {R^n}:{x_i} \ge 0, \, i \in V\, {\rm{and}}\, {{\bf{1}}^{\rm{T}}}\mathit{\boldsymbol{x}} = 1} \right\}$。

如果x是式(13)的局部极值解，那么x的支撑集σ(x)={i∈V: x_i > 0}是节点的一个主集。

2.2. 基于主集图聚类的行为群体检测

类具有较高的内部一致性，并且类内元素与内外元素具有较高的可区分性。同样，对于相互作用的群体，同一群体内的成员之间具有很强的相互作用，而群内成员与群外成员之间相互作用比较小。基于这种比较, 将行为群体检测看成在图中搜索最大相互作用节点的主集，于是行为群体检测就转化为基于主集的图聚类问题。

将场景中的人看成无向图G =(V, E, A)，图的顶点代表人，而A=(a_ij)代表场景中人之间的交互作用程度。很显然, 当两人间的因果关系越强，他们之间的交互作用也就越强；当两个人越接近，他们之间交互作用的可能性也越大；另外，两个人处在对方的视觉注意力范围时，他们交互作用的可能性也越大。基于这些直觉，利用个体间的因果关系、空间位置关系以及视觉注意力方向关系定义个体间的交互程度。假设人的运动轨迹、空间位置、头部姿态已经确定。则根据个体的运动轨迹，利用Grange因果分析可得到个体间的因果律F_cij和反馈率F_fij；由空间位置可得到他们之间的空间距离d_ij；给定第i人的头部姿态，可确定其视觉注意力范围α_i，如第j个人出现在视觉注意力范围α_i内，则记为j∈α_i。于是，第i和第j个人之间的交互程度a_ij定义为：

$$ \begin{array}{c} {a_{ij}} = \\ \left\{ \begin{array}{l} 0\quad \quad \quad \quad \quad \, i \notin {\alpha _j}, j \notin {\alpha _i}\\ \frac{1}{{2{d_{ij}}}}({F_{cij}} + {F_{fij}})\;\;{\rm{ }}\, (i \in {\alpha _j}, j \notin {\alpha _i})或{\rm{ }}(i \notin {\alpha _j}, j \in {\alpha _i})\\ \frac{1}{{{d_{ij}}}}({F_{cij}} + {F_{fij}})\quad i \in {\alpha _j}, j \in {\alpha _i} \end{array} \right. \end{array} $$

(14)

根据式(14)，可以确定矩阵A，然后根据文献[16]的方法求解式(13)的局部优化解和它的支撑集，该支撑集即为相互作用的群体。

3. 群体行为识别

3.1. 群体行为表示

对于检测到的群体，其行为用群内个体的行为和个体间的交互作用来表示。利用低层视觉特征描述个体行为，因果关系描述个体间的交互行为。

1) 个体行为的低层特征表示

采用局部外观特征HOG和局部运动特征HOF表示个体行为。首先，利用多目标跟踪算法^[17]得到每个人的运动轨迹。为了避免跟踪过程中轨迹的漂移，只跟踪一段轨迹而不是整段轨迹，本文设跟踪轨迹的长度L=50。其次，沿着每个人的轨迹，建立一个包围人体的、大小为N_x×N_y×L的立方体，并将该立方体划分为n_x×n_y×n_L的时-空网格，本文取n_x=n_y=2，n_L=3；然后，在网格上计算4-bin HOG和5-bin HOF。最后将所有网格的特征连起来得到HOG描述子和HOF描述子，HOG、HOF的维数分别为48 (2×2×3×4)和60(2×2×3×5)。连接HOG和HOF，得到个体行为的低层特征表示F₁，其维数为108。

2) 交互行为的因果特征表示

因果特征描述个体间的交互行为，包括两个部分：相互作用强度和如何相互作用。用因果率F_cij和反馈率F_fij表示两个个体之间的相互作用强度，而个体间如何相互作用按下列方法确定。

设两个个体运动轨迹X_i和X_j的联合自回归模型为式(2)和(4)，如果将式(2)看成输入、输出分别为X_j和X_i的数字滤波器模型，则对应的系统函数为：

$$ {H_{ij}}(z) = \frac{{{X_i}(z)}}{{{X_j}(z)}} = \frac{{\sum\limits_{k = 1}^n {{b_{2k}}{z^{-k}}} }}{{1-\sum\limits_{j = 1}^n {{a_{2k}}{z^{-k}}} }} $$

(15)

式中，X_i^(z)和X_j^(z)分别为X_i和X_j的Z变换。利用对应的频率特性来表示个体间如何相互作用^[5]，即取频率特性在0, π/4, π/2, 3π/4, π处的幅值，以及在π/4, π/2, 3π/4处的相角(因为在0和π处相角为常数)：

$$ \begin{array}{c} {F_{ij}} = \left[{\left| {{H_{ij}}({e^{j0}})} \right|, \left| {{H_{ij}}({e^{j{\raise0.5ex\hbox{$\scriptstyle 1$} \kern-0.1em/\kern-0.15em \lower0.25ex\hbox{$\scriptstyle 4$}}\pi }})} \right|, \cdots, \left| {{H_{ij}}({e^{j\pi }})} \right|} \right., \\ \left. {\angle {H_{ij}}({e^{j{\raise0.5ex\hbox{$\scriptstyle 1$} \kern-0.1em/\kern-0.15em \lower0.25ex\hbox{$\scriptstyle 4$}}\pi }}), \cdots, \angle {H_{ij}}({e^{j\frac{3}{4}\pi }})} \right] \end{array} $$

(16)

F_ij反映X_j如何影响X_i。同样，分别以X_i、X_j为滤波器的输入和输出，得到特征向量F_ji，反映X_i如何影响X_j。

因果率和反馈率表示一对个体之间的相互作用的强度，而频率特性F_ij、F_ji反映一对个体如何相互作用，因此这些特征是互补的，将其合在一起表示一对个体的交互行为。另外，个体间的相对距离和相对速度通常也用于描述交互行为。因此，用F_ij、F_ji、d_ij、Δv_ij表示一对个体的交互行为：

$$ {\mathit{\boldsymbol{F}}_2}({X_i}, {X_j}) = ({\mathit{\boldsymbol{F}}_{ij}}, {\mathit{\boldsymbol{F}}_{ji}}, {\mathit{F}_{cij}}, {\mathit{F}_{fij}}, {d_{ij}}, \Delta {v_{ij}}) $$

(17)

式中，F₂是一个20维的因果特征向量。

3) 群体行为表示

如上所述，每个个体行为用一条轨迹的108维低层特征来描述，一对个体的交互行为用一对轨迹的20维因果特征来描述，而整个群体行为由所有个体的行为特征及所有行为对特征联合表示。但由于不同的群体行为包含个体的数目不同，相应的轨迹条数、轨迹对数不同，导致不同的群体行为特征维数不同。为此，利用词包法(bag-of-words, BOW)来表示群体行为。首先根据低层特征和因果特征，用均值聚类法分别建立个体行为的字典BOW_ind和交互行为字典BOW_int。对于每个群体行为，根据最近邻原则，把它的每条轨迹/轨迹对归入每一类，可得到各个视觉词在样本中出现的频率，这些频率就构成了样本的视觉词表示。本文两个字典大小分别为160、40，因此，群体行为用一个200维的视觉词向量y表示。

3.2. 基于稀疏表示的群体行为识别

利用稀疏表示识别群体行为。首先，对待测试群体行为样本进行编码；然后，计算在每一类上的重建误差；最后，将待测试群体行为样本分类到重建误差最小的类中。

设C有类群体行为，每个行为用上述特征向量表示，D=[D₁, D₂, …, D_C]表示稀疏字典，其中D_i是由K个第i类行为构成的子字典，本文利用K-SVD算法来确定稀疏字典^[18]。对于测试样本y可表示为：

$$ \mathit{\boldsymbol{y}} = \mathit{\boldsymbol{Da}} $$

(18)

式中，α = [α₁, α₂, …, α_C]^T为稀疏编码向量，通过求解下列优化问题得到：

$$ \mathit{\boldsymbol{\hat a}} = \mathop {\arg \min }\limits_\mathit{a} \left\{ {\left\| {\mathit{\boldsymbol{y}}-\mathit{\boldsymbol{Da}}} \right\|_2^2 + \lambda {{\left\| \mathit{\boldsymbol{a}} \right\|}_1}} \right\} $$

(19)

利用OMP法(orthogonal matching pursuit)求解上述优化问题^[19]。

然后计算相对第i类的重建误差：

$$ {R_i} = {\left\| {\mathit{\boldsymbol{y}}-{\mathit{\boldsymbol{D}}_i}{{\mathit{\boldsymbol{\hat a}}}_i}} \right\|_2} $$

(20)

最后，群体行为样本y根据下式分类(识别)：

$$ {\rm{label}}(\mathit{\boldsymbol{y}}) = \mathop {\arg \min }\limits_i \{ {R_i}\} $$

(21)

5. 结束语

本文提出了一种新的基于因果分析的群体行为识别方法。首先，利用Grange因果检验分析个体间因果关系，其次，结合个体间因果关系、空间关系和视觉注意力范围，采用基于主集的聚类算法进行群体检测；然后，利用低层视觉特征和因果特征描述群体行为，其中，HOG和HOF用于表示个体行为, 因果特征用于表示群体内个体间的交互行为，提高了特征的区分能力；最后，利用稀疏表示识别群体行为。在公共行为数据库BEHAVE和collective activity上与几种方法进行了对比实验，结果表明提出的方法比其他方法具有更高的识别率和识别速度。

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于因果分析的群体行为识别

doi: 10.3969/j.issn.1001-0548.2018.02.015

作者简介:
王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究

Group Activity Recognition in Crowd via Causality Analysis

计量

基于因果分析的群体行为识别

doi: 10.3969/j.issn.1001-0548.2018.02.015

中南大学信息科学与工程学院长沙 410075

作者简介:
王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究

English Abstract

Group Activity Recognition in Crowd via Causality Analysis

School of Information Science and Engineering, Central South University ChangSha 410075

全文HTML

2.1. 主集

2.2. 基于主集图聚类的行为群体检测

3.1. 群体行为表示

3.2. 基于稀疏表示的群体行为识别

4.1. BEHAVE数据库

4.2. Collective Activity数据库

目录

期刊在线

编辑办公

友情链接

留言板

基于因果分析的群体行为识别

doi: 10.3969/j.issn.1001-0548.2018.02.015

作者简介: 王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究

Group Activity Recognition in Crowd via Causality Analysis

计量

出版历程

基于因果分析的群体行为识别

doi: 10.3969/j.issn.1001-0548.2018.02.015

中南大学信息科学与工程学院 长沙 410075

作者简介: 王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究

English Abstract

Group Activity Recognition in Crowd via Causality Analysis

School of Information Science and Engineering, Central South University ChangSha 410075

全文HTML

2.1. 主集

2.2. 基于主集图聚类的行为群体检测

3.1. 群体行为表示

3.2. 基于稀疏表示的群体行为识别

4.1. BEHAVE数据库

4.2. Collective Activity数据库

目录

期刊在线

编辑办公

友情链接

作者简介:
王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究

中南大学信息科学与工程学院长沙 410075

作者简介:
王军(1971-), 男, 博士生, 主要从事图像处理与模式识别方面的研究