电子科技大学学报  2015, Vol. 44 Issue (5): 652-656
基于价值驱动的人类行为动力学实证研究和建模    [PDF全文]
符丁, 李明江, 黎路     
黔南民族师范学院计算机科学系 贵州 都匀 558000
摘要:为了探究价值驱动的人类行为特征及其机理,对基于价值驱动的健身运动行为和论文下载行为的间隔时间进行统计。统计结果表明,个体和集体健身运动行为时间间隔分布比较匀值,没有长时间的间隔,尾部下降趋势适用于指数函数,个体和群体下载论文行为时间间隔服从幂律分布。实证分析结果显示,时间自由支配权是影响人们行为的实际因素,改变行为的间隔时间分布规律。根据实证分析研究结果,提出了一个基于价值驱动的人类行为动力学模型,理论预测和实证结果相吻合。
关键词人类行为     人类动力学     间隔时间分布     价值驱动    
Empirical Study and Modeling of Human Behaviour Dynamics Based on the Value-Driven
FU Ding, LI Ming-jiang, LI Lu     
Department of Computer Science, Qiannan Normal College for Nationlities Duyun Guizhou 558000
Abstract: In order to explore the value driving feature and mechanism of human behavior, the statistical analysis of the intervals of fitness behavior and paper downloading is presented. The results show that the fitness interval distribution between individual and collective is relatively uniform, no long interval, tail downward trend with the exponential function; the downloading interval distribution between individual and collective follows power-law distribution. The empirical analysis results show that the right to free dispose of time is a practical factor to influence human behavior and change the interval time distribution of the behavior. Accordingly, we propose a value driving dynamic model which shows a good agreement between the theoretical predictions and the empirical results.
Key words: human behavior     human dynamics     interval time distribution     value-driven    

对人类行为的深入理解,有助于解释若干复杂的社会经济现象[1]。学者们分别从任务选择[2]、记忆驱动[3]、兴趣驱动[4, 5, 6]及习惯驱动[7]等方面对非泊松特性的生成机制进行了分析和研究,在一定范围内取得了成功。人类的行为是高度复杂的,但某些行为并不仅仅是任务选择、记忆驱动、兴趣驱动和习惯驱动的。如:现实生活中,某些人坚持健身运动,他们的行为是个人期望实现的价值(健康)所驱动;高校教师下载论文也是被他们个人期望实现的价值(有创见或突破的高质量科研成果)所驱动。本文研究由价值驱动的人类行为时间特性及其机理,对健身运动和论文下载行为时间特性进行实证分析和建模。

1 个体和集体健身行为的统计特征 1.1 数据来源与统计

个体数据采集地点为武汉江滩、公园和高校;通过调查问卷、访谈等形式记录坚持运动5年以上的200人的信息。运动形式有打太极拳、舞剑、快步走和健身操等;人员年龄在61~83岁之间;运动年限最短为5年,最长为25年;运动时间在夏季为6:00左右,春秋季为7:00左右,冬季为7:30左右;运动时长60~90 min以内;每天到江滩、公园和高校运动一次,因天气(雨雪天)等原因改在室内健身或改在当天其他时间段健身。

统计结果显示:5年中,129人每年只有5~8天因各种因素(不包括疾病住院、探亲访友和旅游)中断健身运动,其中,连续2天中断的只有9~12人,连续3天中断的只有2~4人。因疾病住院、探亲访友和旅游而中断健身的人数和天数情况见表 1所示。

表1 话题疾病住院、探亲访友和旅游而中断健身的人数和天数

集体数据采集地点为贵州都匀公园,现场观察该公园一群集体跳健身操的人员,对其进行访谈。他们在5年间每天18:30(春冬季节)或19:00(夏秋季节)集体跳健身操。一年中有16~19天因下雨或其他因素中断,其中,连续2天中断的有1~4次,连续3天中断的有1~2次,连续3天以上中断的情况未发生过。

1.2 个体和集体健身行为的统计特征

个体健身行为的统计特征:定义间隔时间为t,以天为单位,从2009年~2013年,5年时间段的统计特征,129人中任意两次连续健身行为的间隔时间长度为1~4天,间隔时间长度为1天占98%以上。129人中健身行为时间间隔分布比较匀值,没有长时间的间隔,尾部下降趋势适用于指数函数,截断点(头部与尾部交接处)为tc=2,图 1是编号98的健身人员在半对数坐标中健身行为间隔时间分布。从2009年~2013年中截取任一年,单年时间段的统计特征与5年时间段的统计特征相同,但人数是总人数的80.2%以上。

图1个体健身行为间隔时间分布

文献[8]对帕菲克国际健身俱乐部全体会员近27个月的登陆信息进行了实证分析,统计结果表明:个体健身行为间隔时间均满足具有胖尾过程的幂律分布,与本文统计结果不同。原因在于老年健身人员拥有全部时间自由支配权,而到健身俱乐部健身的绝大部分是中青年人,属于上班族,不拥有全部时间自由支配权。说明时间自由支配权是影响人们行为的实际因素,改变行为的间隔时间分布规律,或者说行为的驱动力(或驱动因素)相同,时间自由支配权不同会使行为时间特性不同。

集体健身行为的统计特征:定义其间隔时间为t,以天为单位,从2009年~2013年,5年时间段的统计特征,任意两个连续健身行为的间隔时间长度为1~4天,间隔时间长度为1天占95%。集体健身行为时

间间隔分布比较匀值,没有长时间的间隔,尾部下降趋势适用于指数函数,截断点为tc=2。集体健身人员在半对数坐标中健身行为间隔时间分布如图 2所示。

图2集体健身行为间隔时间分布

个体和集体健身行为的统计特征表明:在(健康)价值驱动健身运动模式中,行为的时间间隔存在一个阈值(阈值为截断点tc),时间长度小于阈值,行为的发生率为常数b,时间长度大于或等于阈值,行为的发生率为常数c,且bc>0。

2 论文下载行为的统计特征 2.1 数据来源

数据采集地点为武汉、上海、杭州、南京、长沙、广州的高校。采用人工截屏方法获取600名高校教师(985高校350名、211高校200名、地方高校50名)电脑中下载的每篇论文时间、已发表(或录用)的高质量论文(中文核心期刊或SCI论文)最后修改时间和准备下一篇论文而下载的第一篇论文时间。时间跨度从2012年1月~2014年1月,所有教师首次下载论文的年份是2012年,月份有相同和不相同,即使月份相同也有日期相同和不相同。针对某些老师电脑时间设置与北京时间有误差的,以北京时间为标准,对记录的时间进行校正。

2.2 数据统计方法

分两种情况进行统计:1) 原始时间,所有教师的论文下载时间不变;2) 时间对齐,即以其中某位教师的论文首次下载时间为基准时间,将与基准时间不同的教师论文首次下载时间进行前移或后移,使所有教师论文首次下载时间相同(即同年同月同日),其后论文下载时间也进行相应前移或后移。

2.3 论文下载间隔时间分布

定义间隔时间t,以min为单位,个体是从600名教师中选取50名下载总次数超过100次的教师进行统计;群体分别以原始时间和时间对齐两种情况进行统计。统计结果显示,个体和群体下载的时间间隔服从幂律分布。图 3是编号为27的个体在双对数坐标中下载时间间隔分布图,幂指数为1.734 9,相关系数R = 0.988 7。图 4图 5分别是群体以原始时间和时间对齐两种情况在双对数坐标中下载时间间隔分布图,幂指数分别近似于1.638 5和1.743 7,相关系数分别是R=0.975 8和R=0.973 4。图中的直线是利用回归方法得到的主体数据的拟合直线。由图 4图 5可知,论文首次下载时间是否相同,不影响全体教师的论文下载行为的时间特性。

图3个体下载的间隔时间分布

图4在原始时间情况下群体下载间隔时间分布

图5在时间对齐情况下群体下载间隔时间分布
3 健身运动和论文下载行为的时间统计特征分析

个体和集体健身行为时间间隔分布比较匀值,没有长时间的间隔,尾部下降趋势适用于指数函数,而个体和群体下载行为间隔时间服从幂律分布。同样是价值驱动,时间间隔为何出现不同的分布?

健康需要每天适量运动来维护,由于运动效应和蓄积作用,健身运动间隔时间不宜超过3天,否则,达不到维护健康的目的,也就是说满足健康价值的行为要具有均匀性和持续性,均匀性和持续性是由健康价值的内在机制决定的。要求满足价值的行为具有均匀性和持续性,此类价值称为保持价值。

下载行为是完成一篇论文所进行一系列行为的前(或后)置行为,横切于若干个行为中,与其他行为相互交织,协同完成一篇高质量论文。下载行为与其他行为存在行为间的关联性和行为间的时序关联性,它有两个基本特性:前(或后)置性和横切性,基本特性决定了下载行为的频率不同。下载行为的频率是由关联行为所花的时间决定的,即下载行为的频率与关联行为所花的时间成反比,关联行为所花的时间(下载间隔)取决于论文的质量,即关联行为所花的时间与论文质量的高低成正比,因此行为发生率随关联行为所花的时间线性递减。写一篇高质量论文所需知信(知识和信息)是有限量的,刚开始时,知信处于“饥饿”状态,开始下载行为,随着下载的次数增多,写一篇高质量论文所需知信逐渐减少,直到所需知信得到满足,才停止下载行为。以上实证分析说明下载行为具有非均匀性和有限性,要求满足价值的行为具有非均匀性和有限性,此类价值称为非保持价值。

基于上述实证分析可得如下结论:基于保持价值驱动的人类行为时间间隔分布比较匀值,没有长时间的间隔,尾部下降趋势适用于指数函数;基于非保持价值驱动的人类行为时间间隔服从幂律分布;时间自由支配权是影响人们行为的实际因素,改变行为的间隔时间分布规律。

4 基于价值驱动的人类行为动力学建模研究 4.1 模型描述

根据实证分析研究结果,提出了一个基于价值驱动的人类行为动力学模型,该模型由基于保持价值驱动的人类行为动力学模型和基于非保持价值驱动的人类行为动力学模型构成。

对保持价值的人类行为动力学现象刻画为模型1:1) 在不相重叠的时间区间内行为(事件)发生的次数是相互独立的;2) 行为发生率与行为的时间间隔阈值有关,即当vtc时,在时刻t行为的发生率为λ=b,当vtc时,在时刻t行为的发生率为λ=c,其中,bc>0,tc为时间间隔阈值,v为时间长度(即v为从tt前最接近一个点事件的间距);3) 在tt+dt之间行为发生一次的概率为λdt,短时间dt内行为几乎不会发生两次以上。

对非保持价值的人类行为动力学现象刻画为模型2:1) 在不相重叠的时间区间内行为发生的次数是相互独立的;2) 行为发生率随关联行为所花的时间线性递减,即在时刻t行为的发生率为λ(t)=c/(d(t-a+b)+1),其中,a为时刻t前最接近一个行为(事件)发生的时间,(t-a)为关联行为已花的时间(即从tt前最接近一个点行为(事件)的间距),b为关联行为还要花的时间,(t-a+b)为关联行为所花的时间,a≥0,b≥0,c>0,d>0,时刻t=0时,a=b=0;3) 在tt+dt之间行为发生一次的概率为λ(t)dt,短时间dt内行为几乎不会发生两次以上。

4.2 理论证明

根据齐次Poisson过程、非齐次Poisson过程的定义和文献[6]可得,模型1是强度分别为λ=bλ=c的两个齐次Poisson过程,模型2是强度为λ(t)的非齐次Poisson过程。

对模型2进行理论证明前先引入两个引理:

引理 1[6] 设{N(t),t≥0}为具有强度函数λ(t)的非齐次Poisson过程,对于任意给定的正整数nr,过程的n个点发生时间Sr+1, Sr+2, …, Sr+n 的联合分布密度函数为:

$\begin{array}{l} \;\;\;\;\;\;\;{f_{{S_{r + 1}},{S_{r + 2}}, \cdots ,{S_{r + n}}}}({t_{r + 1}},{t_{r + 2}}, \cdot \cdot \cdot ,{t_{r + n}}) = \\ \left\{ \begin{array}{l} \left( {\prod\limits_{i = 1}^n {\lambda ({t_{r + i}})} } \right)\exp \left\{ { - \int_{{\rm{ }}0}^{{\rm{ }}t + n} {\lambda (x){\rm{d}}x} } \right\}\\ \frac{1}{{r!}}{\left( {\int_{{\rm{ }}0}^{{\rm{ }}t + 1} {\lambda (x){\rm{d}}x} } \right)^r}{\rm{ }}0 < {t_{r + 1}} \le \cdot \cdot \cdot \le {t_{r + n}}\\ \\ 0\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;其他情形 \end{array} \right. \end{array}$

引理 2[6] 设{N(t),t≥0}为具有强度函数λ(t)的非齐次Poisson过程,对于任意给定的正整数n,过程的n个点发生时间为S1, S2,…, Sn,第n+1个事件与第n个事件之间的时间间隔Tn+1的条件分布函数为:

$\begin{array}{c} P\left\{ {{T_{n + 1}} \le t\left| {{S_n} = {x_n}, \cdot \cdot \cdot ,{S_1} = {x_1}} \right.} \right\} = \\ 1 - \exp \left\{ { - \int_{{\rm{ }}{x_n}}^{{\rm{ }}{x_n} + t} {\lambda (u)} {\rm{d}}u} \right\} \end{array} $

由引理1和2,有:

$ \begin{array}{c} P\left\{ {{T_{n + 1}} > t} \right\} = \\ \int { \cdot \cdot \cdot \int {P\left\{ {{T_{n + 1}} > t\left| {{S_n} = {x_n}, \cdot \cdot \cdot ,{S_1} = {x_1}} \right.} \right\}} } \\ {f_{{s_1},{s_2}, \cdot \cdot \cdot ,{s_n}}}({x_1},{x_2}, \cdot \cdot \cdot ,{x_n}){\rm{d}}{x_1}{\rm{d}}{x_2} \cdot \cdot \cdot {\rm{d}}{x_n} = \\ \int_{{\rm{ }}0}^{{\rm{ }}\infty } {{\rm{d}}{x_n}} \int_{{\rm{ }}0}^{{\rm{ }}{x_n}} {{\rm{d}}{x_{n - 1}}} \int_{{\rm{ }}0}^{{\rm{ }}{x_{n - 1}}} {{\rm{d}}{x_{n - 2}}} \cdot \cdot \cdot \int_{{\rm{ }}0}^{{\rm{ }}{x_3}} {{\rm{d}}{x_2}} \int_{{\rm{ }}0}^{{\rm{ }}{x_2}} {\exp } \\ \left\{ { - \int_{{\rm{ }}0}^{{\rm{ }}x{}_n + t} {\lambda (u){\rm{d}}u} } \right\}\prod\limits_{i = 1}^n {\lambda ({x_i})} {\rm{d}}{x_1} = \frac{{{c^n}}}{{{d^n}(n - 1)!}} \times \\ \int_{{\rm{ }}0}^{{\rm{ }}\infty } {\frac{{{{\ln }^{n - 1}}(d(x - a + b) + 1)}}{{{{(d(t + b) + 1)}^{\frac{c}{d}}}(d(x - a + b) + 1)}}} {\rm{d}}x \end{array} $

令 $ \ln (d(x - a + b) + 1) = y$,得到时间间隔Tn+1的分布函数为:

$ \begin{array}{c} {F_{{T_{n + 1}}}}(t) = P({T_{n + 1}} \le t) = 1 - P\{ {T_{n + 1}} > t\} = \\ 1 - \frac{{{c^n}}}{{{d^{n - 1}}(n - 1)!}}\int_{{\rm{ }}0}^{{\rm{ }}\infty } {\frac{{{y^{n - 1}}}}{{{{(d(t + b) + 1)}^{\frac{c}{d}}}}}} {\rm{d}}y \end{array} $ (1)

对式(1)两边求导,得到时间间隔Tn+1的密度函数为:

$ {f_{{T_{n + 1}}}}(t) = \frac{{{c^{n + 1}}}}{{{d^n}(n - 1)!}}\int_{{\rm{ }}0}^{{\rm{ }}\infty } {\frac{{{y^{n - 1}}}}{{{{(d(t + b) + 1)}^{\frac{c}{d} + 1}}}}} {\rm{d}}y $ (2)

T充分大时,有:

$ {f_{{T_{n + 1}}}}(t) \approx \frac{{{c^{n + 1}}}}{{{d^n}(n - 1)!}}\int_{{\rm{ }}0}^{{\rm{ }}T} {\frac{{{y^{n - 1}}}}{{{{(d(t + b) + 1)}^{\frac{c}{d} + 1}}}}} {\rm{d}}y $ (3)
$ {f_{{T_{n + 1}}}} \approx \frac{{{c^{n + 1}}{T^n}}}{{{d^n}n!}} \times \frac{1}{{{{(d(t + b) + 1)}^{\frac{c}{d} + 1}}}} $ (4)

由式(4)可见,时间间隔Tn+1的密度函数是幂指数为 $ \gamma = \frac{c}{d} + 1$的幂律分布,因为d>0、c>0,故幂指数范围区间为(l,∞)。此理论结果与论文下载的实证数据得到的结果是吻合,验证了模型2的适用性。

模型1理论证明。

对时间长度大于或等于tc的时间间隔,时间间隔Tn+1的分布函数为:

$F(t) = 1 - {{\rm{e}}^{ - ct}}\begin{array}{*{20}{c}} {}&{v \ge {t_c}} \end{array} $ (5)

时间间隔Tn+1的分布函数为指数分布,此理论结果与健身运动行为的实证数据得到的结果是吻合,也验证了模型1的适用性。

5 结 束 语

本文对基于价值驱动的健身运动和论文下载行为进行了实证研究,研究结果显示:基于保持价值的时间间隔分布比较匀值,没有长时间的间隔,尾部下降趋势适用于指数函数;基于非保持价值驱动的人类行为时间间隔服从幂律分布;时间自由支配权是影响人们行为的实际因素,改变行为的间隔时间分布规律。实证分析发现:时间间隔服从幂律分布的行为具有横切性,行为的横切性(行为间的关联性)是否是幂律时间间隔分布产生的充分条件(根源)还有待今后进一步实证和理论证明。学者们一直在探寻幂律时间间隔分布产生的根源,至今无果。

本文根据实证分析研究结果,提出了一个基于价值驱动的人类行为动力学模型,理论预测和实证结果相吻合。未来将开展模型在电子商务,基于互联网计算背景下的需求工程等领域应用研究工作。

参考文献
[1] 周涛,韩筱璞,闫小勇,等.人类行为时空特性的统计力学[J].电子科技大学学报, 2013, 42(2): 481-540. ZHOU Tao, HAN Xiao-pu, YAN Xiao-yong, et al. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(2): 481-540.
[2] BARABÁSI A L. The origin of bursts and heavy tails in human dynamics[J]. Nature, 2005, 435(7039): 207-211.
[3] VAZQUEZ A. Impact of memory on human dynamics[J]. Physica A, 2007(373): 747-752.
[4] HAN Xiao-pu, ZHOU Tao, WANG Bing-hong. Modeling human dynamics with adaptive interest[J]. New J Phys, 2008, 10(7): 073010.
[5] SHANG Ming-sheng, CHEN Guan-xiong, DAI Shuang-xing, et al. Interest-driven model for human dynamics[J]. Chin Phys Lett, 2010, 27(4): 048701.
[6] 郭进利.博客评论的人类行为动力学实证研宄和建模[J].计算机应用研究, 2011, 28(4): 1422-1424. GUO Jin-li. Empirical study and modeling of human behaviour dynamics of comments on Blog posts[J]. Application Research of Computers, 2011, 28(4): 1422-1424.
[7] 焦玉,刘衍珩,王健,等.基于习惯的人类动力学建模[J].科学通报, 2010, 55(11): 1070-1076. JAO Yu, LIU Yan-hang, WANG Jian, et al. Model for human dynamics based on habit[J]. Chinese Sci Bull, 2010, 55(11): 1070-1076.
[8] 王立,瞿少成,马涛.健身运动模式中的人类动力学统计研究[J].华中师范大学学报(自然科学版), 2011, 45(2): 227-231. WANG Ii, QU Shao-cheng, MA Tao. The statistical study of human dynamics in exercise mode[J]. Journal of Huazhong Normal University(Natural Science), 2011, 45(2): 227-231.
[9] YAN Qiang, YI Lan-li, WU Lian-ren. Human dynamic model co-driven by interest and social identity in the MicroBlog community[J]. Physica A, 2012 (391): 1540-1545.
[10] WANG Peng, ZHOU Tao, HAN Xiao-pu, et al. Modeling correlated human dynamics with temporal preference[J]. Physica A, 2014(398): 145-151.
[11] ZHANG Li-jiang, LIU Zi-xian, GUO Jin-li. Empirical analysis of scaling and fractal characteristics of outpatients[J]. Physics Letters A, 2014(378): 627-634.
[12] GAO Lei, GUO Jin-li, FAN Chao, et al. Individual and group dynamics in purchasing activity[J]. Physica A, 2013(392): 343-349.
[13] ZHAO Zhi-dan, ZHOU Tao. Empirical analysis of online human dynamics[J]. Physica A, 2012, 391(11): 3308-3315.