留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于抖音平台的在线短视频流行度建模研究

钟志豪 肖井华 吴晔 王笑尘

钟志豪, 肖井华, 吴晔, 王笑尘. 基于抖音平台的在线短视频流行度建模研究[J]. 电子科技大学学报, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
引用本文: 钟志豪, 肖井华, 吴晔, 王笑尘. 基于抖音平台的在线短视频流行度建模研究[J]. 电子科技大学学报, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
ZHONG Zhihao, XIAO Jinghua, WU Ye, WANG Xiaochen. Modeling Dynamics of Online Short Video Popularity Based on Douyin Platform[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
Citation: ZHONG Zhihao, XIAO Jinghua, WU Ye, WANG Xiaochen. Modeling Dynamics of Online Short Video Popularity Based on Douyin Platform[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035

基于抖音平台的在线短视频流行度建模研究

doi: 10.12178/1001-0548.2021035
基金项目: 中国博士后科学基金(2020M670233);国家重点研发计划(2020YFF0305300)
详细信息
    作者简介:

    钟志豪(1995-),男,主要从事数据处理等方面的研究

    通讯作者: 王笑尘,E-mail:xiaochen912312@163.com
  • 中图分类号: TP391; O41

Modeling Dynamics of Online Short Video Popularity Based on Douyin Platform

  • 摘要: 该文分析了“抖音”短视频平台上近1 000条短视频播放量的演变模式,由统计规律发现短视频的播放量累计曲线存在两种时变模式——单梯度和多梯度传播模式;为进一步探究不同传播模式产生的原因,该文分析了用户点赞行为和评论情感倾向与播放量的相关性,发现用户的点赞行为会带来短视频进一步的传播,且负向情感评论比例越高,播放量越大。最后,该文基于平台推荐观看和用户粉丝观看这两个主要传播途径,结合点赞促进传播这一特征,构建了在线短视频的点赞−传播动力学模型,复现了实际数据的短视频流行模式,并进一步借助模型探索了不同参数对累计播放量演变趋势的影响,从而揭示了在线短视频的传播机制。研究结果为更有效地促进或控制信息传播提供了理论支撑。
  • 图  1  抖音平台推荐过程示例图

    图  2  短视频累计播放量的两个典型传播模式

    图  3  评论情感与播放量的相关性

    图  4  点赞量与播放量的净作用强度$T_{X,Y}^S$分布

    图  5  短视频进入下一推荐阶段的过程

    图  6  模型拟合结果

    图  7  点赞率ω对视频流行度模式的影响

    图  8  粉丝吸引率α对视频传播的影响

    表  1  每隔5 min所采集的某个短视频相关数据的示例

    视频ID评论量/条点赞量/次播放量/次时间
    6758664619243490567211 12635 00011/13 17:41
    6758664619243490567352 29756 00011/13 17:46
    6758664619243490567443 60378 00011/13 17:53
    6758664619243490567724 84196 00011/13 18:10
    下载: 导出CSV

    表  2  某短视频评论的情感分析结果示例

    评论内容正向概率负向概率置信度分类
    这车还能卖出来,没谁了0.097 0170.902 9830.784 400
    现在的车商套路太深了0.012 7760.987 2240.971 610
    小莉姐你真辛苦支持你0.999 8330.000 1670.999 622
    下载: 导出CSV

    表  3  斯皮尔曼相关性分析

    变量播放量点赞率
    正向情感强度−0.140**
    负向情感强度0.143**
    点赞量0.937**
    评论量0.759**
    转发量0.687**
    正向情感组0.343**
    负向情感组0.260*
      **为在p<0.01级别上显著 *为在p<0.05级别上显著
    下载: 导出CSV
  • [1] 谢盼盼. 融媒时代文化类节目针对青年受众的创新及价值传播探讨[J]. 重庆邮电大学学报(社会科学版), 2020, 32(6): 157-164.

    XIE P P. Discussion on content innovation and value communication of cultural programs aimed at young audiences in the era of media convergence[J]. Journal of Chongqing University of Posts and Telecommunications (Social Science Edition), 2020, 32(6): 157-164.
    [2] SENSOR T. TikTok crosses 2 billion downloads after best quarter for any app ever[EB/OL]. (2020-04-29). https://sensortower.com/blog/tiktok-downloads-2-billion.
    [3] 李永宁, 吴晔, 杨濮宇, 等. 内容为王: 社交短视频平台的知识传播机制研究[J]. 新闻与写作, 2019(6): 23-32. doi:  10.3969/j.issn.1002-2295.2019.06.006

    LI Y N, WU Y, YANG P Y, et al. Research on the knowledge dissemination mechanism of social short video platform[J]. News and Writing, 2019(6): 23-32. doi:  10.3969/j.issn.1002-2295.2019.06.006
    [4] ZHANG Z K, LIU C, ZHAN X X, et al. Dynamics of information diffusion and its applications on complex networks[J]. Physics Reports, 2016, 651: 1-34. doi:  10.1016/j.physrep.2016.07.002
    [5] DONG S, FAN F H, HUANG Y C. Studies on the population dynamics of a rumor-spreading model in online social networks[J]. Physica A: Statistical Mechanics and its Applications, 2018, 492: 10-20. doi:  10.1016/j.physa.2017.09.077
    [6] GRUHL D F, GUHA R V, LIBEN-NOWELL D, et al. Information diffusion through blogspace[C]//Proceedings of the 13th International Conference on World Wide Web. New York: [s.n.], 2004: 491-501.
    [7] ABDULLAH S, WU X. An epidemic model for news spreading on Twitter[C]//IEEE International Conference on Tools with Artificial Intelligence. Boca Raton: ICTAI, 2011: 163-169.
    [8] ZHAO L, CUI H, QIU X, et al. SIR rumor spreading model in the new media age[J]. Physica A: Statistical Mechanics and its Applications, 2013, 392(4): 995-1003. doi:  10.1016/j.physa.2012.09.030
    [9] MATSUBARA Y, SAKURAI Y, PRAKASH B A, et al. Faloutsos, rise and fall patterns of information diffusion: Model and implications[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2012: 6-14.
    [10] YANG J, LESKOVEC J. Patterns of temporal variation in online media[C]//Proceedings of the 4th International Conference on Web Search and Web Data Mining. Hong Kong, China: WSDM, 2011: 177-186.
    [11] WU J, ZHOU Y, CHIU D M, et al. Modeling dynamics of online video popularity[J]. IEEE Transactions on Multimedia, 2016, 18(9): 1882-1895. doi:  10.1109/TMM.2016.2579600
    [12] LI H, WANG H, LIU J, et al. Video sharing in online social networks: Measurement and analysis[C]//Proceedings of the 22nd International Workshop on Network and Operating System Support for Digital Audio and Video. New York: ACM, 2012: 83-88.
    [13] ZHOU R, KHEMMARAT S, GAO L, et al. Boosting video popularity through recommendation systems[C]//Proceedings of the 1st ACM SIGMOD Workshop on Databases and Social Networks. Athens: ACM, 2011: 13-18.
    [14] ZHOU Y, WU J, CHAN T H, et al. Interpreting video recommendation mechanisms by mining view count traces[J]. IEEE Transactions on Multimedia, 2018, 20(8): 2153-2165. doi:  10.1109/TMM.2017.2781364
    [15] 王霞, 梁栋. 弹幕数量和弹幕情感强度对视频流行度的影响[J]. 营销科学学报, 2019, 15(2): 132-156.

    WANG X, LIANG D. The impact of danmuku volume and danmuku emotional intensity on video popularity[J]. Journal of Marketing Science, 2019, 15(2): 132-156.
    [16] MUCHNIK L, ARAL S, TAYLOR S J. Social influence bias: A randomized experiment.[J]. Science, 2013, 341(6146): 647-651. doi:  10.1126/science.1240466
    [17] DING W, SHANG Y, GUO L, et al. Video popularity prediction by sentiment propagation via implicit network[C]//Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. Melbourne: CIKM, 2015: 1621-1630.
    [18] VOSOUGHI S, ROY D, ARAL S. The spread of true and false news online[J]. Science, 2018, 359(6380): 1146-1151. doi:  10.1126/science.aap9559
    [19] 赵辰玮, 刘韬, 都海虹. 算法视域下抖音短视频平台视频推荐模式研究[J]. 出版广角, 2019(18): 76-78.

    ZHAO C W, LIU T, DU H H. Research on video recommendation mode of tiktok short video platform under algorithm view[J]. View on Publishing, 2019(18): 76-78.
    [20] 梁晨. 弹幕与评论对网络视频流行度的影响差异研究[D]. 北京: 北京邮电大学, 2019.

    LIANG C. Research on the different influence of danmuku and comment on internet video popularity[D]. Beijing: Beijing University of Posts and Telecommunications, 2019.
    [21] BORGE-HOLTHOEFER J, PERRA N, GONCALVES B, et al. The dynamics of information-driven coordination phenomena: A transfer entropy analysis[J]. Science Advances, 2016, 2(4): e1501158. doi:  10.1126/sciadv.1501158
  • [1] 郭志成, 刘影, 陈钰书, 唐明.  复杂网络上具有自适应行为的故障-恢复传播动力学研究 . 电子科技大学学报, 2024, 53(): 1-9. doi: 10.12178/1001-0548.2023080
    [2] 刘益安, 马瑞辰, 李国, 于奇, 刘洋, 胡绍刚.  负阻态忆阻Hopfield神经网络动力学 . 电子科技大学学报, 2023, 52(1): 38-43. doi: 10.12178/1001-0548.2022294
    [3] 张典, 王洁宁, 李昭颖, 刘润楠, 郑文.  基于BVANet的财经新闻情感分析 . 电子科技大学学报, 2023, 52(2): 263-270. doi: 10.12178/1001-0548.2022058
    [4] 贾春晓, 李明, 刘润然.  多层复杂网络上的渗流与级联失效动力学 . 电子科技大学学报, 2022, 51(1): 148-160. doi: 10.12178/1001-0548.2021184
    [5] 郑文, 赵偲, 李泽堃, 武啸泽, 胡涛.  基于Web数据挖掘的COVID-19流行病学特征分析 . 电子科技大学学报, 2020, 49(3): 408-414. doi: 10.12178/1001-0548.2020079
    [6] 谢梅, 周涛.  中国学前教育水平的区域差异以及时空格局演变分析 . 电子科技大学学报, 2020, 1(1): 1-6. doi: 10.12178/1001-0548.2022226
    [7] 林自展, 肖井华, 周金连, 吴晔.  基于观点动力学的在线点评研究 . 电子科技大学学报, 2020, 49(1): 155-160. doi: 10.12178/1001-0548.2018320
    [8] 刘慧超, 王志君, 梁利平.  融合视频编码的低复杂度纹理自适应视频加密算法 . 电子科技大学学报, 2020, 49(5): 700-708. doi: 10.12178/1001-0548.2019291
    [9] 梁凯豪, 张文峰, 张小花, 吴卓葵, 刘芹, 张超龙, 李梓龙.  冠状病毒SARS-CoV-2、SARS-CoV和MERS-CoV的传染动力学分析 . 电子科技大学学报, 2020, 49(3): 349-356. doi: 10.12178/1001-0548.2020067
    [10] 阚佳倩, 马闯, 张海峰.  警觉与疾病的传播次序性对动力学的影响 . 电子科技大学学报, 2020, 49(3): 431-437. doi: 10.12178/1001-0548.2019163
    [11] 乔晓华, 徐毅, 孙玉霞, 武花干.  忆阻超混沌Lü系统的隐藏动力学特性研究 . 电子科技大学学报, 2018, 47(3): 402-409. doi: 10.3969/j.issn.1001-0548.2018.03.013
    [12] 许悦雷, 吕超, 马时平, 李帅, 邹洪中, 张文达, 辛鹏.  仿视皮层机制的随机点视频序列运动特征提取 . 电子科技大学学报, 2017, 46(4): 630-635. doi: 10.3969/j.issn.1001-0548.2017.04.025
    [13] 楼凤丹, 周银座, 庄晓丹, 张新荣.  时效网络结构及动力学研究进展综述 . 电子科技大学学报, 2017, 46(1): 109-125. doi: 10.3969/j.issn.1001-0548.2017.01.017
    [14] 周群, 徐懿, 张金保, 宁佳, 曾雪洋.  I2控制Buck变换器的一阶动力学分析 . 电子科技大学学报, 2016, 45(3): 387-392. doi: 10.3969/j.issn.1001-0548.2016.02.013
    [15] 王伟, 舒盼盼, 唐明, 高辉.  网络传播动力学模拟方法评述 . 电子科技大学学报, 2016, 45(2): 288-294.
    [16] 符丁, 李明江, 黎路.  基于价值驱动的人类行为动力学实证研究和建模 . 电子科技大学学报, 2015, 44(5): 652-656. doi: 10.3969/j.issn.1001-0548.2015.05.002
    [17] 荣智海, 吴枝喜, 王文旭.  共演博弈下网络合作动力学研究进展 . 电子科技大学学报, 2013, 42(1): 10-22. doi: 10.3969/j.issn.1001-0548.2013.01.005
    [18] 肖强, 曹荣, MORIYAMA T, 范欣, 文岐业, 张怀武.  自旋器件中的自旋动力学:微波领域应用的新兴科学 . 电子科技大学学报, 2009, 38(5): 505-523. doi: 10.3969/j.issn.1001-0548.2009.05.004
    [19] 王昱青, 陈华富, 尧德中.  一种扩展的功能磁共振BOLD动力学模型研究 . 电子科技大学学报, 2007, 36(2): 291-293.
    [20] 徐红兵, 吕炳朝, 陈光.  一类非线性动力学系统的变结构混沌控制 . 电子科技大学学报, 1999, 28(3): 283-285.
  • 加载中
图(10) / 表(3)
计量
  • 文章访问数:  5271
  • HTML全文浏览量:  2163
  • PDF下载量:  70
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-02-04
  • 修回日期:  2021-05-20
  • 网络出版日期:  2021-09-28
  • 刊出日期:  2021-09-28

基于抖音平台的在线短视频流行度建模研究

doi: 10.12178/1001-0548.2021035
    基金项目:  中国博士后科学基金(2020M670233);国家重点研发计划(2020YFF0305300)
    作者简介:

    钟志豪(1995-),男,主要从事数据处理等方面的研究

    通讯作者: 王笑尘,E-mail:xiaochen912312@163.com
  • 中图分类号: TP391; O41

摘要: 该文分析了“抖音”短视频平台上近1 000条短视频播放量的演变模式,由统计规律发现短视频的播放量累计曲线存在两种时变模式——单梯度和多梯度传播模式;为进一步探究不同传播模式产生的原因,该文分析了用户点赞行为和评论情感倾向与播放量的相关性,发现用户的点赞行为会带来短视频进一步的传播,且负向情感评论比例越高,播放量越大。最后,该文基于平台推荐观看和用户粉丝观看这两个主要传播途径,结合点赞促进传播这一特征,构建了在线短视频的点赞−传播动力学模型,复现了实际数据的短视频流行模式,并进一步借助模型探索了不同参数对累计播放量演变趋势的影响,从而揭示了在线短视频的传播机制。研究结果为更有效地促进或控制信息传播提供了理论支撑。

English Abstract

钟志豪, 肖井华, 吴晔, 王笑尘. 基于抖音平台的在线短视频流行度建模研究[J]. 电子科技大学学报, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
引用本文: 钟志豪, 肖井华, 吴晔, 王笑尘. 基于抖音平台的在线短视频流行度建模研究[J]. 电子科技大学学报, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
ZHONG Zhihao, XIAO Jinghua, WU Ye, WANG Xiaochen. Modeling Dynamics of Online Short Video Popularity Based on Douyin Platform[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
Citation: ZHONG Zhihao, XIAO Jinghua, WU Ye, WANG Xiaochen. Modeling Dynamics of Online Short Video Popularity Based on Douyin Platform[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(5): 774-781. doi: 10.12178/1001-0548.2021035
  • 随着新媒体技术的快速发展,社会信息传播形式由文本信息为主转变为文本、视频多模态传播。当前,15秒短视频更符合大众“碎片化”的时间管理习惯,已成为网络视频传播的主要方式之一。截至2020年3月,中国短视频用户规模达7.73亿,占网络视频用户的85.6%[1]。截至2020年第一季度,短视频平台“抖音”(Tik Tok)在全球范围内的累计总下载量突破20亿次[2]。可见,短视频用户量日益攀升,呈现出蓬勃发展的态势。

    短视频传播具有诸多新特点,如传播以推荐机制为主、传播速度快、传播效果由视频的内容所决定以及弱化了用户身份和等级的影响[3]。这些特点使得短视频传播流行度的演变机制不同于传统视频,且在系统的推动下传播规模更大。因此,研究短视频的传播规律有助于揭示短视频传播过程中流行度的演变机制,从而更有效地控制信息传播。

    目前针对网络信息传播的研究主要集中在文本信息的传播规律上,借助经典的传染病传播模型研究社交网络中的信息传播过程[4]。如文献[5]基于SIR (susceptible infected recovered)模型构建了在线社交网络谣言传播的动力学模型;文献[6-8]利用经典SIR或SIS (susceptible infacted susceptible)模型研究社交网络中的信息传播过程。在信息传播时变模式的分析方面,文献[9]提出一种Spike-M模型来研究一条新闻信息在传播过程中受欢迎程度的上升和下降模式,为实际数据中出现的多种时变模式提供了一个统一的模型框架。文献[10]研究了在线内容的多种时间模式,以及内容的受欢迎程度如何随着时间的推移而增长或消退。

    针对视频传播的研究主要集中在探索口口相传及首页推荐对视频传播的综合影响,并通过构建相应的视频传播模型来揭示视频流行度的演化模式。文献[11]根据腾讯视频的数据,综合考虑了口口相传以及首页推荐这两个传播途径,建立了视频传播的动力学模型。文献[12]根据人人网数据,专注于研究视频受欢迎度的分布和演变,并建立了一个简单模型来模拟在线社交网络中视频的用户请求过程。文献[13]基于一个由用户浏览行为形成的视图传播模型来探究如何通过YOUTUBE的推荐系统来提升人气,探索视频之间是如何相互影响的。文献[14]通过视图计数跟踪的方法对视频的推荐系统进行研究,提出了一个基于扩展流行模型的框架,通过拟合所采集的腾讯视频的视频浏览计数追踪数据,量化和解释了直接推荐和口碑推荐这两种推荐机制。

    此外,研究表明用户情感会影响信息传播的过程[15-18],但此类研究主要还集中于文本信息传播及长视频传播中。

    可见,目前针对短视频传播的研究还很缺乏,尤其是用户行为如何影响短视频传播仍然未知,而该问题对揭示短视频传播规律至关重要。因此,本文分析了在线短视频的传播模式,并探索用户点赞行为和评论与短视频播放量的相关性。此外,本文基于短视频的传播特征和已有的视频传播模型,构建了在线短视频的点赞−传播动力学模型,并借助模型探索不同参数对短视频播放量演变趋势的影响。

    • 本文选择抖音短视频平台作为研究对象。为了探索在线短视频的大规模传播机制,本文选择了9个粉丝量在一千万以上的活跃用户(包括新华社、人民日报、河南广播电视台民生频道、中国日报、浙有正能量、央视新闻、解放军新闻传播中心融媒体、中国长安网、中国青年报)所发布的短视频进行研究。视频内容主要涉及新闻领域。对这9个活跃用户的账号进行监测,每隔5 min采集其所发布短视频的评论量、点赞量及播放量,最终得到这9个活跃用户在2019年11月11日−12月8日期间发布的短视频数据。其中,针对每个短视频,采集的数据示例如表1所示。

      表 1  每隔5 min所采集的某个短视频相关数据的示例

      视频ID评论量/条点赞量/次播放量/次时间
      6758664619243490567211 12635 00011/13 17:41
      6758664619243490567352 29756 00011/13 17:46
      6758664619243490567443 60378 00011/13 17:53
      6758664619243490567724 84196 00011/13 18:10

      此外,为了研究用户的评论情感倾向对短视频播放量的影响,本文也采集了所监控短视频的评论数据,每一条评论数据由评论用户ID、用户性别、评论时间和评论内容所组成。

    • 本文所研究的抖音平台中,短视频的传播基于“流量池”的叠加推荐算法,即在流量池中表现较好的短视频会进入叠加推荐的行列,从而能够获得更多的播放量和点赞量[19]图1展示了抖音平台对短视频进行推荐的全过程。由于每个短视频在流量池推荐算法中被推荐的次数不同,导致短视频之间的流行度演化模式存在一定差异。接下来将基于抖音平台的实际数据对短视频传播过程中的流行度演化模式进行研究。

      通过对实际数据的研究,本文发现抖音平台中短视频的播放量累计曲线存在多种时变模式。根据曲线斜率的变化情况,将时变模式粗略分为两类:1)仅存在单次长时间缓慢增长——先是快速增长,之后伴随一个长时间的缓慢增长阶段,称作单梯度曲线(图2a);2)存在多个长时间缓慢增长的阶段,称为多梯度曲线(图2b)。经过统计分析,两类曲线在整个数据集中的占比分别为88%和10.5%。

      图  1  抖音平台推荐过程示例图

      图  2  短视频累计播放量的两个典型传播模式

      不同的播放量累计时变模式的产生主要由抖音平台的推荐机制所致。由于不同短视频被推荐的次数以及在流量池中达到再推荐的过程的差异性使得存在多种时变模式,本文将分别说明不同时变模式的特点及其产生的原因。

      1)单梯度播放量累计曲线

      对于单梯度播放量累计曲线,本文对其局部增长模式进行了研究。图2a为用户“人民日报”于2019年11月28日发布的某条视频,播放量达到3千万以上,方框内为时间取值范围[8 500,11 500]的累计播放量的局部曲线。发现其局部增长曲线也存在多次快速增长的情况,这说明系统也对单梯度曲线进行了多次推荐,但由于其在较短时间内就达到了系统再次推荐的标准,因此整体曲线仅呈现出一个较长时间的缓慢增长阶段。

      2)多梯度播放量累计曲线

      图2b为用户“新华社”于2019年11月12日发布的某条视频,播放量达到160万以上。发现多梯度播放量累计曲线在传播过程中存在需要一定时间的积累才可达到进入下一推荐流量池要求的过程,所以存在多次长时间缓慢增长的阶段,因此整体曲线呈现出多个梯度叠加的增长趋势。

    • 本文采用百度AI开放平台[20]中基于情感词典的情感分析方法对评论数据进行情感分析。针对短视频的每一条评论,该方法可给出评论情感所属正负倾向的概率以及分类结果。模型根据得到的正负倾向概率的相对大小,对评论情感进行分类。基于百度AI平台判定的某个短视频评论的情感倾向示例如表2所示。其中,分类结果中0表示负向情感,1表示中性,2表示正向情感。

      表 2  某短视频评论的情感分析结果示例

      评论内容正向概率负向概率置信度分类
      这车还能卖出来,没谁了0.097 0170.902 9830.784 400
      现在的车商套路太深了0.012 7760.987 2240.971 610
      小莉姐你真辛苦支持你0.999 8330.000 1670.999 622
    • 为了直观表示解释变量与被解释变量的依存关系及方向,本文利用SPSS中的斯皮尔曼双变量双边简单相关系数对变量间的相关关系进行测量。

      在本文中,正向(负向)情感强度指,单个视频中带有正向(负向)情感的评论在该视频全部评论中的占比。首先,本文以监测的所有短视频为研究对象,分析其播放量与评论情感强度的相关性,发现两者在0.01级别上显著相关,如表3所示;播放量与正向情感强度呈负相关(相关系数−0.140),与负向情感强度呈正相关(相关系数0.143),即负向情感评论占比高的短视频播放量也会相对较高。

      表 3  斯皮尔曼相关性分析

      变量播放量点赞率
      正向情感强度−0.140**
      负向情感强度0.143**
      点赞量0.937**
      评论量0.759**
      转发量0.687**
      正向情感组0.343**
      负向情感组0.260*
        **为在p<0.01级别上显著 *为在p<0.05级别上显著

      进一步,分别分析了每个活跃用户所发布的短视频的播放量和情感强度的相关性,9个活跃用户的相关系数分布如图3所示。发现对于不同的视频发布用户,评论情感强度与播放量的相关系数差异较大,其与用户偏向性有关。根据短视频的内容进行划分,以用户发布视频中正向视频的占比作为用户偏向性。以用户“人民日报”为例,用户偏向性为93%,负向评论情感与播放量相关系数为0.080,反之,“新华社”的用户偏向性为77%,负向评论情感与播放量相关系数为0.25。即用户偏向性高时,整体的正向评论占比高,所发布的短视频之间评论差异性低,导致评论情感与播放量的相关系数小。

      图  3  评论情感与播放量的相关性

      因此,对短视频评论进行情感分析发现,播放量与评论情感显著相关且相关系数受用户偏向性影响。其中,对于倾向于发布正能量的用户,评论情感强度与播放量的相关性较小,反之,对于倾向于发布易引发负向情感的用户,两者相关性较大,且评论负向情感强度大的短视频播放量也会相对大。

    • 本文分析了点赞量、评论量、转发量与播放量的相关性,发现相比于评论量、转发量(见表3),点赞量与播放量呈强正相关(相关系数0.937)。

      为进一步探索两者之间的关系,本文借助传输熵[21],研究了点赞量与播放量的相互作用。对于两个时间序列XYXY的作用可利用传输熵计算如下:

      $${T_{X,Y}} = \sum {p({{\hat y}_{i + \delta }},{{\hat y}_i},{{\hat x}_i}){{\log }_2}\left(\frac{{p({{\hat y}_{i + \delta }}|{{\hat y}_i},{{\hat x}_i})}}{{p({{\hat y}_{i + \delta }}|{{\hat y}_i})}}\right)} $$ (1)

      式中,${\hat x_i}$${\hat y_i}$分别表示对XY符号化后的序列中的第i个元素,具体符号化过程可参考文献[21]。如果TX,Y>0,说明XY之间存在相互作用关系,若TX,Y=0说明XY可视为不相关的。基于此,XY的净作用强度可表示为:

      $$T_{X,Y}^S = {T_{X,Y}} - {T_{Y,X}}$$ (2)

      如果XY的净作用强度的结果为正值,则说明序列X驱动序列Y;结果为负值,则Y处于驱动位置。

      基于短视频数据集,以每个短视频的点赞量时间序列X和播放量时间序列Y作为研究对象。利用式(1)计算后,发现TX,Y>0,说明点赞量和播放量之间存在相互作用关系。经过分析点赞量对播放量的净作用强度分布如图4所示,其中X表示点赞量时间序列,Y表示播放量时间序列,$T_{X,Y}^S$>0表示以X作为驱动因素,即点赞量驱动播放量。发现点赞量驱动播放量的短视频占比约为70%,即大部分情况下,点赞量对于播放量是处于驱动地位的。

      图  4  点赞量与播放量的净作用强度$T_{X,Y}^S$分布

    • 此外,本文分析了评论情感与点赞率的相关性。在分析评论情感与点赞率的相关性中,情感强度越大,则表征评论情感偏向越明显。因此,选取数据集中评论情感偏向性大的数据进行分组,以情感强度0.6作为阈值,将负向情感强度0.6以上以及正向情感强度0.6以上的短视频分为两组。分别对这两个数据集中短视频的点赞率和情感强度进行分析,发现对于负向情感组,点赞率和负向情感强度之间的相关系数为0.260;对于正向情感组,点赞率和正向情感之间的相关系数为0.343。可见,评论情感强度与点赞率之间存在显著相关关系(见表3)。

      因此,基于点赞量对播放量的驱动特征,考虑将点赞率引入短视频传播模型的构建中;与此同时,基于点赞率与评论情感的相关性,通过引入点赞率,也可以间接反映情感倾向对播放量的影响。

    • 本文考虑了系统推荐以及粉丝观看这两个传播途径[11];同时,基于第二部分的相关性分析,本文将点赞行为引入模型构建中,假设当短视频点赞量达到一定阈值后即被推荐入下一个流量池(如图5所示),从而构建了短视频的点赞−传播动力学模型来刻画短视频播放量的演变模式。

      图  5  短视频进入下一推荐阶段的过程

      在短视频的传播过程中,对于系统推荐部分,假设$t$时刻其处于系统推荐的第$i$阶段,其中流量池中的用户以恒定速率$b$对短视频进行观看,假定短视频进入第$i$推荐阶段的时间为${T_i}$,可得到第$i$阶段流量池变化速率如下:

      $$\frac{{{\rm{d}}{S_i}(t - {T_i})}}{{{\rm{d}}t}} = - b{S_i}(t - {T_i})$$ (3)

      式中,${S_i}(t)$表示$t$时刻第$i$阶段流量池的未推荐人数。

      对于粉丝观看部分,假定粉丝以速率$\beta $对视频进行观看,得到$t$时刻未观看粉丝人数$f(t)$的变化速率如下:

      $$\frac{{{\rm{d}}f(t)}}{{{\rm{d}}t}} = - \beta f(t)$$ (4)

      初始时刻$f(0) = \alpha N$,其中$\alpha $代表观看该短视频的潜在粉丝用户占总粉丝用户的比例,N为用户总粉丝量,即$\alpha N$为观看该短视频的粉丝总数。

      由式(3~4)以及点赞率${q_i}$得到播放量以及点赞量变化速率如下:

      $$\frac{{{\rm{d}}I(t)}}{{{\rm{d}}t}} = b{S_i}(t - {T_i}) + \beta f(t)$$ (5)
      $$\frac{{{\rm{d}}x(t)}}{{{\rm{d}}t}} = (b{S_i}(t - {T_i}) + \beta f(t)){q_i}$$ (6)

      式中,$I(t)$$x(t)$分别表示t时刻的累计播放量和累计点赞量。

      假设每个阶段进入下一阶段的点赞量阈值为${D_i}$,时间阈值为${K_i}$${T_i}$为进入第$i$阶段推荐的时间,从$i$$i + 1$阶段点赞量$x(t)$需要满足下列条件:

      $$x({T_{i + 1}}) - x({T_i}) \geqslant {D_i}$$ (7)
      $${T_{i + 1}} - {T_i} \leqslant {K_i}$$ (8)

      由于在点赞量达到条件时,推荐进入下一阶段。假设$i$阶段流量池总推荐人数为${R_i}$,得到第$i$阶段实际推荐人数${A_i}$

      $${A_i} = {R_i} - {S_i}({T_{i + 1}} - {T_i})$$ (9)

      ${S_i}(0) = {R_i}$$i$阶段实际推荐人数为${A_i}$,对式(3)求导,推出动力学模型中的累计推荐人数${C_t}$

      $${C_t} = \sum\limits_{k = 1}^{i - 1} {{A_k}} + {R_i}(1 - {{\rm{e}}^{ - b(t - {T_i})}})$$ (10)

      $f(0) = \alpha N$,对式(4)求导,推出动力学模型中的累计粉丝观看人数${F_t}$

      $${F_t} = f(0) - f(t) = \alpha N(1 - {{\rm{e}}^{ - \beta t}})$$ (11)

      由式(10~11)得到$t$时刻的累计观看人数为:

      $$I(t) = \alpha N(1 - {{\rm{e}}^{ - \beta t}}) + \sum\limits_{k = 1}^{i - 1} {{A_k}} + {R_i}(1 - {{\rm{e}}^{ - b(t - {T_i})}})$$ (12)
    • 利用式(12)对实际数据(用户“浙有正能量”所发布的两个不同播放量时变模式的短视频数据)进行复现,得到了很好的吻合,结果如图6所示。其中图6a为2019年11月21日发布的视频,播放量达150万,对其第一次推荐过程进行拟合的结果:系统推荐速率b=0.006 1,粉丝观看数f(0)=8.83万人;图6b为2019年12月3日发布的视频,播放量达200万,多梯度播放量累计曲线的拟合结果:系统推荐速率b1=0.107 8,b2=0.036 8,粉丝观看数f(0)=73.68万人。图6a对完整的播放量累计曲线中第一个梯度进行拟合,发现模型可以很好地复现一次推荐过程。图6b对实际数据中的多梯度播放量曲线进行拟合,通过对数据的观察得到其转折点,模型拟合了每一个梯度过程。图6的拟合结果说明模型可以很好地反映在线短视频的传播过程。

      图  6  模型拟合结果

      短视频传播过程中受到多次的系统推荐,本文只讨论最多3次的叠加推荐,且设定3个流量池分别为R1R2R3,其中流量池R1=100,R2=150,R3=200,流量池点赞量阈值Di($i$=1,2),时间阈值为Ki($i$=1,2)。

      为简便起见,本文假定传播过程中每一阶段的点赞率相等,即${q_i} = \omega $。通过探索点赞率$\omega $对播放量的影响,发现不同梯度曲线的产生受点赞率的影响。设其他参数不变,粉丝吸引率α=0.08,用户粉丝数N=10 000,推荐速率b=0.05,点赞量阈值D1=11,D2=16,时间阈值K1=350,K2=300。当点赞率较高时,如图7a7c,短视频的点赞量可快速达到进入下一流量池的阈值,因此短视频在每一流量池的时间较短,从而播放量呈现快速增长,最后再进入长期缓慢增长的模式,这也反映了实际数据中的第一类模式(如图2a)。当点赞率较低时,如图7b7d,短视频的点赞量需要较长时间的积累才可达到点赞量阈值,因此在每一流量池的时间较长,从而传播过程中存在多次长时间缓慢增长的阶段,播放量呈现阶段性增长,反映了实际数据中第二类模式(如图2b)。

      图  7  点赞率ω对视频流行度模式的影响

      粉丝吸引率$\alpha $对短视频传播的影响如图8所示。设其他参数不变,用户粉丝数N=10 000,推荐速率b=0.05,点赞率ω=0.10,点赞量阈值D1=11,D2=16,时间阈值K1=300,K2=300。图8a中,随着$\alpha $的增大,播放量呈阶跃式的增长。这是因为当$\alpha $较小时(如图8b),短视频前期播放量较小,无法进入下一推荐阶段;而随着$\alpha $的增加(如图8c8d),短视频可以得到多次推荐,从而播放量也相应增加。可见初始的粉丝吸引率对短视频在初期能否进行系统推荐从而传播开来具有重要的影响。

      图  8  粉丝吸引率α对视频传播的影响

    • 为了探索短视频的传播机制,本文基于相关性分析以及传输熵,发现点赞量与播放量呈强正相关,且点赞量对播放量有驱动作用;结合短视频传播特点和已有的视频传播模型,将点赞促进传播以及多次推荐的特征考虑在内,构建了在线短视频的点赞−传播动力学模型。本文还结合短视频评论以及短视频播放量,探索评论的用户情感与播放量之间的关系。后续的研究可将视频内容所引发的情感倾向对播放量的影响考虑在内,进一步完善模型。

参考文献 (21)

目录

    /

    返回文章
    返回