面向微博可信度评估的辩论图模型

黄青松; 戴丹; 冯旭鹏; 付晓东; 刘骊; 刘利军

doi:10.3969/j.issn.1001-0548.2017.02.013

面向微博可信度评估的辩论图模型

doi: 10.3969/j.issn.1001-0548.2017.02.013

1.
昆明理工大学信息工程与自动化学院昆明 650500
2.
云南省计算机技术应用重点实验室昆明 650500
3.
昆明理工大学教育技术与网络中心昆明 650500

基金项目:

国家自然科学基金 81360230

国家自然科学基金 81560296

国家自然科学基金 61462056

国家自然科学基金 61462051

详细信息

作者简介:
黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

中图分类号: TP391

Argumentation Graphical Model for Microblog Credibility Assessment

1.
Faculty of Information Engineering and Automation, Kunming University of Scienceand Technology Kunming 650500
2.
Yunnan Key Laboratory of Computer Technology Applications Kunming 650500
3.
Educational Technology and Network Center, Kunming University of Science and Technology Kunming 650500

摘要: 微博内容具有信息混杂和不确定性等特点，传统可信度判别方法存在一定局限性。因此，该文提出一种面向微博可信度评估的辩论有向图模型，从辩论的角度出发，以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点，利用争议间的主题情感和潜在逻辑关系定义规则可信度，并设置图中边的权值来代表争议间的防卫和攻击强度。根据相关算法得出结论的可信度，递归进行辩论图演化，得到需判别信息的可信度。实验结果表明该模型比传统方法综合指标值平均提升6%。
- 辩论 /
- 争议节点 /
- 有向图 /
- 可信度
Abstract: Due to the mix and uncertainty of the microblog information data, the credibility assessment has difficulty to distinguish. An argumentation directedgraphical model for microblog credibility assessment is presented. From the point of view of argumentation, the model, the argument deduction process is described intuitively by graphical model. In the credibility assessment process, we create the argument node based on the relevant topic corpus, define the rule credibility by the thematic sentiment and potential logical relationship, set the weights on the edges, and represent the defense and attack strength between arguments for this reason. The conclusion credibility is achieved and the argumentation graphical with recursion is evolved according to the relevant algorithm. At last the distinguish information could get the credibility. Experimental results show that this model obtains an accuracy up to 6% in comprehensive indexmeasure compared to the traditional methods.
- argumentation /
- argument node /
- directed graphs /
- reliability

图 1 辩论图初始示例

下载: 全尺寸图片幻灯片

图 2 简化后的辩论图

下载: 全尺寸图片幻灯片

图 3 辩论图微博可信度评估流程

下载: 全尺寸图片幻灯片

图 4 参数$\lambda ,\omega $调整实验结果

下载: 全尺寸图片幻灯片

图 5 不同主题数实验结果图

下载: 全尺寸图片幻灯片

图 6 不同模型实验结果图

下载: 全尺寸图片幻灯片

表 1 实验语料信息表

所属话题	采集时间	语料规模	平均长度/词	种子规模
高官落马	2015.6.29~2015.7.5	1 849	44.2	20
国产电影票房	2015.7.25~2015.7.30	1 266	31.8	15
天津爆炸	2015.8.13~2015.8.18	1 650	34.3	18

下载: 导出CSV

表 2 不同方法实验对比结果表

方法	准确率P	召回率R	F
SVM	0.689 7	0.714 3	0.701 8
MCP	0.761	0.76	0.7605
RDM	0.778	0.755	0.7663
TSEC	0.782 5	0.767 0	0.774 6

下载: 导出CSV

[1]	MENDOZA M, POBLETE B, CASTILLO C. Twitter under crisis:Can we trust what we RT?[C]//Proceedings of the First Workshop on Social Media Analytics. New York:ACM, 2010:71-79.
[2]	CASTILLO C, MENDOZA M, POBLETE B. Information credibility on Twitter[C]//Proceedings of the 20th International Conference on World Wide Web. New York:ACM, 2011:675-684.
[3]	蒋盛益, 陈东沂, 庞观松, 等.微博信息可信度分析研究综[J].图书情报工作, 2013, 57(12):136-142. http://www.cnki.com.cn/Article/CJFDTOTAL-TSQB201312029.htm JIANG Sheng-yi, CHEN Dong-yi, PANG Guan-song, et al. Research review of information credibility analysis on Microblog[J]. Library and Information Service, 2013, 57(12):136-142. http://www.cnki.com.cn/Article/CJFDTOTAL-TSQB201312029.htm
[4]	MORRIS M R, COUNTS S, ROSEWAY A, et al. Tweeting is believing? understanding micoroblog credibility perceptions[C]//Proc of the 15th ACM Conf on Computer Supported Cooperative Work (CSCW12). New York:ACM, 2012:441-450.
[5]	QAZVINIAN V, ROSENGREN E, RADEV D R, et al. Rumor has it:Indentifying misinformation in Microblogs[C]//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. Edinburgh:ACL, 2011:1589-1599.
[6]	GUPTA A, KUMARAGURU P, CASTILLO C, et al. Tweetcred:a real-time web-based system for assessing credibility of content on twitter[EB/OL].[2015-07-25]. http://arxiv.org/abs/1405.5490.
[7]	熊才权, 欧阳勇, 梅清.基于可信度的辩论模型及争议评价算法[J].软件学报, 2014, 25(6):1225-1238. http://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201406008.htm XIONG Cai-quan, OUYANG Yong, MEI Qing. Argumentation model based on certainty-factor and algorithms of argumentevaluation[J]. Journal of Software, 2014, 25(6):1225-1238. http://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201406008.htm
[8]	DANG P M. On the acceptability of arguments and its fundamental role in nonmonotonic reasoning logic programming and n-person games[J]. Artificial Intelligence, 1995, 77(2):321-357. doi: 10.1016/0004-3702(94)00041-X
[9]	TOULMIN S E. The uses of argument[J]. Ethics, 1959, 10(1):251-252.
[10]	KUNZ W, RITTEL H W J. Issues as elements of information systems[D]. Berkeley:University of California, 1970.
[11]	熊才权, 李德华.一种研讨模型[J].软件学报, 2009, 20(8):2181-2190. doi: 10.3724/SP.J.1001.2009.03465 XIONG Cai-quan, LI De-hua. Model of argumentation[J]. Journal of Software, 2009, 20(8):2181-2190. doi: 10.3724/SP.J.1001.2009.03465
[12]	陈俊良, 王长春, 陈超.一种扩展双极辩论模型[J].软件学报, 2012, 23(6):1444-1457. doi: 10.3724/SP.J.1001.2012.04067 CHEN Jun-liang, WANG Chang-chun, CHEN Chao. Extended bipolar argumentation model[J]. Journal of Software, 2012, 23(6):1444-1457. doi: 10.3724/SP.J.1001.2012.04067
[13]	苑卫国, 刘云, 程军军, 等.微博网络中用户特征量和增长率分布的研究[J].计算机学报, 2014, (4):767-778. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201404004.htm YUAN Wei-guo, LIU Yun, CHENG Jun-jun, et al. Research on the user characteristics and growth rates distribution in microblog[J]. Chinese Journal of Computers. 2014, 37(4):767-778. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJX201404004.htm
[14]	BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of Machine Research, 2003, 3(3):993-1022.
[15]	贺飞艳, 何炎祥, 刘楠, 等.面向微博短文本的细粒度情感特征抽取方法[J].北京大学学报 (自然科学版), 2014, 50(1):48-54. http://www.cnki.com.cn/Article/CJFDTOTAL-BJDZ201401007.htm HE Fei-yan, HE Yan-xiang, LIU Nan, et al. A microblog short text oriented multi-class feature extraction method of fine-grained sentiment analysis[J]. Acta Scientiarum Naturalium Universitaits Pekinensis, 2014, 50(1):48-54. http://www.cnki.com.cn/Article/CJFDTOTAL-BJDZ201401007.htm
[16]	DAGAN I, GLICKMAN O. Probabilistic textual entailment:Generic applied modeling of language variability[C]//PASAL Workshop on Learning Methods for Text Understanding and Mining. Grenoble France:[s.n.], 2004.
[17]	刘茂福, 王月, 顾进广.基于语义规则的中文矛盾关系识别方法[J].计算机工程与科学, 2015, 37(4):806-812. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJK201504030.htm LIU Mao-fu, WANG Yue, GU Jin-guang. Chinese textual contradiction recognition based on semantic rules[J]. Computer Engineering & Science, 2015, 37(4):806-812. http://www.cnki.com.cn/Article/CJFDTOTAL-JSJK201504030.htm
[18]	GUPTA A, KUMARAGURU P. Credibility ranking of tweets duringhigh impact events[EB/OL].[2015-07-25]. http://precog.iiitd.edu.in/Publicationsfiles/a2-gupta.pdf.2012.

[1]	曹铃苓, 杨宏春, 高雅纯, 张虎, 杨春, 付传技. 具有活跃节点的多层网络作用下时滞SEQS模型分析 . 电子科技大学学报, 2024, 53(2): 277-283. doi: 10.12178/1001-0548.2023062
[2]	李明, 胡江平, 曹晓莉. 异构有向传感器网络连通覆盖调度算法 . 电子科技大学学报, 2022, 51(4): 572-579. doi: 10.12178/1001-0548.2022001
[3]	李治成, 吉立新, 刘树新, 李星, 李劲松. 基于拓扑有效连通路径的有向网络链路预测方法 . 电子科技大学学报, 2021, 50(1): 127-137. doi: 10.12178/1001-0548.2020220
[4]	顾亦然, 朱梓嫣. 基于LeaderRank和节点相似度的复杂网络重要节点排序算法 . 电子科技大学学报, 2017, 46(2): 441-448. doi: 10.3969/j.issn.1001-0548.2017.02.020
[5]	范天龙, 朱燕燕, 吴蕾蕾, 任晓龙, 吕琳媛. DHC定理在有向含权网络上的推广及应用 . 电子科技大学学报, 2017, 46(5): 766-776. doi: 10.3969/j.issn.1001-0548.2017.05.020
[6]	杨凯, 郭强, 刘晓露, 刘建国. 基于多重特征向量的有向网络社团结构划分算法 . 电子科技大学学报, 2016, 45(6): 1014-1019, 1032. doi: 10.3969/j.issn.1001-0548.2016.06.024
[7]	梁瑞仕, 姜云飞, 杨会志. 基于有序爬山法的前向启发式搜索规划 . 电子科技大学学报, 2013, 42(3): 464-469. doi: 10.3969/j.issn.1001-0548.2013.03.028
[8]	黄琼, 王万新, 阳小龙, 隆克平. 可抵御节点恶意行为的锚节点型IP坐标系统 . 电子科技大学学报, 2012, 41(2): 285-290. doi: 10.3969/j.issn.1001-0548.2012.02.022
[9]	覃琴, 曾志民, 张天魁, 张从青. 动态多中继协同节点选择算法 . 电子科技大学学报, 2011, 40(4): 505-508. doi: 10.3969/j.issn.1001-0548.2011.04.005
[10]	程德强, 钱建生, 杨红丽. 组播服务节点选择问题的求解算法 . 电子科技大学学报, 2008, 37(4): 523-526.
[11]	武畅, 李玉柏, 彭启琮, 柴松, 杨中明. 可设置仲裁优先程度的NOC路由节点设计 . 电子科技大学学报, 2008, 37(5): 645-648.
[12]	谢海蓉, 姜海鹏, 刘杏玲. 信度函数在政府形象评价模型中的应用 . 电子科技大学学报, 2008, 37(1): 148-150.
[13]	杨浩淼, 孙世新, 李洪伟. 前向安全的基于身份加密方案 . 电子科技大学学报, 2007, 36(3): 534-537.
[14]	凌丹, 庄万玉. 基于可信度的动态联盟伙伴评价方法 . 电子科技大学学报, 2007, 36(2): 322-324.
[15]	曹建蜀, 汪学刚. 机载前向阵雷达近程杂波频移补偿 . 电子科技大学学报, 2006, 35(3): 320-323.
[16]	廖素英, 杨华军. 一种快速有效提取浓密视差图的方法 . 电子科技大学学报, 2005, 34(2): 198-201.
[17]	侯孟书, 卢显良, 任立勇, 吴劲. 基于确定性理论的P2P系统信任模型 . 电子科技大学学报, 2005, 34(6): 806-808.
[18]	赵瑾, 庄万玉. 国内制造企业敏捷性评价模型的改进 . 电子科技大学学报, 2005, 34(3): 425-428.
[19]	王德松, 舒兰. 粗集决策表与决策表简化的可信度比较 . 电子科技大学学报, 2004, 33(5): 611-613.
[20]	陈语林, 梁建武, 曹刚. 网络服务的公平性分析及性能改善 . 电子科技大学学报, 2002, 31(4): 409-412.

点击查看大图

图(6) / 表(2)

计量

文章访问数: 4493
HTML全文浏览量: 1214
PDF下载量: 89
被引次数: 0

全文HTML

随着社交平台的快速发展，微博凭借其短文本、低门槛、实时性和传播迅速等特性吸引了大量忠实用户。信息在微博上快速传播与分享，但谣言也大量蔓延^[1-2]。微博网络的复杂性，使谣言信息在不同群体中通过多级节点大面积扩散，频繁汇聚转发增加了其表面上的可信度。微博平台每天发表大量微博，如何提高判定其可信度的准确性成为亟待解决的问题。微博可信度研究在信息过滤、舆情监控和信息传播引导过程中发挥着积极的作用，且有助于微博社会化推荐、微博搜索引擎等方面的应用研究^[3]。

目前针对微博信息的可信研究，主要根据用户行为特点进行特征分析从而设计分类算法。基于特征分类方法对微博信任评估具有较好效果，文献[1]通过2010年智利地震研究了Twitter用户发布博文的特征和信息传播的特点，发现谣言与新闻的传播方式不同，谣言在Twitter社区的讨论会逐渐被怀疑。文献[2]基于推文和转发微博行为特征 (内容、用户、话题和传播特征) 提出了自动评估可信性的方法。文献[4]通过大量调查发现，用户认为可信的与确切可信的信息存在不同的特征，并对不同特征 (用户特征、话题信息、博文内容) 进行比较实验。文献[5]为解决谣言探测问题提出了3种特征：基于内容、基于网络和正确定义谣言的微博具体模型。文献[6]通过半监督的推文可信度排序模型 (TweetCred) 来实时评估其信任值。

辩论是智能主体间为了消除信念不一致的一种基于言语的交互行为。辩论模型是对辩论推演过程的形式化描述，其研究内容包括辩论空间构造以及辩论结果生成算法^[7]。辩论模型中影响力较大的有抽象辩论框架^[8]，Toulmin模型^[9]IBIS (issue-based information system) 模型^[10]和基于以上扩展的模型^[11-12]。文献[7]基于相关辩论模型的应用方面对辩论建模时考虑了不确定信息处理因素，并提出一种基于可信度的辩论模型。

针对微博信息量大、不确定和混杂特性，特征提取方法需大量人工标注，且都是静态数据的特征统计^[13]，缺乏理论依据的推断与支持，故本文提出基于辩论图的微博信任评估模型，以辩论为基本思想，以争议间的支持或攻击强度为权值来构建有向带权图，且递归辩论推演得到信息可信度。该模型更直观地体现出判别可信的过程及辩论间的推演关系。

4. 结束语

为了解决微博可信度评估问题，提出一种面向微博可信度评估的辩论图模型。该模型基于辩论思想，且以图来描述辩论推演过程。实验结果表明，本模型在准确率、召回率和综合指标上都取得较好的结果，证明了此辩论图模型的有效性。模型争议前提中可能存在相互包含关系，故下一步将考虑前提间是否存在合取和析取关系，防止争议间支持和攻击的重复化。

参考文献 (18)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

面向微博可信度评估的辩论图模型

doi: 10.3969/j.issn.1001-0548.2017.02.013

作者简介:
黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

Argumentation Graphical Model for Microblog Credibility Assessment

计量

面向微博可信度评估的辩论图模型

doi: 10.3969/j.issn.1001-0548.2017.02.013

1. 昆明理工大学信息工程与自动化学院昆明 650500

2. 云南省计算机技术应用重点实验室昆明 650500

3. 昆明理工大学教育技术与网络中心昆明 650500

作者简介:
黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

English Abstract

Argumentation Graphical Model for Microblog Credibility Assessment

1. Faculty of Information Engineering and Automation, Kunming University of Scienceand Technology Kunming 650500

2. Yunnan Key Laboratory of Computer Technology Applications Kunming 650500

3. Educational Technology and Network Center, Kunming University of Science and Technology Kunming 650500

全文HTML

1.1. 框架基本表示

1.2. 争议节点产生

1.3. 规则可信度

1.3.1. 主题情感相关度

1.3.2. 潜在逻辑关系

1.4. 辩论图构建与推演

3.1. 实验数据和预处理

3.2. 参数设定与潜在逻辑关系影响

3.3. 方法性能对比

目录

期刊在线

编辑办公

友情链接

留言板

面向微博可信度评估的辩论图模型

doi: 10.3969/j.issn.1001-0548.2017.02.013

作者简介: 黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

Argumentation Graphical Model for Microblog Credibility Assessment

计量

出版历程

面向微博可信度评估的辩论图模型

doi: 10.3969/j.issn.1001-0548.2017.02.013

1. 昆明理工大学信息工程与自动化学院 昆明 650500 2. 云南省计算机技术应用重点实验室 昆明 650500 3. 昆明理工大学教育技术与网络中心 昆明 650500

作者简介: 黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

English Abstract

Argumentation Graphical Model for Microblog Credibility Assessment

1. Faculty of Information Engineering and Automation, Kunming University of Scienceand Technology Kunming 650500 2. Yunnan Key Laboratory of Computer Technology Applications Kunming 650500 3. Educational Technology and Network Center, Kunming University of Science and Technology Kunming 650500

全文HTML

1.1. 框架基本表示

1.2. 争议节点产生

1.3. 规则可信度

1.3.1. 主题情感相关度

1.3.2. 潜在逻辑关系

1.4. 辩论图构建与推演

3.1. 实验数据和预处理

3.2. 参数设定与潜在逻辑关系影响

3.3. 方法性能对比

目录

期刊在线

编辑办公

友情链接

作者简介:
黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

1. 昆明理工大学信息工程与自动化学院昆明 650500

2. 云南省计算机技术应用重点实验室昆明 650500

3. 昆明理工大学教育技术与网络中心昆明 650500

作者简介:
黄青松 (1962-), 男, 教授, 主要从事数据挖掘、自然语言处理等方面的研究

1. Faculty of Information Engineering and Automation, Kunming University of Scienceand Technology Kunming 650500

2. Yunnan Key Laboratory of Computer Technology Applications Kunming 650500

3. Educational Technology and Network Center, Kunming University of Science and Technology Kunming 650500