用于目标情感分类的多跳注意力深度模型

邓钰; 雷航; 李晓瑜; 林奕欧

doi:10.3969/j.issn.1001-0548.2019.05.016

用于目标情感分类的多跳注意力深度模型

doi: 10.3969/j.issn.1001-0548.2019.05.016

电子科技大学信息与软件工程学院成都 610054

基金项目:

国家自然科学基金 61502082

中央高校基本科研业务费 ZYGX2014J065

详细信息

作者简介:
邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究

通讯作者: 李晓瑜, E-mail:157291443@qq.com

中图分类号: TP391

A Multi-Hop Attention Deep Model for Aspect-Level Sentiment Classification

School of Information and Software Engineering, University of Electronic Science and Technology of China Chengdu 610054

摘要: 文本情感分类是近年来自然语言处理领域的研究热点，旨在对文本蕴含的主观倾向进行分析，其中，基于特定目标的细粒度情感分类问题正受到越来越多的关注。在传统的深度模型中加入注意力机制，可以使分类性能显著提升。针对中文的语言特点，提出一种结合多跳注意力机制和卷积神经网络的深度模型（MHA-CNN）。该模型利用多维组合特征弥补一维特征注意力机制的不足，可以在没有任何先验知识的情况下，获取更深层次的目标情感特征信息。相对基于注意力机制的LSTM网络，该模型训练时间开销更小，并能保留特征的局部词序信息。最后在一个网络公开中文数据集（包含6类领域数据）上进行实验，取得了比普通深度网络模型、基于注意力机制的LSTM模型以及基于注意力机制的深度记忆网络模型更好的分类效果。
- 目标情感分类 /
- 注意力机制 /
- 卷积神经网络 /
- 深度学习 /
- 自然语言处理
Abstract: Text sentiment classification is a hot topic in the field of natural language processing in recent years. It aims to analyze the subjective sentiment polarity of text. More and more attention has been paid to the problem of fine grained sentiment classification based on specific aspects. In traditional deep models, the attention mechanism can significantly improve the classification performance. Based on the characteristics of Chinese language, a deep model combining multi-hop attention mechanism and convolutional neural network (MHA-CNN) is proposed. The model makes use of the multidimensional combination features to remedy the deficiency of one dimensional feature attention mechanism, and can get deeper aspect sentiment feature information without any prior knowledge. Relative to the attention mechanism based long short-term memory (LSTM) network, the model has smaller time overhead and can retain word order information of the characteristic part. Finally, we conduct experiments on a network open Chinese data set (including 6 kinds of field data), and get better classification results than the ordinary deep network model, the attention-based LSTM model and the attention-based deep memory network model.
- aspect-based sentiment categorization /
- attention mechanism /
- convolutional neural network /
- deep learning /
- natural language processing

图 1 NLP中CNN卷积操作示意

下载: 全尺寸图片幻灯片

图 2 特定目标注意力权值示意

下载: 全尺寸图片幻灯片

图 3 注意力计算过程

下载: 全尺寸图片幻灯片

图 4 酒店评论文本示例

下载: 全尺寸图片幻灯片

图 5 多跳注意力模型结构

下载: 全尺寸图片幻灯片

图 6 不同卷积窗口下的分类正确率

下载: 全尺寸图片幻灯片

图 7 各模型单次迭代训练时间

下载: 全尺寸图片幻灯片

表 1 实验数据统计

极性	类别
极性	书籍	酒店	电脑	牛奶	手机	热水器	合计
正面	4 000	2 000	2 000	1 005	1 160	512	10 677
负面	4 000	2 000	2 000	1 170	1 158	100	10 428
数据总计	21 105

下载: 导出CSV

表 2 模型超参设置

参数名称	参数值
词嵌入维度	350
卷积核窗口大小	1, 2, 3, 4
卷积核数量	250
正则项限制(L2)	0.01
mini batch	32
dropout	0.25

下载: 导出CSV

表 3 各模型在数据集上的分类精度

模型名称	分类精度
CNN	0.913 6
LSTM	0.908 3
SVM	0.914 7
ABCNN	0.916 2
ATAE-LSTM	0.917 3
MemNet	0.916 8
MHA-CNN	0.922 2

下载: 导出CSV

[1]	LIU Bing, ZHANG Lei. Sentiment analysis and opinion mining[M].[S.l.]:Morgan & Claypool Publishers, 2012.
[2]	YIOU Lin, HANG Lei, WU Jia, et al. An empirical study on sentiment classification of Chinese review using word embedding[C]//29th Pacific Asia Conference on Language, Information and Computation. Shanghai, China: [s.n.], 2015: 258-266.
[3]	PONTIKI M, GALANIS D, PAVLOPOULOS J, et al. Semeval-2014 task 4: Aspect based sentiment analysis[C]//Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval2014).[S.l.]: [s.n.], 2014: 27-35. https://pure.york.ac.uk/portal/en/publications/semeval2015-task-12(d7554532-f5ee-4a20-b535-15715bd78a28)/export.html
[4]	林奕欧, 雷航, 李晓瑜, 等.自然语言处理中的深度学习:方法及应用[J].电子科技大学学报, 2017, 46(6):913-919. doi: 10.3969/j.issn.1001-0548.2017.06.021 LIN Yi-ou, LEI Hang, LI Xiao-yu, et al. Deep learning in NLP:Methods and applications[J]. Journal of University of Electronic Science and Technology of China. 2017, 46(6):913-919. doi: 10.3969/j.issn.1001-0548.2017.06.021
[5]	CHO K, VAN MERRIËNBOER B, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[C]//Proceedings of EMNLP Processing. Doha, Qatar: ACL Press, 2014: 1724-1734. http://www.oalib.com/paper/4082023
[6]	ALEXANDER M, CHOPRA S, WESTON J. A neural attention model for sentence summarization[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon, Portugal: [s.n.], 2015: 379-389. http://www.oalib.com/paper/4051215
[7]	SAGARA T, HAGIEARA M. Natural language neural network and its application to question-answering system[J]. Neurocomputing, 2014, 142:201-208. doi: 10.1016/j.neucom.2014.04.048
[8]	MA X, HOVY E. End-to-end sequence labeling via bi-directional lstm-cnns-crf[C]//Proceedings of ACL. Berlin, Germany: ACL Press, 2016: 1064-1074. https://arxiv.org/abs/1603.01354
[9]	TANG D, QIN B, LIU T. Document modeling with gated recurrent neural network for sentiment classification[C]//Proceedings of EMNLP. Lisbon, Portugal: ACL Press, 2015: 1422-1432.
[10]	TANG Du-yu, QIN Bing, FENG Xiaoc-heng, et al. Effective LSTMs for target-dependent sentiment classification[C]//Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics. Osaka, Japan: [s.n.], 2016: 3298-3307, https://arxiv.org/abs/1512.01100
[11]	刘龙飞, 杨亮, 张绍武, 等.基于卷积神经网络的微博情感倾向性分析[J].中文信息学报, 2015, 29(6):159-169. doi: 10.3969/j.issn.1003-0077.2015.06.021 LIU Long-fei, YANG Liang, ZHANG Shao-wu, et al. Convolutional neural networks for Chinese micro-blog sentiment analysis[J]. Journal of Chinese Information Processing, 2015, 29(6):159-169. doi: 10.3969/j.issn.1003-0077.2015.06.021
[12]	MNIH V, HEESS N, GRAVES A. Recurrent models of visual attention[C]//Proceedings of Advances in Neural Information Processing Systems 27(NIPS 2014). Cambridge, MA: MIT Press, 2014: 2204-2212. http://www.oalib.com/paper/4082117
[13]	BAHDANAU D, CHO K, BENGIO Y. Neural machine translation by jointly learning to align and translate[EB/OL].[2018-09-21]. http://arxiv.org/pdf/1409.04732v2.pdf.
[14]	ZHOU P, SHI W, TIAN J, et al. Attention-based bidirectional long short-term memory networks for relation classification[C]//Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. Berlin, Germany: [s.n.], 2016: 207-212
[15]	YIN Wen-peng, EBERT S, SCHUTZE H. Attention-based convolutional neural network for machine comprehension[C]//Proceedings of 2016 NAACL Human-compllter Question Answering Workshop. San Diego, Califormia: Association for Computational Linguistics, 2016: 15-21. https://arxiv.org/abs/1602.04341v1
[16]	WANG Ye-quan, HUANG Min-lie, ZHAO Li, et al. Attention-based LSTM for Aspect-level Sentiment Classification[C]//Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. Austin, Texas: [s.n.], 2016: 606-615.
[17]	TANG Du-yu, QIN Bing, LIU Ting. Aspect level sentiment classification with deep memory network[C]//Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. Austin, Texas: [s.n.], 2016: 214-224. https://arxiv.org/abs/1605.08900
[18]	刘全, 梁斌, 徐进, 等.一种用于基于方面情感分析的深度分层网络模型[J].计算机学报, 2018, 12:2637-2652. doi: 10.11897/SP.J.1016.2018.02637 LIU Quan, LIANG Bin, XU Jin, et al. A deep hierarchical neural network model for aspect-based sentiment analysis[J]. Chinese Journal of Computers, 2018, 12:2637-2652. doi: 10.11897/SP.J.1016.2018.02637
[19]	梁斌, 刘全, 徐进, 等.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展, 2017, 54(8):1724-1735. http://d.old.wanfangdata.com.cn/Periodical/jsjyjyfz201708010 LIANG Bin, LIU Quan, XU Jin, et al. Aspect-Based sentiment analysis based on multi-attention CNN[J]. Journal of Computer Research and Development. 2017, 54(8):1724-1735. http://d.old.wanfangdata.com.cn/Periodical/jsjyjyfz201708010
[20]	KIM Y. Convolutional neural networks for sentence classification[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha, Qatar: [s.n.], 2014: 1746-1751. http://www.oalib.com/paper/4046794
[21]	KALCHBRENNER N, GREFENSTETTE E, BLUNSOM P. A convolutional neural network for modelling sentences[C]//Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics. Baltimore, Maryland, USA: [s.n.], 2014: 655-665.
[22]	GEHRING J, AULI M, GRANGIER D, et al. Convolutional sequence to sequence learning[C]//Proceedings of the 34th International Conference on Machine Learning. Sydney, Australia: PMLR, 2017: 1243-1252. https://arxiv.org/abs/1705.03122
[23]	VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[C]//31st Conference on Neural Information Processing Systems (NIPS 2017). Long Beach, CA, USA: [s.n.]. 2017.
[24]	SUKHBAATAR S, SZLAM A, WESTON J, et al. End-to-end memory networks[C]//Advances in Neural Information Processing Systems 28(NIPS 2015). Montreal, Canada: MIT press, 2015: 2431-2439.
[25]	YIN Wen-peng, SCHUTZE H, XIANG Bing, et al. ABCNN:Attention-based convolutional neural network for modeling sentence pairs[J]. Transactions of the Association for Computational Linguistics, 2016, 4:259-272. doi: 10.1162/tacl_a_00097

[1]	崔少国, 独潇, 张宜浩. 基于兴趣注意力网络的会话推荐算法 . 电子科技大学学报, 2024, 53(1): 67-75. doi: 10.12178/1001-0548.2022307
[2]	黄颖, 许剑, 周子祺, 陈树沛, 周帆, 曹晟. 高效长序列水位预测模型的研究与实现 . 电子科技大学学报, 2023, 52(4): 595-601. doi: 10.12178/1001-0548.2022133
[3]	赵云龙, 田生祥, 李岩, 罗龙, 齐鹏文. 基于注意力模型和Soft-NMS的输电线路小目标检测方法 . 电子科技大学学报, 2023, 52(6): 906-914. doi: 10.12178/1001-0548.2022290
[4]	刘勇国, 高攀, 兰荻, 朱嘉静. ECA-SKNet：玉米单倍体种子的卷积神经网络识别模型 . 电子科技大学学报, 2023, 52(6): 866-871. doi: 10.12178/1001-0548.2022361
[5]	葛唯益, 程思伟, 王羽, 徐建. 基于双向门控循环神经网络的事件论元抽取方法 . 电子科技大学学报, 2022, 51(1): 100-107. doi: 10.12178/1001-0548.2021153
[6]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[7]	郭磊, 王邱龙, 薛伟, 郭济. 基于注意力机制的光线昏暗条件下口罩佩戴检测 . 电子科技大学学报, 2022, 51(1): 123-129. doi: 10.12178/1001-0548.2021222
[8]	毛文清, 徐雅斌. 基于深度图卷积网络的社交机器人识别方法 . 电子科技大学学报, 2022, 51(4): 615-622, 629. doi: 10.12178/1001-0548.2021280
[9]	周丰丰, 牛甲昱. 细胞穿膜肽识别问题的多特征融合卷积网络预测算法 . 电子科技大学学报, 2022, 51(4): 494-499. doi: 10.12178/1001-0548.2021391
[10]	吴劲, 陈树沛, 杨庆, 周帆. 基于图神经网络的用户轨迹分类 . 电子科技大学学报, 2021, 50(5): 734-740. doi: 10.12178/1001-0548.2020435
[11]	李学明, 岳贡, 陈光伟. 基于多模态注意力机制的图像理解描述新方法 . 电子科技大学学报, 2020, 49(6): 867-874. doi: 10.12178/1001-0548.2019228
[12]	毛远宏, 贺占庄, 马钟. 重构迁移学习的红外目标分类 . 电子科技大学学报, 2020, 49(4): 609-614. doi: 10.12178/1001-0548.2019162
[13]	杨旺功, 淮永建, 张福泉. 基于Gabor及深度神经网络的葡萄种子分类 . 电子科技大学学报, 2020, 49(1): 131-138. doi: 10.12178/1001-0548.2019164
[14]	吴涢晖, 赵子天, 陈晓雷, 邹士亚. 大气低频声信号识别深度学习方法研究 . 电子科技大学学报, 2020, 49(5): 758-765. doi: 10.12178/1001-0548.2019297
[15]	李润东, 李立忠, 李少谦, 宋熙煜, 何鹏. 基于稀疏滤波神经网络的智能调制识别 . 电子科技大学学报, 2019, 48(2): 161-167. doi: 10.3969/j.issn.1001-0548.2019.02.001
[16]	田文洪, 曾柯铭, 莫中勤, 吝博强. 基于卷积神经网络的驾驶员不安全行为识别 . 电子科技大学学报, 2019, 48(3): 381-387. doi: 10.3969/j.issn.1001-0548.2019.03.012
[17]	唐贤伦, 刘庆, 张娜, 周家林. 混合PSO优化卷积神经网络结构和参数 . 电子科技大学学报, 2018, 47(2): 230-234. doi: 10.3969/j.issn.1001-0548.2018.02.011
[18]	林奕欧, 雷航, 李晓瑜, 吴佳. 自然语言处理中的深度学习：方法及应用 . 电子科技大学学报, 2017, 46(6): 913-919. doi: 10.3969/j.issn.1001-0548.2017.06.021
[19]	陈姝, 梁文章. 结合特征点匹配及深度网络检测的运动跟踪 . 电子科技大学学报, 2016, 45(2): 246-251.
[20]	陈俊周, 汪子杰, 陈洪瀚, 左林翼. 基于级联卷积神经网络的视频动态烟雾检测 . 电子科技大学学报, 2016, 45(6): 992-996. doi: 10.3969/j.issn.1001-0548.2016.06.020

点击查看大图

图(7) / 表(3)

计量

文章访问数: 5169
HTML全文浏览量: 1380
PDF下载量: 125
被引次数: 0

全文HTML

随着互联网和移动通讯技术的飞速发展，社交网络和电子商务平台已变成庞大的公共信息集散地，利用其中海量的数据对人们的情感和观点进行分析有着重要的科研价值和社会价值。情感分析或观点挖掘是人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究^[1]。如何利用自然语言处理(natural language processing, NLP)技术对主观意见文本进行情感分析正被越来越多的研究人员关注^[2]。作为情感分析的子任务，面向目标的细粒度情感分析可以针对特定对象有效发掘上下文中的深层情感特征，已经成为该领域的热点研究问题^[3]。

近年来，深度学习作为人工智能领域发展最快的研究方向，在自然言语处理领域也取得了巨大的成功，并被广泛应用于各个NLP任务中^[4]。相对于传统的机器学习算法，深度学习不依赖人工构建特征，具有特征的自学习能力，非常适合语言文本的抽象、高维、复杂等特点，对机器翻译^[5]、文本摘要^[6]、智能问答^[7]、词性标注^[8]等系统性能改善显著。同时，也有许多研究人员运用卷积神经网络(CNN)和长短记忆网络(LSTM)等深度学习模型解决文本情感极性分类问题^[9-11]，并取得了很好的效果。

注意力机制(attention mechanism)最早由图像识别领域提出，可以让模型有效关注局部特定信息，挖掘更深的特征信息^[12]。随后，在自然语言处理领域，注意力机制被验证依然有效。文献[13]首先将注意力机制与循环神经网络结合，在编码-解码模型上计算输入序列与输出序列的对齐概率矩阵，有效解决机器翻译问题。文献[14]将类似的attention方法运用于LTSM网络，提升词对关系分类精度。文献[15]提出在卷积神经网络中使用注意力机制的有效方法，以完成机器阅读理解任务。

情感分类是目标相关(aspect-level)的问题，当训练集和测试集针对不同的目标时，基于监督学习的分类方法通常会表现出较差的效果。因此，面向目标的细粒度情感分类研究显得更具有实际意义，而目标可以是上下文中具体的词汇(target)，也可以是文本描述的抽象对象或所属领域。目前，很多研究人员将注意力机制应用于目标情感分类领域，取得了很好的效果。文献[16]在LSTM网络中将目标内容与序列相应中间状态进行拼接，并计算注意力加权输出，有效解决了上下文对不同目标的情感极性问题。文献[17]借鉴深度记忆网络，提出多跳注意力模型，计算基于内容和位置的注意力值，用于充分挖掘上下文针对特定目标的情感特征信息。文献[18]将注意力机制运用在区域卷积神经网络和LSTM相结合的模型中，既保留输入序列的时序依赖又提高了训练效率。文献[19]将多种注意力机制同时与卷积神经网络相结合，综合词向量、词性和位置信息对目标情感分析效果进行改善。

基于注意力机制和面向目标情感分类的最新研究成果，同时针对中文语言环境中相邻词汇语义表达的特点，本文提出一种结合多跳注意力机制和卷积神经网的深度模型。该模型不依赖句法分析、语法分析和情感词典等先验知识，并利用多维组合特征弥补一维特征注意力机制的不足。它由多个计算层组成，以获取更深层次的目标情感特征信息。每一层都包含一个基于目标内容的注意力模型，用以学习上下文中相邻词汇组合的特征权重，并在最后一层计算连续文本表示，作为情感分类的最终特征。整个模型可以进行有效的端到端训练，相对基于注意力机制的LSTM网络，该模型具有更小的训练时间开销，并能保留特征的局部词序信息。最后在一个网络公开中文数据集(包含6类领域数据)上进行实验。结果表明，该模型比普通深度网络模型、基于注意力机制的LSTM模型以及基于注意力机制的深度记忆网络模型具有更好的分类效果，并且多计算层叠加，可以有效改善分类性能。

4. 结束语

本文针对面向领域的细粒度情感分类问题，提出一种结合卷积神经网络和记忆网络的多跳注意力深度模型。该模型能够利用中文语境中相邻词汇语义表达的特点，并通过多维组合特征对一维特征注意力机制进行补充。同时，多计算层叠加的架构也使得模型能够获取更深层次的目标情感特征信息，并有效处理长距离依赖问题。最后在一个包含6类领域数据的网络公开中文数据集上进行对比实验，结果验证了本文提出模型的有效性。该模型不仅比普通深度网络模型和基于注意力机制的深度模型具有更好的分类性能，相较于LSTM架构的深度网络模型在训练时间开销上优势明显。

从实验结果可以看出，不同滑动窗口下的多维组合特征都能充分作用于分类结果，因此在将来的研究工作中，考虑同时使用这些多维特征来对模型性能进行提升，同时尝试结合不同的注意力机制以及组合多种深度架构来对模型进行优化。

参考文献 (25)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

用于目标情感分类的多跳注意力深度模型

doi: 10.3969/j.issn.1001-0548.2019.05.016

作者简介:
邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究

通讯作者: 李晓瑜, E-mail:157291443@qq.com

A Multi-Hop Attention Deep Model for Aspect-Level Sentiment Classification

计量

用于目标情感分类的多跳注意力深度模型

doi: 10.3969/j.issn.1001-0548.2019.05.016

电子科技大学信息与软件工程学院成都 610054

作者简介:
邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究

通讯作者: 李晓瑜, E-mail:157291443@qq.com

English Abstract

A Multi-Hop Attention Deep Model for Aspect-Level Sentiment Classification

School of Information and Software Engineering, University of Electronic Science and Technology of China Chengdu 610054

全文HTML

1.1. 卷积神经网络

1.2. 注意力机制

2.1. 任务定义

2.2. 方法概述

2.3. 多维组合特征注意力

2.4. 多跳注意力

3.1. 实验数据

3.2. 实验设置

3.3. 模型性能对比

3.4. 多跳与窗口选择

3.5. 训练时间开销

目录

期刊在线

编辑办公

友情链接

留言板

用于目标情感分类的多跳注意力深度模型

doi: 10.3969/j.issn.1001-0548.2019.05.016

作者简介: 邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究

通讯作者: 李晓瑜, E-mail:157291443@qq.com

A Multi-Hop Attention Deep Model for Aspect-Level Sentiment Classification

计量

出版历程

用于目标情感分类的多跳注意力深度模型

doi: 10.3969/j.issn.1001-0548.2019.05.016

电子科技大学信息与软件工程学院 成都 610054

作者简介: 邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究

通讯作者: 李晓瑜, E-mail:157291443@qq.com

English Abstract

A Multi-Hop Attention Deep Model for Aspect-Level Sentiment Classification

School of Information and Software Engineering, University of Electronic Science and Technology of China Chengdu 610054

全文HTML

1.1. 卷积神经网络

1.2. 注意力机制

2.1. 任务定义

2.2. 方法概述

2.3. 多维组合特征注意力

2.4. 多跳注意力

3.1. 实验数据

3.2. 实验设置

3.3. 模型性能对比

3.4. 多跳与窗口选择

3.5. 训练时间开销

目录

期刊在线

编辑办公

友情链接

作者简介:
邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究

电子科技大学信息与软件工程学院成都 610054

作者简介:
邓钰(1983-), 男, 博士生, 主要从事深度学习和自然语言处理方面的研究