基于事件模式及类型的事件检测模型

代翔

doi:10.12178/1001-0548.2021377

基于事件模式及类型的事件检测模型

doi: 10.12178/1001-0548.2021377

代翔^,

中国电子科技集团公司第十研究所　成都　610036

基金项目: 国家自然科学基金 (U19A2078)；四川省科技计划(2020YFG0009)

详细信息

作者简介:
代翔(1983- )，博士，高级工程师，主要从事智能信息处理及数据挖掘方面的研究

通讯作者: 代翔，E-mail：18208182867@qq.com

中图分类号: TP391.1

Event Detection Model Based on Event Pattern and Type Bias

DAI Xiang^,

The 10th Reasearch Institute of China Electronics Tecnology Group Corporatition　Chengdu　610036

摘要: 针对触发词定义标准模糊、语料标注成本高等问题，提出一种基于事件模式及类型的事件检测深度学习模型(PTNN)。首先基于实体的语法及语义特征获取潜在论元；其次将潜在论元抽象为角色，结合语法、语义、角色特征构建嵌入表示，增强输入对事件模式的体现；最后利用Bi-LSTM和基于事件类型的注意力机制，完成事件及类型判定。模型在不识别触发词的前提下，通过强化事件模式特征实现事件检测，避免了触发词标注困难的问题，证明了事件模式在神经网络上对事件检测的积极作用，将同类方法的最优效果提升了3%，且达到了基于触发词的检测效果。
- 注意力机制 /
- 事件检测 /
- 事件模式 /
- 长短时网络 /
- 潜在论元
Abstract: To address the problems of vague criteria for trigger word definition and the high cost of corpus annotation, a deep learning model for event detection called pattern and type based neural network (PTNN) is proposed. First, potential theorems are obtained based on entities' syntactic and semantic features. Then, the potential theorems are abstracted as roles. The embedding representation of PTNN is constructed by combining syntactic, semantic, and role features to enhance the representation of event patterns. Last, event detection and type determination are accomplished by using Bi-LSTM (bidirectional long short-term memory) with an event type-based attention mechanism. The model achieves event detection by enhancing event pattern features instead of identifying trigger words, thus avoiding the challenging problem of trigger word annotation. Such an approach demonstrates the positive effect of event patterns for event detection on neural networks. Experiments demonstrate that it improves the state-of-the-art of event detection by 3%.
- attention /
- event detection /
- event pattern /
- LSTM /
- potential argument

图 1 PTNN模型

下载: 全尺寸图片幻灯片

图 2 ${S_1}$语义语法分析

下载: 全尺寸图片幻灯片

图 3 潜在论元角色替换

下载: 全尺寸图片幻灯片

图 4 不同$\gamma $值对验证集的效果

下载: 全尺寸图片幻灯片

表 1 不同类事件的参与者对应的实体类型

事件类型	参与者可对应实体类型
Life-marry	PER
Life-injure	PER、ORG、GPE、WEA、VEH、SUB
Business-start-org	PER、ORG、GPE

下载: 导出CSV

表 2 潜在论元角色判别规则

实体类型	依存关系	角色$r$	抽象词${r_w}$
人、组织机构	主谓类	施动者	%sub%
	表被动的主谓类	受动者	%obj%
	动宾类	受动者	%sub%
时间	状语类	时间	%time%
地名、国家名	状语类	地点	%loc%
其他实体	状语类、动宾类	其他	−

下载: 导出CSV

表 3 语料详细信息

数据集	文档数	语句数	事件句数	事件数
训练集	529	12855	2929	3376
验证集	30	826	322	392
测试集	40	634	278	347
总计	599	14365	3529	4117

下载: 导出CSV

表 4 基线模型

基线名称	输入	编码器	句子表示
MC-LSTM_avg	<Sentence >	LSTM	隐层均值
MC-LSTM_last	<Sentence >	LSTM	LSTM输出
BC-LSTM_avg	<Sentence,Type>	LSTM	隐层均值
BC-LSTM_last	<Sentence,Type>	LSTM	LSTM输出
TBNNAM	<Sentence,Type>	LSTM	LSTM输出

下载: 导出CSV

表 5 基线模型与${M_1}$效果对比

方法	P	R	F₁
MC-LSTM_avg	0.552	0.421	0.478
MC-LSTM_last	0.561	0.416	0.477
BC-LSTM_avg	0.563	0.597	0.579
BC-LSTM_last	0.589	0.615	0.602
TBNNAM	0.707	0.602	0.65
子模型M₁	0.708	0.636	0.67

下载: 导出CSV

表 6 各子模型效果对比

方法	P	R	F₁
TBNNAM	0.707	0.602	0.65
子模型${M_1}$	0.708	0.636	0.67
子模型${M_2}$	0.724	0.647	0.683
子模型${M_3}$ (PTNN)	0.72	0.654	0.685
Nguyen’s CNN	0.718	0.664	0.690
Liu’s PSL	0.756	0.636	0.691
DS-DMCNN	0.757	0.660	0.705

下载: 导出CSV

[1]	AHN D. The stages of event extraction[C]//Proceedings of the Workshop on Annotating and Reasoning about Time and Events. Sydney: Association for Computational Linguistics, 2006: 1-8.
[2]	JI H, GRISHMAN R. Refining event extraction through cross-document inference[C]//Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics. Columbus: Association for Computational Linguistics, 2008: 254-262.
[3]	CHEN Z, JI H. Language specific issue and feature exploration in Chinese event extraction[C]//Proceedings of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, Companion Volume: Short Papers. [S.l.]: Association for Computational Linguistics, 2009: 209-212.
[4]	LIAO S, GRISHMAN R. Using document level cross-event inference to improve event extraction[C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. [S.l.]: Association for Computational Linguistics, 2010: 789-797.
[5]	LI Q, JI H, HUANG L. Joint event extraction via structured prediction with global features[C]//Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Sofia: Association for Computational Linguistics, 2013: 73-82.
[6]	张建恒, 黄蔚, 胡国超. 基于LDA模型和AP聚类的主题事件抽取技术[J]. 计算机与现代化, 2017(12): 77-81. doi: 10.3969/j.issn.1006-2475.2017.12.015 ZHANG J H, HUANG W, HU G C. Topic event extraction technology based on LDA model and AP clustering method[J]. Computer and Modernization, 2017(12): 77-81. doi: 10.3969/j.issn.1006-2475.2017.12.015
[7]	高源, 席耀一, 李弼程. 基于依存句法分析与分类器融合的触发词抽取方法[J]. 计算机应用研究, 2016(5): 1407-1410. doi: 10.3969/j.issn.1001-3695.2016.05.029 GAO Y, XI Y Y, LI B C. Trigger extraction algorithm based on dependency parsing and classifier fusion[J]. Application Research of Computers, 2016(5): 1407-1410. doi: 10.3969/j.issn.1001-3695.2016.05.029
[8]	万齐智, 万常选, 胡蓉, 等. 基于句法语义依存分析的中文金融事件抽取[J]. 计算机学报, 2021, 44(3): 508-530. doi: 10.11897/SP.J.1016.2021.00508 WAN Q Z, WAN C X, HU R, et al. Chinese financial event extraction base on syntactic and semantic dependency parsing[J]. Chinese Journal of Computers, 2021, 44(3): 508-530. doi: 10.11897/SP.J.1016.2021.00508
[9]	CHEN Y, LIU S, HE S, et al. Event extraction via bidirectional long short-term memory tensor neural networks[M]//Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data. [S.1.]: Springer, 2016: 190-203.
[10]	WU Y, ZHANG J. Chinese event extraction based on Attention and semantic features: A bidirectional circular neural network[J]. Future Internet, 2018, 10(10): 95. doi: 10.3390/fi10100095
[11]	LIN H, LU Y, HAN X, et al. Nugget proposal networks for Chinese event detection[EB/OL]. [2021-10-11]. https://arxiv.org/pdf/1805.00249.pdf.
[12]	FENG X, QIN B, LIU T. A language-independent neural network for event detection[J]. Science China Information Sciences, 2018, 61(9): 1-12. doi: 10.1007/s11432-017-9235-7
[13]	田梓函, 李欣. 基于BERT-CRF模型的中文事件检测方法研究[J]. 计算机工程与应用, 2021, 57(11): 135-139. doi: 10.3778/j.issn.1002-8331.2006-0065 TIAN Z H, LI X. Research on Chinese event detection method based on BERT-CRF model[J]. Computer Engineering and Applications, 2021, 57(11): 135-139. doi: 10.3778/j.issn.1002-8331.2006-0065
[14]	陈安南, 叶岩宁, 王畅畅, 等. 基于 BERT-DGCNN 的中文事件抽取方法研究[J]. 计算机科学与应用, 2021, 11: 1572. doi: 10.12677/CSA.2021.115162 CHEN A N, YE Y N, WANG C C, et al. Research on Chinese event extraction method based on BERT-DGCNN[J]. Computer Science and Application, 2021, 11: 1572. doi: 10.12677/CSA.2021.115162
[15]	ZHOU D, ZHANG X, HE Y. Event extraction from Twitter using non-parametric Bayesian mixture model with word embeddings[C]//Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 1, Long Papers. [S. l.]: Association for Computational Linguistics, 2017: 808-817.
[16]	YUAN Q, REN X, HE W, et al. Open-schema event profiling for massive news corpora[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management. [S.l.]: Association for Computing Machinery, 2018: 587-596.
[17]	PETRONI F, RAMAN N, NUGENT T, et al. An extensible event extraction system with cross-media event resolution[EB/OL]. [2021-11-10]. https://aclanthology.org/E17-1076.pdf.
[18]	刘振. 基于网络科技信息的事件抽取研究[J]. 情报科学, 2018, 36(9): 115-117. LIU Z. Research on event extraction from networks scientific information[J]. Information Science, 2018, 36(9): 115-117.
[19]	YANG H, CHEN Y, LIU K, et al. Dcfee: A document-level chinese financial event extraction system based on automatically labeled training data[C]//Proceedings of ACL 2018, System Demonstrations. Melbourne: Association for Computational Linguistics, 2018: 50-55.
[20]	LIU S, LI Y, ZHANG F, et al. Event detection without triggers[C]//Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). Minnesota: Association for Computational Linguistics, 2019: 735-744.
[21]	XU W, ZHANG W, WANG D. Event detection without trigger words on movie scripts[C]//2020 International Conference on Image, Video Processing and Artificial Intelligence. [S.l.]: SPIE, 2020, 11584: 115841G.

[1]	陈欣, 李闯, 金凡. 量子自注意力神经网络的时间序列预测 . 电子科技大学学报, 2024, 53(1): 110-118. doi: 10.12178/1001-0548.2022340
[2]	要媛媛, 付潇, 杨东瑛, 王洁宁, 郑文. 结合全局信息增强的医学领域命名实体识别研究 . 电子科技大学学报, 2024, 53(): 1-9. doi: 10.12178/1001-0548.2023064
[3]	刘志刚, 张国辉, 高月, 刘苗苗. 多因素引导的行人重识别数据增广方法研究 . 电子科技大学学报, 2024, 53(2): 235-242. doi: 10.12178/1001-0548.2023056
[4]	崔少国, 独潇, 张宜浩. 基于兴趣注意力网络的会话推荐算法 . 电子科技大学学报, 2024, 53(1): 67-75. doi: 10.12178/1001-0548.2022307
[5]	齐鹏文, 李渊, 李岩, 罗龙, 赵云龙. 基于注意力模型的输电线路隐患检测 . 电子科技大学学报, 2023, 52(2): 240-246. doi: 10.12178/1001-0548.2022063
[6]	黄颖, 许剑, 周子祺, 陈树沛, 周帆, 曹晟. 高效长序列水位预测模型的研究与实现 . 电子科技大学学报, 2023, 52(4): 595-601. doi: 10.12178/1001-0548.2022133
[7]	莫太平, 黄巧人, 陈德鸿, 伍锡如, 张向文. 改进可逆缩放网络的图像超分辨率重建 . 电子科技大学学报, 2023, 52(5): 739-746. doi: 10.12178/1001-0548.2022261
[8]	赵云龙, 田生祥, 李岩, 罗龙, 齐鹏文. 基于注意力模型和Soft-NMS的输电线路小目标检测方法 . 电子科技大学学报, 2023, 52(6): 906-914. doi: 10.12178/1001-0548.2022290
[9]	张凤荔, 王雪婷, 王瑞锦, 汤启友, 韩英军. 融合动态图表示和自注意力机制的级联预测模型 . 电子科技大学学报, 2022, 51(1): 83-90. doi: 10.12178/1001-0548.2021100
[10]	王军. 基于多尺度特征预测的异常事件检测 . 电子科技大学学报, 2022, 51(4): 586-591. doi: 10.12178/1001-0548.2021333
[11]	王磊, 孙志成, 王磊, 陈端兵, 蒋家玮. 基于DRSN-CW和LSTM的轴承故障诊断 . 电子科技大学学报, 2022, 51(6): 921-927. doi: 10.12178/1001-0548.2021385
[12]	毛文清, 徐雅斌. 基于深度图卷积网络的社交机器人识别方法 . 电子科技大学学报, 2022, 51(4): 615-622, 629. doi: 10.12178/1001-0548.2021280
[13]	周丰丰, 牛甲昱. 细胞穿膜肽识别问题的多特征融合卷积网络预测算法 . 电子科技大学学报, 2022, 51(4): 494-499. doi: 10.12178/1001-0548.2021391
[14]	郭磊, 王邱龙, 薛伟, 郭济. 基于注意力机制的光线昏暗条件下口罩佩戴检测 . 电子科技大学学报, 2022, 51(1): 123-129. doi: 10.12178/1001-0548.2021222
[15]	葛唯益, 程思伟, 王羽, 徐建. 基于双向门控循环神经网络的事件论元抽取方法 . 电子科技大学学报, 2022, 51(1): 100-107. doi: 10.12178/1001-0548.2021153
[16]	头旦才让, 仁青东主, 尼玛扎西, 于永斌, 邓权芯. 基于改进字节对编码的汉藏机器翻译研究 . 电子科技大学学报, 2021, 50(2): 249-255, 293. doi: 10.12178/1001-0548.2020218
[17]	赵磊, 高联丽, 宋井宽. 面向视觉对话的自适应视觉记忆网络 . 电子科技大学学报, 2021, 50(5): 749-753. doi: 10.12178/1001-0548.2021057
[18]	李学明, 岳贡, 陈光伟. 基于多模态注意力机制的图像理解描述新方法 . 电子科技大学学报, 2020, 49(6): 867-874. doi: 10.12178/1001-0548.2019228
[19]	黄贤英, 杨林枫, 刘小洋, 何道兵, 刘广峰, 阳安志. 社交网络突发事件传播速率模型研究 . 电子科技大学学报, 2019, 48(3): 462-468. doi: 10.3969/j.issn.1001-0548.2019.03.024
[20]	邓钰, 雷航, 李晓瑜, 林奕欧. 用于目标情感分类的多跳注意力深度模型 . 电子科技大学学报, 2019, 48(5): 759-766. doi: 10.3969/j.issn.1001-0548.2019.05.016

点击查看大图

图(4) / 表(6)

计量

文章访问数: 3867
HTML全文浏览量: 1063
PDF下载量: 45
被引次数: 0

全文HTML

事件是重要的信息表现形式，具有典型的类型及模式特征。事件模式体现事件的结构化特征，由事件的角色及其关系构成。不同类型事件在模式特征上有各自的个性特征。事件检测任务识别事件及其类型，主流研究均基于触发词特征完成检测。方法需专业人员对训练语料标注触发词，标注成本高且部分领域难以形成有效的标注标准。

为解决上述问题，本文提出面向事件模式及类型特征的事件检测深度学习模型(pattern and type bias neural network, PTNN)。模型不检测触发词，通过实体的语法、语义特征获取潜在论元，判断其对应角色进行抽象表示，凸显事件模式信息；融合潜在论元的语法、语义及角色特征构建嵌入表示，利用深度学习模型学习事件模式特征及文本语义，并结合事件类型注意力机制实现事件检测。

主要工作如下：

1)以实体类型、依存关系、词性定义论元特征约束，基于论元特征约束抽取潜在论元；

2)以角色抽象潜在论元并进行表示替换，结合语法、语义、角色特征构建词嵌入表示，凸显输入的事件模式信息；

3)使用双向长短时网络(Bi-long short-term memory, Bi-LSTM)及类型注意力机制构建深度学习模型，根据输入的词、句级特征，学习事件模式及特征类型，实现事件检测。

1. 相关工作

事件检测的主流方法为面向触发词的检测，包括基于特征的方法和基于表示的方法。基于特征的方法以触发词统计特性为依据，定义特征建模触发词。常用特征包括词法、句法特征、篇章信息及外部知识等^[1-8]。特征构建耗时耗力，效果一般且不稳定。基于表示的方法为目前主流方法，其利用标注触发词的训练语料，学习输入的高维特征实现触发词识别^[9-14]。虽避免了人工构建特征，但语料需专业人员标注，具有触发词标准难以制定、标注成本高等问题，且同一词语可触发多类事件的问题未很好解决。

而事件论元、模式等特征同样体现事件本质，因此许多研究从这些特征入手。部分研究从事件实例出发，利用同类事件在实体组成、语句结构上的相似性进行事件检测。文献[15]基于相同事件拥有相似实体的假设，根据实体元素对文本聚类，得到若干事件簇实现面向开放域的事件检测。方法避免了触发词标注，但无法给出事件簇对应的具体类型，得到的结果是若干关键词，无法用于后续任务。文献[16]以实体和其类型构建“槽值对”，基于同类事件具有相似“槽值对”集的假设分析事件类型与槽值对的关联。方法一定程度上实现了类型判定，但“槽值对”不能全面体现事件框架特征，对部分事件区分度较低。部分研究根据不同类型事件在实体、模式上的差别，预先定义事件表示框架实现事件检测。文献[17]结合事件的5W1H分析法，定义7种突发事件类型的事件框架，抽取突发事件用于公共安全预警；相似研究在科技、金融等领域也取得了一定成果^[18-19]。该类方法结合远程监督可自动生成标注数据，解决了语料标注困难的问题。但事件框架表示结构复杂，严重依赖专家知识，且不同领域和任务需要不同的表示框架，重复定义工作量大。文献[20]提出了基于实体的TBNNAM模型。其以实体为原始特征构建输入，使用LSTM与基于类型的注意力完成事件识别。但该方法仅利用了实体信息，没有考虑事件模式特征，且只利用了单向语义信息。文献[21]结合Bi-LSTM与基于类型的多层多头注意力，基于词向量生成长文本的向量表示，识别电影剧本是否包含指定类型事件。但其关注目标为文档级事件，弱化了细粒度事件的识别和判定。