论文笔记:Span-Based Event Coreference Resolution_期待成功的博客-程序员宅基地

技术标签: 笔记  自然语言处理  

作  者:崔金满

单位:燕山大学

论文地址:https://www.aaai.org/AAAI21Papers/AAAI-9086.LJ.pdf 

数据集:KBP 2016和KBP 2017

来源:AAAI 2021


问题定义:

文档内事件共指解析任务是确定文档中提到的哪个事件指的是同一个真实世界的事件;

比如论文中的例子:昨天,德里警方扇了示威者一把掌(v_1),当她在医院外示威(v_2)时,几乎与此同时,在印度北部的另一场抗议(v_4)活动中,一名60多岁的妇女被警方殴打致死(v_3),到目前为止,德里警方已经暂停了殴打(v_5)女抗议者的警察的职务。

在这个例子中共有5个事件提及,其中,v_1v_3v_5属于Attack类型,但是,只有v_1v_5是共指的,因为v_3发生在一次不同的抗议活动中。此外v_2v_4也不是共指的,因为它们指的是不同的抗议事件。

问题驱动:

1.基于span的实体共指消解模型已经取得很好的效果,那么扩展到事件共指消解的基于span的模型的性能如何?

(与实体提及不同,事件提及不仅由事件元素组成,还由元素在事件中扮演的角色组成。因此,确定两个事件提及是否共指,不仅需要对应的事件类型相同,而且还需要它们对应元素的共指的。也就是说事件共指在很大程度上取决于触发词出现的上下文,所以需要考虑基于span的模型能否有效学习基于上下文嵌入的信息。)

2.可以利用cross-task一致性约束来改进基于span的事件共指模型吗?

(基于span的模型有可能假设两个具有不同事件子类型的事件提及是共指的。)

3.实体共指信息能有利于事件共指解析吗?

贡献:

1.研究了基于span的模型在事件共指消解中的应用。

2.cross-task一致性约束和实体共指信息在基于span的事件共指消解2中的作用

Model:

span-based模型联合学习事件触发器检测和事件共指解析两个任务;

其中,事件触发器检测的目的是检测span i指定一个子类型y_i,事件共指解析任务旨在为span i分配一个先行词,然后计算共指得分。模型结构如图所示:

模型结构:

1.Span Representation Layer:

通过SpanBERT-large对单词序列进行编码,首先将span表示为g_i=[h_{start(i)};h_{end(i)};h_{head(i)};f_i],其中h_{start(i)}h_{end(i)}分别表示span的start和end tokes的隐藏向量,h_{head(i)}是基于注意力的头向量,f_i是span宽度的特征嵌入。然后通过前馈神经网络,保留span的用于前N%进一步处理,s_m(i)=w_m\cdot FFNN_m(g_i)

2.Trigger Prediction Layer:

将表示层的输出g_i输入到FFNN,输出span属于事件子类型y的可能性

 

3.Coreference Prediction Layer:

为预测事件共指链接,首先计算span ij之间的平均得分。

 

Incorporating Consistency Constraints:

为了探索事件检测和事件共指的一致性约束,在baseline模型中加入以下一致性约束:

 P1:如果两个span没有相同的事件子类型,则它们不是共指的;

P2:如果一个span的事件子类型为“无”,那么它的先行词必须是虚拟的。

由于在任何情况下都不应该违反这两个条件,所以将其作为硬约束来实施,但在实践中,这些是在有噪声的输出上计算的,所以为了将它们作为软约束来实施,将约束损失乘以一个超参数,从而控制当违反约束时,模型受惩罚程度。

Exploiting Entity Coreference Information:

1.pipeline:首先,实体共指模型计算给定文档中实体提及的实体共指链,然后将其作为输入,输入到事件共指模型,实现事件共指解析。

其中,左侧为实体共指模型,右侧为事件共指模型,除了事件共指模型将实体共指作为附加输入外,两者在结构上是相同的。

在事件共指解析过程中,可以在实体共指和事件共指之间创建额外的交叉表约束,从而实现实体共指链的利用。

2.Joint Model:

优点在于与pipeline相比,joint可以实现参数共享

实验: 

 

从表中结果来看,本文提出的方法取得了很好的效果,且事件检测的性能对事件共指解析具有重要影响,原因在于当触发器被分类为正确的事件子类型是,事件共指解析正确的可能性也就越高。 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u011150266/article/details/117223994

智能推荐

Android 面试之必问Android基础,2021最新Android面经分享_普通网友的博客-程序员宅基地

Standard:标准模式,也是默认模式。每次启动都会创建一个全新的实例。SingleTop:栈顶复用模式。这种模式下如果Activity位于栈顶,不会新建实例。onNewIntent会被调用,接收新的请求信息,不会再低啊用onCreate和onStart。SingleTask:栈内复用模式。升级版singleTop,如果栈内有实例,则复用,并会将该实例之上的Activity全部清除。SingleInstance:系统会为它创建一个单独的任务栈,并且这个实例独立运行在一个 task中,..

Windows系统下安装分布式事务seata服务端,配置中心使用nacos_My--Style的博客-程序员宅基地

官网下载地址:Releases · seata/seata · GitHub这里我下载的是1.2版本然后进行解压压缩包解压后里面文件目录如下进入配置文件conf默认目录如下修改registry.conf 为如下,这里没有用的配置删除了,只留nacos的配置了;代码如下:registry { # file 、nacos 、eureka、redis、zk、consul、etcd3、sofa type = "nacos" naco...

掼蛋经验总结_weixin_34092370的博客-程序员宅基地

掼蛋经验总结:    “掼蛋打的好,说明有头脑;掼蛋打的精,说明思路清”, 掼蛋是一个非常有意思的较量智力的扑克游戏,非常讲究团队精神、搏杀技术,需要有审时度势的能力。一、开局阶段        开局阶段非常重要,开局不顺,满盘皆输。开局阶段能够体现出一个玩家思路是否清晰,作战方针是否明确。1.拿到牌后首先要做的事情就是审局,看下手中牌有几个轮次,有几个炸弹,哪些牌能够或者必须顺过...

2021年流动式起重机司机考试及流动式起重机司机考试题库_weixin_47565892的博客-程序员宅基地

题库来源:安全生产模拟考试一点通公众号小程序安全生产模拟考试一点通:流动式起重机司机考试参考答案及流动式起重机司机考试试题解析是安全生产模拟考试一点通题库老师及流动式起重机司机操作证已考过的学员汇总,相对有效帮助流动式起重机司机考试题库学员顺利通过考试。1、【多选题】金属材料常见的基本变形有:( )。( ABCD )A、拉伸B、弯曲C、压缩D、剪切2、【多选题】保护继电器中有( )继电器。( AD )A、过电流B、时间C、中间D、热3、【多选题】过电流保护用的电器有:( )。

jsp 包含jsp(引用)两种方式_spring123tt的博客-程序员宅基地_jsp引用

我们都知道在jsp中include有两种形式,分别是    前者是指令元素、后者是行为元素。具体它们将在何处用?如何用及它们有什么区别?这应该是很多人看到它都会想到的问题。下面一起来看看吧。    通常当应用程序中所有的页面的某些部分(例如标题、页脚和导航栏)都相同的时候,我们就可以考虑用include。具体在哪些时候用,哪些时候用.这种形式。首先要明白的是它们之间的区别。

爬虫学习笔记13-scrapy模拟登陆_陈弟弟的博客-程序员宅基地

1、之前用过的模拟登陆方法(1)request模块模拟登陆①直接携带cookies请求页面②找url地址,发送post(携带登陆用户账号和密码)请求存储cookie(2)selenium模拟登陆找到对应的input标签,输入文本点击登陆2、scrapy框架模拟登陆(1)直接携带cookies(需要先登录上GitHub)1)适用场景①cookie过期时间很长,常见于一些不规范的网站②能在cookie过期之前把所有的数据拿到③配合其他程序使用,比如其使用selenium把登陆之后的cook

随便推点

spring中controller service怎么调用的_想知道Spring配置中的占位符是怎么处理的吗_weixin_39986060的博客-程序员宅基地

前言之前我们在分析Spring别名配置的时候里面有一个配置用到了Spring的占位符配置,那这一篇我们先针对别名的占位符处理来做个简单的分析。示例<beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" ...

HAUTOJ 玲珑杯 1269: 爱看电视的LsF(暴力)_scx_white的博客-程序员宅基地

1269: 爱看电视的LsF 时间限制: 1 秒 内存限制: 64 MB 提交: 312 解决: 77 提交 状态 题目描述LsF(刘师傅)非常喜欢看电视! 不幸的是,遥控器上的一些数字按钮坏了。 但他灵光一闪,如果他不能直接输入他想要看到的频道的号码,那么他可以先输入其他号码,再通过按下按钮+ 和- (这两个按钮由24K钛合金制成,永远不会坏)的方式到达所需的频道。 按钮+将数字增

python蒙特卡洛计算曲线面积_java小程序 蒙特卡洛算曲线面积_weixin_39922476的博客-程序员宅基地

importjavax.swing.*;importjava.awt.*;importjava.awt.event.*;importjavax.swing.BoxLayout;importjavax.swing.JPanel;importjava.util.Random;publicclassJmCalculateextendsFrameimplementsActionLi...

Kubernetes安装_虹科云科技的博客-程序员宅基地

k8s环境配置首先准备三台虚拟机,配置为CentOS7,4G内存,每个虚拟机两块硬盘各20G,安装Docker,管理节点能免密登录工作节点。然后三台虚拟机关闭防火墙、iptables、SELinux systemctl stop firewalld systemctl disable firewalld vi /etc/sysconfig/selinux SELINUX=disabeld然后重启使配置生效然后把彼此的hosts表填写完整,例如测试一下虚拟机的网络

c语言数据类型存储类型,C语言数据类型、存储类型_小仙女挠痒痒的博客-程序员宅基地

《C语言数据类型、存储类型》由会员分享,可在线阅读,更多相关《C语言数据类型、存储类型(5页珍藏版)》请在人人文库网上搜索。1、一、数据类型基本类型:int、char、int、float、double构造类型:数组(一维数组、二维数组、指针数组、函数指针数组、结构体数组)、结构体、共用体指针:一维指针、二维指针、数组指针、函数指针、结构体指针空类型:void,该类型也叫缺省型,用于描述值为空集,主...

python绘制直方图显示数字_Python实现绘制双柱状图并显示数值功能示例_weixin_39943383的博客-程序员宅基地

本文实例讲述了Python实现绘制双柱状图并显示数值功能。分享给大家供大家参考,具体如下:# -*- coding:utf-8 -*-#! python3import matplotlib.pyplot as pltimport mpl_toolkits.mplot3d#定义函数来显示柱状上的数值def autolabel(rects):for rect in rects:height = rec...