EDM3:事件检测作为多任务文本生成
本研究基于用户评论、文本会话和电话会话等多种非正式、异构数据,提出了一个大规模的汉语事件检测数据集,并通过实验证明了非正式和异构数据的挑战性,为多源非正式事件检测提供了新的探索。
Nov, 2022
提出知识为基础的少样本事件检测方法来解决在实际应用中缺乏正确标记数据的问题,并引入自适应知识增强贝叶斯元学习方法来动态地调整事件类型的知识先验。实验结果表明,在相同的少样本条件下,该方法在至少 15 个绝对 F1 点上一致且显著地优于多个基准线。
May, 2021
本文提出了一种基于 Derangement 机制的机器阅读理解框架的无触发词事件检测方法,通过与所有事件类型 token 进行拼接并设计简单而有效的事件混淆模块来解决多标记分类、线索不足和事件分布不均衡等挑战。实验结果表明,该模型表现出色,并在低资源事件检测方面具有强大的性能。
Aug, 2022
本文提出了一种无触发词的事件检测模型,通过阅读理解和提示学习将事件检测转化为两个塔模型,在 ACE2005 和 MAVEN 的两个事件检测基准数据集上,实验结果表明,与现有的基于触发词和无触发词的方法相比,所提出的方法可以取得竞争性的性能。
Jun, 2023
通过研究零样本事件检测中的事件类型和定义,提出了使用多样化的事件类型和定义来提高模型遵循事件定义的方法,并构建了一个自动生成的多样化事件定义(DivED)数据集进行实证研究,结果显示,大量的事件类型和多样化的事件定义可以显著提升事件提取性能,同时在训练中引入事件本体信息和困难负样本可以进一步提高性能,基于这些发现,在 DivED 数据集上微调 LLaMA-2-7B 模型,在三个零样本事件检测基准上取得了超越 GPT-3.5 等最新大语言模型的性能。
Mar, 2024
本论文提出了一个交互式易于使用的工具 ——ED Explorer,用于探索 Event Detection(ED)数据集和模型,帮助领域专家和非专家更好地理解 ED 任务并优化 MAVEN 数据集。
Apr, 2022
本研究介绍了一个新的大规模多语言数据集 MINION,用于事件检测 (Event Detection),提供了 8 种不同语言的事件注释,其中有 5 种语言并未在现有的多语言数据集中支持。该数据集的实验和分析表明,事件检测在不同语言中存在挑战和可转移性,需要更多的研究努力。
Nov, 2022
本研究利用少量标记数据,提出了一种基于动态存储器网络的原型网络模型,通过多次跳转机制实现了更精确的事件原型和更丰富的句子编码,能够在事件类型繁多、样本数量极少的情况下更好地解析事件,并在实验中表现优于基线模型。
Oct, 2019
提出了将事件分段作为辅助任务以改善子事件检测学习的方法,并采用整流网络进行约束学习,并将学习到的约束转换为神经模型的损失函数中的正则化项,实验结果表明,该方法在子事件检测中比基准方法分别提高了 2.3%和 2.5%的性能,同时在事件分割预测方面表现良好。
Sep, 2021
本研究提出了一种包含 4480 份维基百科文件、118732 次事件提及实例和 168 种事件类型的 MAVEN 数据集,用于缓解数据不足和低覆盖率等问题,实证分析了通用领域事件检测中的进一步研究方向,并表明现有的事件检测方法不能像小规模数据集中表现出的那样在 MAVEN 上表现出色,说明其在现实世界中仍然是具有挑战性的任务,需要进一步的研究和努力。
Apr, 2020