- Radar de Parité:一种测量法国新闻报道中性别再现的 NLP 系统
本研究介绍了雷达德帕里特(Radar de Parité)系统,一个自动的自然语言处理系统,用来测量六个加拿大的法语媒体每日引用的男女比例。我们详细介绍了该系统的架构,并阐述了我们解决法语特定问题,特别是关于核指代消解的挑战,这对法语的自然 - BenCoref:一个多领域物词短语和代词指代注释数据集
本文介绍了一个新的,包含孟加拉语文本核指标注的数据集 BenCoref,并对使用 BenCoref 训练的多种模型进行了评估。该文指出文本领域的变化对孟加拉语核指现象产生了影响,并强调了更多特定语言资源的需要。
- 探究共指消解模型无法推广的原因
该研究探讨了当前代表性的共指消解模型中的误差与不同数据集、核心共指类型的操作方式有关的程度,并对现有模型在各种共指类型下的表现进行了分类,结果表明在不同共指类型下的表现存在差异,这可以为未来的核心共指解析模型开发提供参考。
- ACL评估和改进机器翻译模型的指代消解能力
本文评估了机器翻译 (MT) 模型从隐含信号中学习共指消解的能力,并探究了如何将共指消解模型的输出整合到 MT 模型中以提高翻译质量。研究结果表明,单语共指消解模型的性能远远优于 MT 模型。
- ACL通过性别不明确的代词进行反事实偏见评估的计数器
本文提出了一种新的方法通过反事实生成来收集多样性,自然性和最小距离的文本对,并构建了一个由 4008 个实例分成 1002 个四重组成的 Counter-GAP 注释数据集,以评估语言模型在固指消解中的性别偏见问题。作者使用四重组级别指标解 - ACLAmbiCoref:评估人类和模型对模糊指代的敏感性
通过构建一个名为 AmbiCoref 的语料库,将人类对于可替代性语言的理解问题推广至基于现代核心指代解析模型,分析展示了人类理解遇到歧义情况时的表现,以及现代解析模型处理歧义情况时的表现,最终将 AmbiCoref 作为一个测试工具发布出 - SMDDH: 使用深度学习在印地文文本中进行单例提及检测
提出一种基于全连接网络和卷积神经网络的单一提及检测模块,采用手工制作的特征、上下文信息和词嵌入,应用于使用核指代注释的包括 3.6K 个句子和 78K 个标记的印地语数据集,显著提高了核指代解析过程的性能表现。
- 基于 Actor-Critic 学习的混合规则 - 神经共引消解系统
本文提出了基于演员 - 评论家学习的混合规则 - 神经共指消解系统,它通过利用启发式规则和神经共指消解模型的优点来实现更好的共指性能。此端到端系统还可以通过使用联合训练算法执行提及检测和消解,并使用 BERT 模型生成输入跨度表示。我们的模 - 图像叙述中的共指消解
本文提出了一个使用弱监督技术的解析图片故事中指代关系的新技术,建立了包含核心链的图像文本数据集,并证明了该技术对提高图像叙事的效果。
- 基于 Seq2Seq 转移系统的指代消解
本文提出一种基于文本到文本 (seq2seq) 模式的指代消解系统,它使用转移系统来预测提及和链接,使用多语言 T5 作为底层语言模型,在 CoNLL-2012 数据集上获得了 83.3 的 F1-score,远高于之前的最优结果;在 Se - mOKB6:一个多语言的开放知识库完整性评测基准
利用跨语言的开放信息提取的最新进展,通过多语言代词消解和保留仅有实体链接三组,构建了第一个含有六种语言的全面的开放式知识库 (mOKB6),并通过基线模型的实验进行分析。
- 一种混合实体中心方法用于波斯语代词消解
本文提出了一种混合模型,通过将多个基于规则的筛子与针对代词的机器学习筛子相结合,解决了代词消解的挑战。该方法在 400 个文档的波斯语语言语料库中蕴含着出色的性能,并通过与先前模型的比较证明了其有效性。
- 英波斯语内指消解综述
该研究综述了核指消解领域的现有语料库和评估指标,提供了基于规则的方法到最新的深度学习技术的核指算法概述,并调查了波斯语的核指消解和代词消解系统。
- EMNLP他说她说:对话视角转换的风格转移
本文定义了一个新的风格转移任务:视角转换,展示了如何利用该任务提高对话纵观述和新闻摘要模型的性能。
- 探究中心理论在神经语义消歧系统中的作用
本文探讨了中心原理(CT)与现代指称消解系统之间的关系,并提供了中心的操作性定义。信息熵分析表明,指称消解与中心原理之间存在正相关依赖关系,但高质量的神经指称消解器对中心概念的显式建模没有太多好处。结果表明,语境化嵌入包含了很多一致性信息, - 阿拉伯语中零指代和非零指代的联合共指消解
本文提出了两种用于联合解析阿拉伯语中无指代的零代词和非零代词的架构,并在此基础上进行评估,同时创建了一个新版本的阿拉伯语子集的共指解析数据集。
- 仅提及注释即可实现指代消解的高效域适应
本文探讨了利用提及检测在目标域中进行兼容性适应的方法来提高神经网络核心指称分辨率的效率,取得了 7-14%的通过提及注释来提高核心指称分辨率的平均 F1 值的改进。
- 端到端多语言指代消解与提及头预测
本文介绍了我们在 CRAC 2022 共享任务中用于多语言指代消解的方法,我们使用了最先进的端到端指代消解系统并进行了多语言联合训练,同时加入了头部预测和依赖信息集成,最终系统取得了第三名并且在其中两个数据集上表现最佳。
- 多语言指代消解共享任务的发现
本文概述了 CRAC 2022 研讨会上多语种共指消解任务的概况,采用公共数据集 CorefUD 1.0 为训练和评估数据,使用 CoNLL 得分作为主要评估指标,并比较了多个系统和竞争基线系统,获胜者系统的表现优于竞争基线 12 个百分点 - ACLF-coref: 快速、准确、易于使用的共指消解
本研究介绍了 fastcoref,一个快速、准确、易于使用的英语指代消解 Python 包。它包含两种模式:一种是基于 LingMess 架构的准确模式,提供最新的指代消解精度;另一种是本文关注的更快速的模型 F-coref。F-coref