- EMNLPReasonBERT: 远监督下预训练推理模型
该论文提出了一种名为 ReasonBert 的预训练模型方法,通过远程监督的方法自动连接文本和表格,并模拟多种类型的推理来增强长距离关系和混合上下文的能力。并在包括单跳、多跳、文本、表格、混合数据集的多个问题回答数据集上进行了全面评估,表现 - ACL通过负样本训练进行句子级远程关系抽取
本文提出了一种远程关系抽取的句子级框架,其中包括使用负面训练(NT)对数据集进行清洗和重新标记。
实验结果表明,该方法在句子级别评价和去噪效果上显著优于先前方法。
- ACL面向远程监督关系抽取的对比实例学习框架
本文提出了一种新的对比实例学习框架,用于减少远程监督生成的训练数据中的噪声。与传统的多实例学习框架不同,该框架将初步多实例学习作为关系三元组编码器,并针对每个实例的正负对进行限制,实验证明该方法在 NYT10、GDS 和 KBP 上较以前的 - AAAI基于超几何概率模型的远程监督命名实体识别去噪
本文提出了基于超几何学习的远程监督 NER 去噪算法,该算法考虑了噪声分布和实例级置信度,进行神经网络训练。实验证明,HGL 方法能有效去噪并在训练模型方面取得显著的提升。
- ACL通过因果干预对远程监督命名实体识别进行去偏置化处理
该论文通过结构因果模型对 DS-NER 中的词典偏差进行解释和分类,并提出了一种基于因果干预的去除偏差的方法,包括通过后门调整和因果不变正则化器来提高模型鲁棒性,实验证明该方法显著提高了 DS-NER 的性能。
- 基于证据的事实错误校正
本文介绍了事实错误校正的任务和方法:通过编辑要求以便生成的改写通过证据更好地支持。使用 T5 Transformer 基于远程监督的方法,通过将证据合并到掩码声明中来训练事实错误校正系统。在一个基于最近事实验证共享任务的数据集上进行评估,结 - 重新审视远程监督关系抽取的负数据
本文提出了一种名为 ReRe 的管道方法,通过句子级别的关系检测和主谓对象提取来实现样本有效训练,将关系抽取问题转化为正无标记学习任务,缓解了负样本引起的误差问题,实验结果表明,该方法能够持续超越现有方法并且即使在学习大量的假阳性样本时仍保 - ACLLaTeX-Numeric: 面向电商数字属性的语言无关文本属性提取
本文提出了 LaTeX-Numeric,用于从产品文本(例如产品描述)中提取电子商务数值属性的高精度全自动可扩展框架。该框架通过远程监督进行训练数据生成,摆脱了手动标签的依赖,并提出了一种多任务学习架构来处理训练数据中的缺失标签,从而提高了 - ACLSpartQA:面向空间推理的文本问答基准
本文提出了一个自然语言文本中空间推理的问答基准,其中包含更现实的空间现象,并且挑战最先进的语言模型。我们提出了一种远距离监督方法来改善这个任务。具体来说,我们设计语法和推理规则来自动生成视觉场景的空间描述和相应的问答配对。实验证明,进一步预 - ICCV场景图生成的视觉远程监督
本文提出了一种视觉远程监督的场景图生成方法,该方法可以在无需人工标注的情况下训练场景图模型,并且进一步通过半监督的方法与人工标注的数据相结合,取得了比现有全监督模型更好的效果。
- ICLRANEA: 低资源 命名实体识别的远程监督方法
本文介绍了一个名为 ANEA 的工具,它基于实体列表自动注释文本中的命名实体,并通过调整提高自动注释的质量,进而实现对于少量手工标注数据的低资源场景下的弱监督学习,实验结果表明使用 ANEA 获得的弱监督数据可以在 6 个低资源场景中平均提 - 通过 BERT 基于标签和实例嵌入来提高远程监督关系抽取
提出 REDSandT (一种使用远程监督和转换器的关系抽取方法),通过利用 BERT 的预训练模型和标签与实体之间的关系,以高度信息的实例和标签嵌入来捕获更广泛的关系,并通过标签嵌入作为注意机制以进一步减少噪声,最终通过将关系和实例嵌入连 - AAAI分析逼真嘈杂标签数据的噪声模型误差
本文通过研究嘈杂标注的误差建模,提出了一种理论上的噪声模型误差估计方法,并提供了用于评估不同噪声级别的 NoisyNER 数据集,这一研究旨在探索影响噪声模型估计的因素,包括噪声分布和抽样技术。
- ACL基于证据的事实错误修正
本文介绍了一个新的任务:事实错误纠正。通过将证据整合到掩码声明中进行更正,学习纠正事实错误的系统。本文中提出了一个基于 T5 变压器的两阶段远程监督方法,通过检索证据获得更好的结果,从而取得了更好的性能,并通过人类评估证明了其有效性。
- AAAI远程监督下非单调推理的理性化学习
研究如何使用先前经过训练的语言模型、神经知识模型和相关任务的远程监督等,通过训练生成解释原因的生成模型来推断自然语言解释。然而,结果表明,由于神经语言模型的基本限制,该模型生成的解释仅限于具有普遍性的陈述,而在进行推理的同时预测更新或其类型 - COLING基于事件引导的去噪多语种关系学习
该论文提出了一种新的方法,利用大规模无标签文本中可预测的分布式数据结构从而构建了一个去噪的语料库,该方法通过远成本的监督技术以少量的样本数训练出了类似于 Soares 等人的零样本和少样本结果,该技术通过小型的多语言编码器在英语和西班牙语的 - COLING利用远程监督与人工标注的双重监督框架进行关系提取
本研究提出了一种双重监督框架,旨在有效利用人工标注数据和远程监督数据来训练关系抽取模型,以应对不同类型的监督数据。该模型采用两种不同的预测网络,分别用于预测人工标注和远程监督标签,并引入不一致性惩罚机制进行优化,实现了更高的抽取精度。
- EMNLP文档级远程监督下的去噪关系抽取
本研究提出了一种基于预训练模型的方法,用于减少文档级别关系抽取中由远程监督产生的噪声。实验结果表明,该方法能够从噪声数据中捕获有用的信息,取得了良好的效果。
- COLINGWSL-DS: 面向查询的多文档抽象摘要的弱监督学习与远程监督
本文通过利用远程监督的方法来进行弱监督学习,使用类似于目标数据集的数据作为训练数据,借助预训练的句子相似度模型生成每个文档的弱参考摘要,进而在多篇文档中逐一确定单篇文档的摘要,最终在 DUC 数据集上以多种评价指标居于业内领先水平。
- 利用远程监督进行神经关系分类的元学习
该论文提出了一种基于元学习的方法来重新加权具有噪声标签的训练数据,以选择更可靠的训练实例,并利用动态提取的可靠精英实例扩充手工标注的参考数据,从而在关系分类方面取得了领先的性能。