GLiREL -- 通用模型用于零样本关系提取
我们提出了 FewRel 数据集,其中包含来自维基百科的100种关系中的70,000个句子,这些句子由群众工作者进行注释。我们针对关系分类采用了最新的Few-Shot Learning方法,并对这些方法进行了全面的评估。实证结果表明,即使是最具竞争力的少样本学习模型也很难完成此任务,这表明 Few-Shot Learning在关系分类方面仍然存在着问题,需要进一步的研究。
Oct, 2018
本文提出了一种使用图神经网络技术,实现从之前未见过的模板中提取出信息的“零样本”关系提取模型,并在实验中证明该方法相较于基础模型有31%的F1值提升。
May, 2020
通过转换为推论任务并且使用预训练的文本推论引擎,我们能够减少标注大量实例所需的成本,实验结果表明,我们的方法在少量示例情况下可达到更好的性能。
Sep, 2021
本文介绍了Zero-RTE任务及其解决方案——使用结构化的提示模板来生成合成关系样本,并使用三元组搜寻解码方法来克服在句子中提取多个关系三元组的限制。实验表明,RelationPrompt对于Zero-RTE任务和零样本关系分类非常有效。
Mar, 2022
本论文提出了一种构建层次化n-gram的零样本链接预测框架,通过使用字符n-gram的依赖关系来跨越已知和未知关系之间的差距,获得了两个零样本链接预测数据集上的最先进成果。
Apr, 2022
该研究主要针对零样本关系提取中的语义匹配问题,通过设计一种细粒度语义匹配方法,将句子级相似度分成实体和语境匹配分数,并通过特征蒸馏模块自适应识别与关系无关的特征,从而提高匹配率和推理速度。
Jun, 2023
该研究提出了一种名为Zshot的新型零样本学习(ZSL)框架,旨在解决ZSL面临的挑战,为研究人员提供一个平台,允许他们在标准基准数据集上比较不同先进的ZSL方法,并且还支持工业界提供可用的API,用于在标准SpaCy NLP流程中进行生产。
Jul, 2023
当给定少量标记数据时,零样本学习方法可以利用外部信息(例如文本描述)来对输入文本数据进行实体和关系分类。然而,最近的研究表明这些方法对提供的实体(或关系)描述非常敏感,即使描述的微小修改也可能导致决策边界的变化。本文正式定义了识别零样本推断中有效描述的问题,并提出一种生成初始描述变体的策略、对它们进行排序的启发式方法以及一种能够通过描述增强来提升零样本模型预测效果的集成方法。实验结果表明,我们提出的方法在四个不同的实体和关系分类数据集上优于现有方法,并在零样本学习设置下实现了新的最先进结果。所提出解决方案的源代码和评估框架已经开源。
Jun, 2024
通过使用虚拟实体匹配来降低手工注释成本,并结合粗粒度召回和细粒度分类的多颗粒度匹配方法,我们的研究在零样本关系抽取任务中在推理效率和预测准确性之间取得了平衡,超越了先前的最先进方法。
Jun, 2024