本研究旨在探讨 NLP 中的 hypernymy detection 问题,提出两种数据扩增技术和两种扩增数据集的策略,通过对 3 种数据集和 2 种向量空间的评估表明,这些方法显著提高了分类器的性能。
May, 2020
本文通过实证研究,对比了对知识图谱中实体之间关系进行无监督学习的四种嵌入模型( escal,TransE,DistMult 和 ComplEX)使用不同负采样方法的效果,结果发现使用不同负采样方法得到的效果差异较大,且在不同数据集上表现也各有不同。
Aug, 2017
本文提出了一种简单直接的方法,通过选择与所有正样本相似度高的负样本来训练,以提高四个远程监督 NER 数据集的性能表现,并且分析表明有必要区分真负样本和假负样本。
May, 2023
本文提出了一种名为 ReRe 的管道方法,通过句子级别的关系检测和主谓对象提取来实现样本有效训练,将关系抽取问题转化为正无标记学习任务,缓解了负样本引起的误差问题,实验结果表明,该方法能够持续超越现有方法并且即使在学习大量的假阳性样本时仍保持良好的性能。
May, 2021
通过引入负实例并采用分层匹配算法,本研究在大型语言模型上实现了对命名实体识别任务的改进,提出了改进的零样本性能的生成式 NER 系统 GNER。
Feb, 2024
本文介绍了一种基于卷积神经网络学习最短依赖路径的有关句子中主语和宾语关系的语法特征,结合简单的负采样策略,在 SemEval-2010 Task 8 数据集上具有比现有方法更好的表现。
Jun, 2015
使用否定例子训练神经语言模型,通过添加边际损失增强模型对特定句法结构的鲁棒性表现,研究发现适当使用否定例子提高模型的鲁棒性,具有可行性,但是该方法在处理宾语从句时还存在困难。
Apr, 2020
该研究讨论了无监督学习中噪声对比学习的技术以及负样本的数量对其效果的影响,包括从理论和实践两个层面考察了负样本在 NLP 和视觉领域中的作用和效果。
Jun, 2021
通过深度度量学习进行后处理可以提高神经语言模型中语义相似度推断的效果,并将层次拟合用于建模 IS-A 层次中的语义相似性细微差别。
Oct, 2022
该论文提出了一种新颖的方法,使用强化学习来决定句子是否与给定关系相关,借助正 / 无标签学习,该方法全面利用未标记实例,并提出了两种新的正 / 无标签包表示形式,将这两种表示形式以合适的方式组合来进行包级别的预测。实验结果显示,与几个竞争性基线相比,该新方法显着而一致地提高了性能。
Nov, 2019