本文提出了一种名为 MetaSRE 的方法,通过生成质量评估对伪标签进行元学习来降低噪声,同时采用伪标签选择和利用方案,仅以自我训练的方式利用高质量伪标签逐步增加标记样本以提高鲁棒性和准确性。在两个公共数据集上的实验结果表明了所提出方法的有效性。
Oct, 2020
本文介绍了一种基于图的半监督学习方法,利用单词之间的形态、句法和语义关系,从种子集合自动构建广覆盖的词汇表。该方法不受语言约束,可用于 11 种语言,并可通过提供的自动创建词汇表提高词汇标记和依存解析的性能。
Dec, 2015
关系抽取是一种从网络上挖掘人类知识的高效方式,本文提出了一种名为 GraphScholarBERT 的开放领域信息抽取方法,它能够从半结构化的网页中提取目标关系,并能在未见过的领域中进行泛化,无需额外数据或训练,并且与搜索关键词完全匹配。实验证明,GraphScholarBERT 在零射击域和零射击网站情境下,相比以往的方法,可以提高抽取的 F1 分数达 34.8%。
Feb, 2024
本文提出了一种基于元学习的半监督学习方法,将有标签和无标签数据的相似度转化为对应的语义相似度,并通过自监督学习的方法实现了对有标签数据的更新。实验证明该方法较之传统方法更为有效。
Aug, 2020
本文提出 DualRE,使用弱监督技术结合自我训练机制和多视图学习方法,在关系抽取任务中通过检索模块与原始关系预测模型的联合训练来提高模型的性能表现。实验结果表明,该方法有效地提高了模型的性能表现。
Feb, 2019
本文针对关系网络中的半监督学习问题提出了两种可扩展的方法,可以更好地处理链接多样性和分类异质性等图结构异质性,相比于现有算法,我们的方法在不需要先验知识的情况下提供更好的分类性能。
Dec, 2016
本文提出了一个基于图结构的半监督学习的生成框架,通过逼近节点特征,标签和图结构的联合分布,使用可扩展的变分推断技术来推断缺失的标签,并在基准数据集上进行了全面的实验,结果表明该方法在大多数设置中优于现有的最先进模型。
May, 2019
提出一种无需实体级别监督的实体链接和关系抽取模型,避免了流水线方法中产生的级联错误,并在两个生物医学数据集上优于最先进的实体链接和关系抽取流水线,极大地提高了系统的总体召回率。
Dec, 2019
本文研究了使用引文图来提高科学论文摘要生成的质量,提出了两种方法:为任务提供简单而低成本的多粒度无监督摘要生成方法 (MUS),以及对大量标记数据具有更准确结果的基于图的监督摘要方法 (GSS),并在公共基准数据集上进行了实验验证以证明方法的有效性。
Dec, 2022
本文提出了一种新方法,将知识图谱作为先验知识,通过机器学习、图匹配和修改频繁子图挖掘来语义注释结构化数据源。我们的评估显示,在只知道少量语义模型的棘手情况下,我们的方法优于两种最先进的解决方案。