Feb, 2024

结合语言和图模型进行 Web 上的半结构化信息提取

TL;DR关系抽取是一种从网络上挖掘人类知识的高效方式,本文提出了一种名为 GraphScholarBERT 的开放领域信息抽取方法,它能够从半结构化的网页中提取目标关系,并能在未见过的领域中进行泛化,无需额外数据或训练,并且与搜索关键词完全匹配。实验证明,GraphScholarBERT 在零射击域和零射击网站情境下,相比以往的方法,可以提高抽取的 F1 分数达 34.8%。