Mar, 2024

使用多任务学习的开放知识库规范化

TL;DR构建大型开放知识库(OKBs)对于许多知识驱动的 Web 应用程序(如 Web 搜索)至关重要。然而,OKBs 中的名词短语和关系短语常常存在冗余和歧义,因此需要研究 OKB 规范化。本文提出了一种名为 MulCanon 的多任务学习框架,用于解决 OKB 规范化问题,并通过扩散模型在软聚类过程中改进名词短语的表示,以获得更准确的表示。MulCanon 统一了这些子任务的学习目标,并采用两阶段多任务学习范式进行训练。对知名 OKB 规范化基准的彻底实验研究验证了 MulCanon 能够实现具有竞争力的规范化结果。