Jan, 2024

知识库完成模型的预训练与诊断

TL;DR介绍并分析一种无需实体或关系匹配将一个事实集合中的知识转移到另一个集合的方法,该方法对规范化知识库和非规范化或开放式知识库都适用。通过在无结构文本中收集的大规模预训练的事实,改进了对特定领域的结构化数据的预测,并通过实验验证了该方法在小数据集上的显著提升。此外,引入了一种新的用于分析开放式知识库完成的预训练模型的数据集,名为 Doge,通过该数据集揭示了现有模型的一些缺陷和问题。