Oct, 2022

大规模提取文化常识知识

TL;DR本文提出了一个用于在大规模上提取高质量文化常识知识 (CCsk) 的端到端方法,名为 CANDLE,该方法从 Web 语料库中提取 CCsk 断言并将它们组织成相符的类群,包括地理、宗教、职业等 3 个领域,多个文化方面。通过分类过滤和趣味分数评估方法,CANDLE 优于先前的作品,并且实验评估演示了 CCsk 对 GPT-3 语言模型带来的好处。