May, 2024

大规模多语言抽象意义表示:一份用于幻化检测的数据集和基准

TL;DR我们介绍了 MASSIVE-AMR 数据集,它是迄今最大且最多样化的 AMR 数据集,包含超过 84,000 个文本到图形的注释,映射到 50 多种具有不同语言类型的信息寻求话语,并使用大型语言模型进行多语言 AMR 和 SPARQL 分析的实验,以及在知识库问答上应用 AMR 进行虚构检测的结果,对使用 LLMs 进行结构化分析的持续问题提供了一些启示。