Jun, 2024

连接事实:LLMs 可以从不同的训练数据推理和表达潜在结构

TL;DR大型语言模型面临的安全风险可以通过从训练数据中删除危险知识来解决,但隐式信息可能仍然分布在各个训练文档中,我们研究了一种称为归纳无上下文推理的泛化类型,通过从训练文档中分散的证据中推断潜在信息并将其应用于下游任务,并展示了大型语言模型可以执行归纳无上下文推理。