May, 2022

利用自然语言与程序抽象将人类归纳偏好渗透到机器中

TL;DR通过在自然语言任务描述和生成这些任务的程序中预测表示,并指导它们对更具人类化的归纳偏差进行联合训练,结果表明在下游元增强学习代理中,这些表示的抽象支持是关键。