Feb, 2022

用于交互式决策的预训练语言模型

TL;DR使用语言模型(LM)进行预训练,可以帮助在一般的顺序决策问题中实现学习和泛化,并且在大量不同的环境和监督模态下实现组合泛化。