Nov, 2022

决策网络及其训练方法

TL;DR本研究探讨 “deliberation network” 家族的各种训练选项,并提供了一个统一框架,建议在并行训练时采用分别训练的方式,对于中间模型应在自由运行模式下,对于连续输出任务,可采用引导注意损失以防止退化为标准模型。