Dec, 2023

基于辨别性表示预训练的学习 Top-k 子任务规划树用于决策制定

TL;DR从足够的数据中学习任务相关的表示,利用多个编码器提取充分的任务相关动态并使用共享预测器来区分任务特征,通过使用注意机制生成一个 top-k 子任务规划树,从而在未知任务上引导复杂决策。