Apr, 2024

强化学习中的零样本拼接使用相对表示

TL;DR利用最近发展的潜在表示的统一框架,我们能够将代理的组件组合而不是从头重新训练,为视觉强化学习提供了新的可能性。这样可以创建能够处理训练过程中从未见过的环境和任务组合的全新代理,为强化学习的使用带来了更易接触和灵活性的道路。