Oct, 2024

通用策略的主动微调

TL;DR本研究解决了在机器人学习中预训练通用策略快速适应多个新任务的挑战。提出主动多任务微调(AMF)算法,通过自适应选择演示任务,最大化在有限演示预算下的多任务策略性能。实验结果表明,AMF在复杂环境中有效提升神经策略的微调效率。