Sep, 2023

一份 ACT 戏剧表演:单一演示行为克隆与行动分块变压器

TL;DR使用行为克隆从单个人类示范中学习任务,通过使用线性变换增强单个示范来生成一系列初始条件广泛变化的轨迹,从而成功训练行为克隆智能体完成三个方块操作任务,并通过在推断期间将行动预测的标准差纳入集成方法中,使方法对环境中的意外变化更加稳健,从而实现了显著的性能提升。