Mar, 2024

使用行为原始模块在数据效率模仿学习中支持脚手架操纵任务

TL;DRPRIME 是一种以行为基元为基础的框架,旨在提高模仿学习的数据效率,在多阶段操作任务中取得了显著的性能提升。