BriefGPT.xyz
Ask
alpha
关键词
expert distribution
搜索结果 - 1
ADR-BC: 敌对密度加权回归行为克隆
提出 ADR-BC,通过增强密度支持的行为克隆方法,优化策略并避免多步强化学习中的累积偏差,实验证明其在多个任务上均明显优于目前 state-of-the-art 的泛化 IL 基准 CEIL,并且在 Adroit 和 Kitchen 领域
→
PDF
a month ago
Prev
Next