BriefGPT.xyz
Ask
alpha
关键词
dynamics mismatch
搜索结果 - 3
ICML
跨领域离线强化学习中的数据过滤对比表示
本文提出了一种基于表征的方法来测量领域差距,并通过对不同领域进行过渡采样来学习表征,从而解决合并两个领域数据导致性能下降的问题。通过基于表征的方法筛选数据,我们的实证结果表明,我们的方法仅使用目标数据的 10%就能以 89.2%的性能达到
→
PDF
2 months ago
价值引导数据过滤的跨域策略适应
该研究提出了一种基于价值一致性的在线动态适应学习算法 —— 价值引导数据过滤算法(VGDF)。实验结果表明,与之前的方法相比,在不同领域的各种环境中,VGDF 算法在策略概括上表现更为优异。
PDF
a year ago
敏捷人类行为模仿和扩展运动合成的残余力控制
该论文提出了使用 residual force control (RFC) 方法增强人型控制策略来更好地模仿长期人类动作,实现了学习源自大规模人体动作数据集的多模态无限地人类动作生成。
PDF
4 years ago
Prev
Next