BriefGPT.xyz
Ask
alpha
关键词
few-shot policy transfer
搜索结果 - 2
通过观测映射和行为克隆的少样本策略转移框架
通过观察映射和行为克隆,本文提出了一个针对两个领域的少样本策略传递框架,利用生成对抗网络(GANs)和循环一致性损失将源领域和目标领域之间的观察映射,并将获取的映射用于将成功的源任务行为策略克隆到目标领域,进而实现有限目标任务交互情况下和源
→
PDF
9 months ago
ICML
在线少样本策略迁移原型对齐
研究了强化学习领域的领域自适应问题,提出了一种基于功能相似性的在线原型对齐框架 (OPA),该框架能够在少数几周期内实现策略转移,即使从目标域获得的样本数量很少,也能表现出更好的转移性能。
PDF
a year ago
Prev
Next