BriefGPT.xyz
Ask
alpha
关键词
visual control tasks
搜索结果 - 4
Premier-TACO:通过时间驱动对比损失进行多任务表示的预训练
Premier-TACO 是一种多任务特征表示学习方法,旨在提高序贯决策任务中的少样本策略学习效率。它利用一组多任务离线数据集对通用特征表示进行预训练,捕捉关键的环境动态,并使用最少的专家演示进行微调。它改进了时空行动对比学习(TACO)目
→
PDF
5 months ago
SeMAIL:通过分离模型消除视觉模仿中的干扰因素
我们提出了一种名为 Separated Model-based Adversarial Imitation Learning (SeMAIL) 的算法,通过任务相关性将环境动态分解为两个部分并进行分别训练,使得代理能够在任务相关状态空间中高
→
PDF
a year ago
多视角探索最大化解决视觉控制问题
本研究提出了 MEM: Multi-view Exploration Maximization 模型,它是第一种将多视图表示学习与内在奖励驱动的探索相结合的强化学习方法。实验结果表明,MEM 可以在高维环境和稀疏奖励空间下显着提高强化学习代
→
PDF
2 years ago
控制梦境:通过潜在想象学习行为
使用潜意识想象力,在学习世界模型的基础上,Dreamer 这一强化学习代理能够纯粹通过图像解决长周期任务,具有数据效率高,计算时间短和最终性能强等优势。
PDF
5 years ago
Prev
Next