BriefGPT.xyz
Ask
alpha
关键词
transfer
搜索结果 - 5
反向强化学习是否比标准强化学习更困难?
逆强化学习(IRL)是学习奖励函数的问题,该问题通过对专家策略的演示来开发理解和模仿人类行为等智能系统起着关键作用。本文提供了首批有效的 IRL 结果,包括离线和在线设置,使用多项式采样和运行时间等方面的效率。使用 RLP 和 RLE 算法
→
PDF
7 months ago
利用对抗网络的跨模态知识转移 —— 手势识别研究
本文提出了一个基于语言表示的手势识别框架 TRANSFER,利用一个预先指定的句法结构和分词器来抽象低级别技术特性,使得可以学习从视频到 Wi-Fi,从视频到加速度计等三种不同情形下的手势模型和识别手势的知识传输。
PDF
a year ago
Granger 因果层次技能发现
介绍了一种新算法 Hierarchy of Interaction Skills(HIntS),利用 Granger causality 无监督地发现和使用交互探测器训练层次化的技能,解决了强化学习中样本效率低和泛化问题。在机器人推动障碍物
→
PDF
a year ago
AAAI
评估多智能体强化学习在不同智能体数量下的泛化和转移能力
本研究采用集中式训练和分散式执行的范式来评估多智能体强化学习模型的推广和转移能力,结果表明通过使用更少的智能体进行训练可以获得类似或更高的评估性能。
PDF
3 years ago
NIPS
强化学习中的后继特征迁移
我们提出了一种基于 successor features 和 generalized policy improvement 的转移框架,用于处理奖励函数在不同任务之间变化的情况,并且可以在不同任务之间自由地交换信息,同时具有转移策略的性能保
→
PDF
8 years ago
Prev
Next