BriefGPT.xyz
Ask
alpha
关键词
expert agent
搜索结果 - 3
具有次优专家的逆强化学习
给定一个包含多个次优专家行为的问题,我们将逆向强化学习(IRL)方法扩展到了这种情况,研究了与给定专家集兼容的奖励函数的理论性质,并分析了使用生成模型估计可行奖励集的统计复杂性,得到了一个具有极小极大最优性的均匀采样算法。
PDF
6 months ago
ICCV
通过深度强化学习和专家演示实现的视觉追踪
通过应用强化学习的最新趋势并借鉴专家代理的演示,提出了两种新型跟踪器:A3CT 和 A3CTD,均利用现有的跟踪器进行有效的跟踪,并在多个基准测试中取得了最新的成果。
PDF
5 years ago
IJCAI
从观测中学习模仿最新进展
本文为观察式模仿学习提供了文献综述,并指出了一些开放性研究问题和未来可行性工作。
PDF
5 years ago
Prev
Next