BriefGPT.xyz
Ask
alpha
关键词
multi-agent imitation learning
搜索结果 - 4
多智能体模仿学习:价值易得,遗憾难求
协作学习中的多智能体模仿学习问题,以减小学习者和专家之间的价值差为目标,但无法保证对战略智能体的偏离具有鲁棒性。因此,研究了在马尔科夫博弈中以后悔差作为目标的代替方案,并提出了两种有效的方法来最小化后悔差。
PDF
a month ago
CVPR
LASIL: 面向学习者感知的长期微观交通模拟的有监督模仿学习
本文介绍了一种称为学习者感知的监督式模仿学习模型,用于解决多智能体模仿学习中的协变量转移问题,通过利用变分自动编码器同时建模专家和学习者状态分布,在城市交通仿真中应用,展示了在真实数据集 pNEUMA 上在短期微观和长期宏观仿真中相较于现有
→
PDF
3 months ago
KDD
基于 Copulas 的多智能体模仿学习
本论文提出一种使用 copula 来明确建模多智能体系统中相关性和协调性的方法,该方法可以分别学习捕捉每个智能体局部行为模式的边缘分布以及完全捕捉智能体之间依赖结构的 copula 函数,实验结果表明,该模型在动作预测任务中表现优于现有基线
→
PDF
3 years ago
使用多智能体奖励增强模仿学习模拟人类驾驶行为的涌现特征
这篇论文提出了一种称为奖励增强模仿学习(RAIL)的方法,它在多智能体模仿学习框架中集成了奖励增强,并允许设计者以原则性的方式指定先前的知识,这种方法在驾驶场景中得到验证,并在复杂的多智能体设置中展示了单个智能体的局部行动和出现性质的行为方
→
PDF
5 years ago
Prev
Next