BriefGPT.xyz
Ask
alpha
关键词
environmental uncertainties
搜索结果 - 3
面对环境不确定性的高样本效率鲁棒多智能体强化学习
为了解决强化学习中的模拟到实际之间的差距,学习策略必须对环境不确定性保持鲁棒性。本研究着重于多智能体环境中学习分布鲁棒马尔可夫博弈,提出基于模型的 DRNVI 算法来学习各种博弈论平衡的鲁棒变种,同时建立了信息论下界以确认 DRNVI 的近
→
PDF
2 months ago
OpenNet: 自动驾驶目标检测的增量学习与平衡损失
提出了一种用于自动驾驶目标检测的方法,通过平衡损失来缓解类别不平衡,采用梯度重塑的归纳层快速学习有限样本的新类别,通过归一化特征蒸馏来防止灾难性遗忘,并通过 FPN 和基于能量的检测提高多尺度检测稳健性和未知类别识别性能,实验证明该方法在
→
PDF
7 months ago
多模态环境不确定性下使用课程学习提高多智能体强健性
该研究是第一个对多模态环境不确定性的多智能体强化学习问题进行广义建模的工作,并提出了基于课程学习技术的多模态不确定性的鲁棒训练方法,通过在合作和竞争的多智能体强化学习环境下的广泛实验结果表明我们的方法达到了最先进的鲁棒性水平。
PDF
9 months ago
Prev
Next