BriefGPT.xyz
Ask
alpha
关键词
adversarial environment
搜索结果 - 5
具有局部和全局对抗性破坏的强健分布学习
在对抗性环境中,考虑利用计算上高效的估计器最小化 Wasserstein 距离,并开发具有有界误差的有限样本算法,用于鲁棒性随机优化。
PDF
a month ago
通过线性优化改进线性对抗 MDPs 的遗憾界
本文探讨了如何用线性优化的方法解决在对抗环境下的马尔科夫决策过程问题,通过将特征映射设置到线性优化的赌臂中,得到了不需要访问转移模拟器的新技术,并在探索性的假设下,将线性对手马尔科夫决策问题的最优结果从 $ ilde {O}(K^{6/7}
→
PDF
a year ago
在对抗多智体系统中学习合作行为
本文介绍了一个基于虚拟多智能体平台的扩展,称为 TripleSumo,用于研究连续动作空间中多智能体的合作行为,在对抗性环境中进行物理接触。我们对两个代理 Bug 和 Ant 与 Spider 进行合作的情景进行了研究,并首次提出加入 Bu
→
PDF
a year ago
加固硬件安全的强化学习:机遇、发展和挑战
利用强化学习代理检测硬件特洛伊问题是一种解决硬件安全性挑战的新方法。
PDF
2 years ago
资源分配的欺骗性规划
本文研究在敌对环境下,自主代理团队通过在目标位置上分配资源来完成任务,发展了密度控制和最大熵预测算法,以欺骗对手达到期望的资源分配。
PDF
2 years ago
Prev
Next