BriefGPT.xyz
Ask
alpha
关键词
state-of-the-art rl certification solutions
搜索结果 - 1
AAAI
合作多智能体强化学习的认证策略平滑化
提出了基于虚警率控制和基于树搜索的算法用于分析多智能体的鲁棒性。实验证明该方法产生的可靠性界限比现有模型更紧密。
PDF
2 years ago
Prev
Next