BriefGPT.xyz
Ask
alpha
关键词
interdependencies
搜索结果 - 2
协作多智体强化学习的奖励机器
研究团队提出使用奖励机器(RM)对协作多智能体强化学习中的团队任务进行编码,分解任务成子任务分配给个体智能体去完成,提出一种分布式完成子任务的算法,提供了一种自然去中心化学习的方法,并在实验中验证了所提出的方法非常有效。
PDF
4 years ago
多防御者安全博弈
研究了多个防御者在安全游戏中的战略互动,提供了三种不同情形下平衡和代价分析的结论,并开发了一种新的混合整数线性规划公式来计算防御者的最佳反应,以便近似计算游戏的 Nash 平衡点,并将其应用于多个网络模型,包括现实世界的电网,从而揭示了网络
→
PDF
9 years ago
Prev
Next