BriefGPT.xyz
Ask
alpha
关键词
meta bandit sequential greedy
搜索结果 - 1
在不可预测环境下利用不可信命令进行多机器人协同:一种赌博次模最大化方法
我们研究在不可预测和部分可观察的环境中,对不可信的外部命令进行多智能体协调的问题。我们提供了一种元算法 MetaBSG,它可以在外部命令任意糟糕的情况下实现性能保证,并可以在复杂多机器人任务中改善性能。
PDF
10 months ago
Prev
Next