BriefGPT.xyz
Ask
alpha
关键词
multiagent benchmark domains
搜索结果 - 1
基于知识的局部可观察条件下的 Ad Hoc 团队合作中的推理和学习
采用基于非单调逻辑推理以及少量有限数据所学的其他代理行为预测模型的架构,通过支持在线选择、适应和学习模型以及在部分可观测性和有限通信存在下与队友协作来解决无先协调时代理与队友协作问题,实验证明该模型的性能在简单和复杂情况下都优于或与最先进的
→
PDF
a year ago
Prev
Next