Jun, 2023

基于知识的局部可观察条件下的 Ad Hoc 团队合作中的推理和学习

TL;DR采用基于非单调逻辑推理以及少量有限数据所学的其他代理行为预测模型的架构,通过支持在线选择、适应和学习模型以及在部分可观测性和有限通信存在下与队友协作来解决无先协调时代理与队友协作问题,实验证明该模型的性能在简单和复杂情况下都优于或与最先进的数据驱动基线相当,特别是在有限的训练数据、部分可观测性和团队组成的变化存在下。