Jul, 2022

Hanabi中零样本协作的K级推理

TL;DR通过同步训练所有层次的简单k级别推理适应,我们可以在Hanabi中获得具有竞争力的零射协调和特定的临时团队玩法表现,包括与类人代理机器人配对。