Jul, 2021

评估 Hanabi 游戏中基于学习和基于规则代理的人工智能团队

TL;DR本研究在人机合作游戏 Hanabi 中单盲评估了基于规则和基于学习的人工智能代理团队。结果表明,尽管两种团队在比赛得分上没有显著差异,但在案例理解性、信任度和总体偏好等主观评估指标上,人类普遍更喜欢基于规则的人工智能伙伴(SmartBot)而不是最先进的基于学习的人工智能伙伴(Other-Play),这对未来的人工智能设计和加强学习基准测试具有启示作用。