评估 Hanabi 游戏中基于学习和基于规则代理的人工智能团队

Jul, 2021

评估 Hanabi 游戏中基于学习和基于规则代理的人工智能团队

Evaluation of Human-AI Teams for Learned and Rule-Based Agents in Hanabi

Ho Chit Siu, Jaime D. Pena, Edenna Chen, Yutai Zhou, Victor J. Lopez...

TL;DR本研究在人机合作游戏 Hanabi 中单盲评估了基于规则和基于学习的人工智能代理团队。结果表明，尽管两种团队在比赛得分上没有显著差异，但在案例理解性、信任度和总体偏好等主观评估指标上，人类普遍更喜欢基于规则的人工智能伙伴（SmartBot）而不是最先进的基于学习的人工智能伙伴（Other-Play），这对未来的人工智能设计和加强学习基准测试具有启示作用。

Abstract

deep reinforcement learning has generated superhuman AI in competitive games such as Go and StarCraft. Can similar learning techniques create a superior AI teammate for human-machine collaborative games? Will humans prefer AI teammates that improve objective team performance or those t

deep reinforcement learning human-machine collaboration cooperative card games subjective metrics ai design

发现论文，激发创造

汉拿破仑挑战：人工智能研究的新前沿

提出将 Hanabi 游戏作为新的挑战领域来驱动人工智能研究，强调需要发展针对其他代理者信念和意图的理论推理新技术，并介绍了开源的 Hanabi 游戏学习环境以及当前最先进技术的性能评估实验框架。

Feb, 2019

现实世界复杂环境中的人工智能协作与强化学习

在复杂的模拟环境中，研究表明人工智能与人类的合作胜过仅有人类或仅有人工智能代理的情况，并开发出了一种用户界面，使人类有效地协助人工智能代理。

Dec, 2023

在线贝叶斯适应下的次优混合人机团队合作

研究通过计算建模和优化技术，提升人工智能与人类队伍的协同性能，其中人类和机器智能代理由于环境知识不完整而发挥亚最优能力，并采用在线贝叶斯方法推断人们愿意接受机器的协助，实验结果显示协作方式与团队性能、用户信任和对机器的好感度存在显著关联。

Mar, 2024

通过合作人工智能游戏评估视觉对话代理

本研究设计了一款协作游戏 GuessWhich，通过人类和视觉对话代理人 ALICE 的互动来测试人 - AI 团队的性能表现，并发现 AI 独立测试的表现与人 - AI 团队的性能表现存在差异。

Aug, 2017

关于人工智能和人类协同招聘团队表现和偏见的研究

探讨了使用 AI 辅助决策时，人工智能的预测性能与偏差如何对人类决策产生影响的复杂动态，并通过大规模用户研究发现，高性能的模型显著提高了人类在混合环境中的表现，但有些模型削弱了混合偏见，有些则加重了混合偏见。这些研究结果表明，预先评估这些复杂动态对于部署人工智能具有明确的必要性。

Feb, 2022

优化风险厌恶的人工智能人类混合团队

通过使用一种标准的强化学习方案以及经理人的学习，我们提出了一种能够改善混合团队（即人类与人工智能系统共同工作的团队）性能的方法，并展示了这个经理人在多个格子环境下的最优表现。

Mar, 2024

通过人类规正化搜索和学习，实现人类和人工智能的协同

利用针对人类的数据规范化搜索方法及行为克隆技术，开发了一种三步算法来在不完全可观测的完全合作环境中与真人协作，该算法在 Hanabi 基准测试中表现出强大的协调性。

Oct, 2022

人机认知协作中的 AI 挑战

该研究讨论了在未来机器人作为人类队友的角色，并提出了更新智能体结构的方案，强调了自主代理的谋划过程中人类的心智模型要求。

Jul, 2017

模拟人工智能团队决策

研究表明，当涉及到风险元素和评估人类和 AI 代理能力的探索利用过程时，人工智能和人类在小组决策方面具有互补技能。本文面向一组带有缺陷的 AI 代理人，向人类团队提交一系列智力问题，以评估团队成员和可用 AI 代理人的相对专业知识，评估不同行动的风险并通过达成共识来最大化整体回报，并提出了人工智能 - 人类团队决策的模型。研究验证了在不确定情况下的人工智能团队和人类行为预测中的前景理论、影响动态和贝叶斯学习的社会认知构建的价值。

Jan, 2022

实际人机协作强化学习

本研究通过一个协同迷宫游戏设计，用深度强化学习技术实现了人机共同协作。研究结果证明人机共同协作相互影响，在时间的推进下不断适应并建立起相应策略，这为人机智能的协作提供了可行的方案。

Mar, 2020