学习制定注重依从性的建议

Oct, 2023

Learning to Make Adherence-Aware Advice

Guanting Chen, Xiaocheng Li, Chunlin Sun, Hanzhao Wang

TL;DR考虑到人对人工智能建议的忽视以及人工智能在最相关时刻有选择性地提供建议的需要，本文提出了一个顺序决策模型，该模型考虑到人的依附水平并引入了一个推迟选项，以便机器能够暂时不提供建议，并提供了能够学习最佳建议政策并仅在关键时间点提供建议的学习算法。与通用强化学习算法相比，我们的专门化学习算法不仅具有更好的理论收敛性能，而且表现出强大的实证性能。

Abstract

As artificial intelligence (AI) systems play an increasingly prominent role in human decision-making, challenges surface in the realm of human-AI interactions. One challenge arises from the suboptimal AI policies

artificial intelligence human decision-making human-ai interactions sequential decision-making model learning algorithms

发现论文，激发创造

学习何时向人类决策者提供建议

通过对已有的案例进行分析，本文提出了交互式人工智能决策辅助系统的设计，旨在通过学习人类的选择来决定何时提供算法支持，从而提高决策的准确性和可靠性。作者在美国刑事司法系统的前期释放审判方面进行了大规模实验，并发现交互式辅助系统能够在必要的时候提供准确的建议，与固定的非交互式系统相比较，可以显著提高人类的决策水平。同时，交互式辅助系统还具有促进人类学习、保护人类决策者补充优势、促进对建议的更积极响应等优点。

Sep, 2022

一种基于 Q-learning 算法的重视服从性的推荐方法

开发了一种 “遵循感知 Q-learning” 算法，通过学习 “遵循水平” 来捕捉人类决策者遵循推荐行动的频率，实时推导出最佳推荐策略，证明了该算法收敛到最优值并在各种情境下评估了其性能。

Sep, 2023

最佳决策并不等同于最佳建议：制定关注依从性的推荐

该研究提出了基于粘附感知优化框架的有关决策的算法推荐，并分析了无法实现算法推荐和实际决策之间的差异。该框架提供了有用的工具来分析算法推荐的结构，并计算出对人类偏差天然免疫的最优推荐策略，并保证改进常规策略。

Sep, 2022

应该遵循基于 AI 的建议吗？衡量人工智能决策中的适当依赖

本文针对人工智能顾问给出的建议存在问题的问题展开讨论，提出了适当依赖（AR）的概念及其度量方法。

Apr, 2022

在高风险环境中指导人类学习

本文研究 AI 辅助决策的团队决策，在考虑决策者面临的协同成本、不完美的算法决策等限制条件下，研发了人工智能团队学习框架和 TeamRules 算法，可提供有针对性的决策建议并在处理协同成本和团队准确性之间的平衡上产生显著的效果

Oct, 2022

AI 辅助决策中依赖行为和准确性的相互依存性

本文分析了 AI 辅助决策中人类对模型建议过度或不足的倾向对准确性的影响，并提出了一个可视化框架以帮助比较和解释实证结果和干预策略。

Apr, 2023

透过指引提炼的可教授强化学习

本研究提出了一种基于 “可教学” 的决策系统的交互式学习监督范式，能够通过学习外部教师提供的结构化建议，解决复杂任务的学习难度，对拼图、导航和运动等各种任务需求的人工干预也相对较少。

Mar, 2022

提升有效人工智能决策：人类学习在正确依靠人工智能建议中的角色

人工智能和人类协作的真正潜力在于利用人类和人工智能的互补能力，实现超越个体人工智能或人类的联合绩效，即实现互补团队绩效 (CTP)。本研究通过 100 位参与者的实验展示了学习与适当依赖之间的关系，为分析依赖和有效设计人工智能决策提供了基础概念。

Oct, 2023

AI 辅助人类决策中的精度与时间自适应干预

在高精准性和高时效性的情境中，为了医生在急诊室等场合提供既提高准确性又缩短用时的 AI 辅助，本文提出通过根据问题和用户的不同属性，适应性的选择 AI 辅助类型来平衡目标的研究，并在用医生为外星人开具药品做实验得出需要适应性的 AI 辅助类型，适应性可以在准确性和用时间做良好的权衡，最后进一步研究可以考虑使用机器学习算法（如强化学习）来自动更快地适应。

Jun, 2023

面向困难度调整的课程强化学习中的人类决策

研究人员设计了一个交互平台，利用人类的决策过程，通过向导课程强化学习结果，实现了成功地调整强化学习性能以适应人类期望困难程度的目标，并证明人类与计算机互动式课程增强学习的有效性，促进了该领域的发展。

Aug, 2022