关键词behavioral experiments
搜索结果 - 5
- EMNLP大规模语言模型在歧义下的自一致性
在含糊的整数序列填充任务中,我们在 OpenAI 模型套件上进行了一系列行为实验,发现平均一致性介于 67%和 82%之间,远高于模型一致性随机的预测,并随着模型能力的提高而增加。此外,我们发现模型在自我一致性上具有不良标定性,并且通常倾向 - 利用人工智能不确定性量化改善人类决策
提供 AI 预测信息以及 UQ 信息可以改善人类决策能力,并且这种益处可以在各种 UQ 表示方式中普遍适用。
- 降维后的人类分类的理性模型
提出了一种层次混合概率主成分的理性分类模型,可以同时学习类别表示和经济有效的特征集,捕捉人类分类中的维度偏差并支持零样本学习,通过模拟和行为实验进行了验证。
- 合适地依赖 AI 的建议:概念化与解释的影响
本研究提出了适当性依赖度 (AoR) 作为量化的二维度量概念,通过分析提供 AI 建议的解释对适当依赖度的影响进行实验,为分析依赖行为和 AI 建议者的有目的设计提供了基本概念。
- 预测人类合作行为
本文介绍了第一个基于计算模型的人类行为在重复性囚徒困境博弈中的研究,该模型通过整合 168,386 个人类的决策数据,实现了成功的数据拟合和预测行为的目的,并在实验设计中展示了如何最好地促进人类合作。