- 超越人口统计学:利用人类信念网络对饰演角色的基于 LLM 的代理进行对齐
通过整合从实证人类信念网络中提取的信息,本研究评估了如何改进基于人类行为的大型语言模型(LLM)与人类行为的一致性,结果表明在模拟和理解社会信念分布模式的工作中,将 LLM 代理与单一信念进行关联会显著提高对相关主题的一致性。
- 基于 LLMs 的贝叶斯统计建模
利用贝叶斯统计模型,研究了大型语言模型(LLMs)在人类行为预测方面的类人特性,发现 LLMs 不能准确捕获人类数据的各项细节,但在聚合和条件水平的预测方面可以有效适配人类数据,显示出某些不同的方法可以使其得到充分的分布式预测。
- 关于考虑人类对人工智能行为的实用性在人工智能协作中的论述
通过考虑人类行为与人类信念,设计 AI 代理以促进与人类的协作,实现了更准确预测人类对 AI 行为的信念,并提升了人工智能与人类协作的性能。
- AI 的合理人标准
人工智能治理和人工智能对齐研究的一个挑战是以一种对社会有用和建设性的方式规范其行为,而合理人标准提供了对我们在模型中开发、测试和强调的行为类型的有用指导,并且解释了合理性在关键领域的定义和用法,以及合理行为的社会理解为 AI 研究人员提供了 - 真实为贵:将大型语言模型与在线人类行为对齐
本文提出了一种对齐框架,名为人类行为强化学习(RLHB),通过直接利用真实的在线人类行为来对齐大型语言模型,并采用生成对抗框架训练生成器按照预期的人类行为进行回复,鉴别器则验证查询、回复和人类行为三元组是否来自真实的在线环境,在自然语言形式 - 玻尔兹曼状态相关理性
通过在 Boltzmann 合理性模型中用状态函数 $\beta (s)$ 取代次优常量 $eta$,本研究通过测量结构性非理性在现有的人类行为学习模型中得到了扩展,从而以一种可计算的方式获得了自然的表达能力。
- 成功的众包导航学习策略
教授自主移动机器人在人群中成功导航是一项具有挑战性的任务,该论文采用神经网络来学习机器人在现场的特定策略,以考虑人类行为和对真实机器人的反应,同时针对各种情景学习相应策略,并对方法、实验结果进行了定量评估。
- 评估大型语言模型作为生成式用户模拟器用于对话推荐
通过五项任务评估语言模型在对话推荐中模拟人类行为的效果,研究发现基准模拟器的评估可以揭示语言模型与人类行为的差异,并提供了模型选择和提示策略的见解。
- 一个人机协作框架用于模式开发
提出了一个新的框架,通过将人类和机器的智能结合起来,合作设计新的 Winograd schemas,从而解决 Winograd Schema Challenge 中的人工智能问题。
- 辩论中 LLM 仿真的系统偏差
近期自然语言处理的进展,特别是大型语言模型(LLMs)的出现,为构建精确复制人类行为的计算模拟提供了令人兴奋的可能性。然而,LLMs 是复杂的统计学习器,缺乏直接的演绎规则,因此容易产生意想不到的行为。本研究突出了 LLMs 在模拟人类互动 - 生态合理的元学习推理解释人类类别学习
大规模语言模型可以生成与真实世界任务统计相匹配的认知任务,通过元学习框架导出适应这些任务的理性智能体,称为生态合理的元学习推理模型(ERMI)。ERMI 在两个不同实验中比其他七种认知模型更好地量化解释了人类数据,还在定性层面上与人类行为相 - 在与可解释和不可解释机器人的交互中挖掘多模态通信模式
探究人与能解释和不能解释的机器人交互的模式,通过视频记录和分析人类在一个棋盘游戏中指示解释性或非解释性机器人移动棋子的行为,并转化成交易以进行关联规则挖掘,发现通信模式以及性别和机器人类型之间的强相关性,结果表明对人类交互模式进行情境化处理 - 通过程序生成探索人类计划的层次结构
人类的行为具有层次性,通过将任务分解为子任务或将抽象行为分解为具体行为而产生。本文通过观察人们生成具有明确层次结构的行动序列的程序,探究人们如何形成层次结构的计划,并发现人类在计划时对效用最大化和最小描述长度两个指标敏感,但同时具有超越最小 - HOLD:从视频中无类别限制地重建互动的手部和物体的 3D 模型
通过使用单目交互视频,我们提出了 HOLD,它是第一个无需 3D 手物体注释就能从中复原出联合的手和物体的方法,通过使用一个组合的隐式模型,能够从 2D 图像中复原出解缠细分的 3D 手和物体,并进一步结合手物体约束来改善复原质量,在实验室 - 模拟解释:可解释策略学习下的决策理解
了解人类行为以实现决策的透明度和责任感非常重要。我们提出了一种新颖的基于模型的贝叶斯方法进行可解释的政策学习,该方法以数据驱动的方式呈现决策行为,并在偏差的信念更新过程和次优的信念 - 行为映射之间进行联合估计,能够满足透明度、部分可观察性 - 人类与语言模型在预测重复文本时的差异
通过研究语言模型在下一个单词预测任务中的表现与人类行为模式的比较,发现人类与 GPT-2 语言模型在文本展现初期表现强相关,随着记忆(或背景学习)的作用逐渐发挥,二者的表现迅速分歧,研究发现这种分歧的原因是特定的中间层注意力头部,为此通过在 - 高阶 DeepTrails:*Trails 的统一方法
分析人类行为在不同环境中具有优势,理解和描述人类行为有助于改进和优化基础设施和用户界面。本文通过使用一阶马尔可夫链捕捉行为的数学特征,提出使用自回归语言模型分析整个序列的方法,以建模高阶序列依赖,解决现有方法中丧失信息和局限性的问题,并在合 - 基于代理的人群地震疏散模拟;应用于黎巴嫩贝鲁特
本研究基于均衡模型开发了一种模拟人员疏散的跨学科方法,探讨了地震时人员的行为和迁移,结果显示在城市中的开放空间及其与住宅建筑的接近程度是确保人们在地震发生时安全的重要因素。
- 探索文本地理信息规律
地理信息与人类行为、认知、表达和思维过程密切相关,并符合伽马分布。通过实验证实了伽马分布假设,并揭示了地理信息数量、长度和距离的规律。同时,地理信息的利用存在上限,还提供了地理信息提取的指导,揭开地理信息的面纱。
- 智能手机用户答案质量受影响的因素
本研究探讨了影响人类行为预测的因素,并研究用户反应时间和完成时间对回答质量的影响。结果表明,这两个因素与各种内在和外在因素相关。