- 信念样本对于社会学习而言至关重要
社会学习中的代理人通过共享样本从个体私有观察中形成和更新信念,确保在强连通网络和 “集体可区分性” 条件下以概率为一的收敛到真实状态。
- 语言模型表达自我和他人的信念
通过神经激活语言模型,线性解码不同代理人的信念状态,发现其内部包含了自我和他人信念的表征,这些表征对社会推理过程具有关键作用,同时在不同因果推理模式的多种社会推理任务中表现出潜在的泛化能力。
- 贝叶斯心智理论中关于信念的语言基础
通过对 Bayesian 心智模型的建模,该论文解释了人类相信陈述的语义,解释了人类对他人目标和信念的归属,并证明了心智理论对信念语义的重要性。
- 自然修订是有条件修订的
自然修正尽可能少地改变信念,基于条件真相的简单公式将自然修正扩展到条件真相的条件式中,基于最小变化、无差异性和天真的基本原则,自然修正将变化限制在当前条件中,与不受限制的修正进行比较并确定当前条件是什么。
- 信念修正与不协调:是个笑话吗?
通过修正信念、惊讶和违背规范,本论文尝试在智能代理听笑话的情况下形式化这种智能行为。
- 安全关键的自主系统的相关性框架
我们的研究旨在基于一种正式方法确定对于目前任务来说对于一个安全关键的自主系统而言是相关的信息,即哪些信息足以构建一个适当的世界观以实现其使命目标。
- 使用机械因果图表征决策理论
通过机械因果模型,本文展示了如何表征和区分重要的决策理论,并生成了一个不同决策理论的分类法。
- 语言模型仍缺乏测谎器:探究经验和概念障碍
我们考虑大型语言模型是否具有信念,以及如果它们确实具有信念,我们如何衡量它们。在评估两种现有方法失败后,我们认为即使 LLMs 具有信念,在概念上这些方法也不太可能成功。因此,还没有 LLMs 的测谎仪。我们总结了研究结果,并提出了一些未来 - 机器心智理论综述
本文综述了近年来关于机器 Theory of Mind(ToM)在信仰、欲望和意图方面的进展,概括了不同任务和数据集的发展,并比较了具有优势、局限性和适用条件的模型。我们认为,提出标准的评估标准和数据集,特别是覆盖了 ToM 多个方面的大规 - 理论:关于可取之物
该论文提出了一个有关渴望事物的理论,通过对渴望事物建立模型,可以捕捉主观对渴望事物的信念,论文提出两种模型包括有序事物集和有序有序事物集。
- AAAI一种用于情感辅助气候变化推文立场检测的多任务模型
本文提出了一个基于 Twitter 的分类分析框架,可以对气候变化方面的推文进行情感和态度分析,并基于此进行气候变化持有者的分类,以此为决策者提供有效决策参考。
- 通过自我观察学习心智理论的机器人:利用意图 - 信仰的协同作用
本文介绍了一种学习他人低层次和高层次心智状态的神经网络模型,并表明把高层次认知附加到低层次状态模型中可以使模型更快、更准确地进行意图预测,并提高学习表现。
- 将系统解释为解决 POMDP:朝着正式理解机构的一步
通过部分可观察的马尔可夫过程理论,我们可以从信仰和目标方面解释系统的功能和代理性,并将其视为解决部分可观察的马尔可夫过程的解。
- 熵多边最优输运的信息论等价性:多智能体通信理论
本文提出了关于信息论中多重边际最优输运的等价性质,可以将其简化为熵最优输运的情形,并将其应用于不同信仰的代理之间的通信。结果表明,熵最优输运在多代理情况下是信息论上最优的,本工作可以为多代理团队合作中的最优输运理论研究提供指导。
- 语言模型是否有信念?检测、更新和可视化模型信念的方法
探讨语言模型是否对世界有信念,介绍检测语言模型是否拥有信念、强化信念更新的方法,其中重点介绍基于学习优化器或超网络的方法,并提出了评估信念更新方法效果的新度量,提出了一种称为 SLAG 的训练目标,并引入了信念图,提供了一种新形式的接口呈现 - ACL标注员态度:标注员信念和身份对有害语言检测的偏见
通过两项在线研究探究了评注者身份和信仰对有毒语言的评注的影响,发现评注者的身份和信仰与有毒性评分之间有很强的关联,表明对有毒语言的注释需要在社会变量中予以情境化考虑,进而提高有毒语言的注释和检测的准确性。
- EMNLP基于立场的意见对话角色
本研究提出一种基于立场的人物形象表达方式,探讨不同的人物形象表达对于话语生成的影响,数据结果显示,这种表达方式可以更准确地把握作者立场的抽象和深刻的方面。
- 评估问答中的心智理论
本研究提出了一个新的数据集,旨在评估问答模型在理解信仰和状态一致性方面的推理能力,评估多个带有记忆增强的神经模型,发现这些模型在需要跟踪世界不一致状态的任务中均失败,而且当试验中引入随机句子时,模型的准确性明显下降。
- ICML对抗自然:不确定情况下的决策因果发现
研究决策过程中的不确定性环境,设计一种决策模型以帮助决策者更好地理解因果机制,从而通过观察结果不断优化决策并逐步建立起因果模型