- 人工生成智能:增强学习中的文化积累
人工学习代理的文化积累对于开放和多样化的能力发展起着推动作用,尤其是强化学习的文化积累模型以平衡单一生命周期的创新与模仿来取得成功,这为更加开放的学习系统提供了新的机会并为建模人类文化提供了新的途径。
- 信念样本对于社会学习而言至关重要
社会学习中的代理人通过共享样本从个体私有观察中形成和更新信念,确保在强连通网络和 “集体可区分性” 条件下以概率为一的收敛到真实状态。
- SOTOPIA-$π$: 社交智能语言代理的交互学习
通过行为克隆和自我强化训练,我们提出了交互学习方法 SOTOPIA-π,进一步提高语言代理的社交智能。我们展示了该训练方法使得一个 7B LLM 达到了专家模型(基于 GPT-4 的代理)的社交目标完成能力,同时提高了语言代理的安全性并在 - 隐私意识智能体中的群体决策
如何在个人的隐私需求和安全顾虑中实现个体之间的信息交流以彼此学习?通过采用严格的统计担保,基于差分隐私(DP)控制信息泄露,我们使得保护个人隐私和实现高效社会学习成为可能。我们的研究结果揭示了在质量、学习准确性、通信成本和个体隐私保护水平之 - IJCAI社会可解释性强化学习
基于社会学习原理的 Social Interpretable RL (SIRL) 是一种改善学习效率的新型基于人口的方法,通过模拟社会学习过程使每个群体中的智能体基于自身的个体经验和与同伴的共同经验来解决给定任务,实现了在高风险场景中解释能 - 社会学习:朝着与大型语言模型进行合作学习
在大型语言模型(LLMs)中,介绍了 “社交学习” 的框架,其中模型通过自然语言以隐私保护的方式共享知识。我们提出并评估了两种 LLMs 之间的知识传递方法,第一种情景中,模型生成抽象提示用于教授任务,而我们的第二种方法中,模型通过生成合成 - 关于新兴沟通在多智能体强化学习中的社会学习作用
本文提出了一种基于信息瓶颈的无监督方法,用于探索非常稀疏的多智能体增强学习中的社交通信情境,该方法可以捕捉引用复杂性和任务特定效用,并开发出一种自然语言灵感的信息组成的词汇表,该词汇表独立于一组紧急概念,使其具有极小的位数,同时可以使用社交 - 如何与人工智能对话:指令,描述和自主性
研究从语言中学习以实现语言使用与机器智能的价值对齐,分析了两种不同类别的语言,即指令和描述,运用上下文强化学习进行形式化的建模,并且验证了这种社会学习方法在传统的强化学习任务中可以降低遗憾值。
- 社交和记忆为指导的人工导航器自发地形成累积文化
本研究旨在回答什么是孕育文化演化所需的最小认知结构,通过人工智能代理的实验结果表明,具备目标导向、社交亲近和路线记忆的个体,在社交学习中存在类似于鸽子的文化演化和优化的现象。
- 人工智能的语言和文化内化
提出自动内在动机代理 (autotelic agents) 的 Vygotskian 模型,通过对话语言和实体环境交互学习,实现自我生成目标和内化交互成为认知工具,进而形成人工认知功能,从而推进社会化学习的人工智能研究应用前景。
- 社会实践:一种完整的形式化
本文介绍了一种基于社会实践作为给定社会环境下期望行为的高级规范的代理社会框架的正式化。论文旨在提供社会实践的正式化,以便用作实现的基础,并定义社会学习可以发生的精确结构。
- ICML多智能体强化学习实现新兴社交学习
该论文研究在多智能体环境下,独立强化学习代理人是否可以学习使用社会学习来提高性能,并发现通过在训练环境中强加约束条件和引入基于模型的辅助损失,可以获得广义的社会学习策略,使代理人能够发现不是通过单个代理人训练获得的复杂技能并且通过从新环境的 - 通过强化学习进行观察学习
本文探讨了通过机器学习实现观察学习的可行性及其机理,证明基于纯强化学习算法,结合记忆,智能体可以从观察到的任务效果中获取充分的信息,实现类似于社交学习等高级学习技能。
- MM邻居学习:网络中的随机和对抗性赌博机
本文介绍了一种新颖的决策模型,以多臂老虎机框架为基础分析社交网络中的学习和决策过程。通过观察邻居的行动和得到的回报,个体可以最小化自己的后悔,我们提供了这种情况下的算法,无论是确定性还是对抗性的多臂老虎机模型,这些算法都是最优的(除去对数因 - 非贝叶斯社会学习
研究信息聚合和社会学习模型,发现当个体代理通过私有观察和邻居信念的更新以及平均相信邻居来学习正确的世界状态时,使用特定的条件,代理最终会预测未来趋势并达成一致共识。