本论文提出了一种基于递归推理与变分 Bayes 方法的多智体强化学习框架,该框架可以用于建模智体对手的行为,提高智体的自我决策能力以及使其在博弈中达成 Nash 均衡。实验证明,关于智体对手信念的推理,是智体强化学习中一个重要的方向。
Jan, 2019
Neural Reasoner 是一个基于神经网络的推理框架,具有特殊的交互池机制和深度结构,能够处理不同类型的推理和语言表达形式,并在两个困难人工任务中表现出优越性能。
Aug, 2015
本文说明自适应计算对于学习不同难度样例所需推断步骤的有效性,且学习正确推断步数是困难的;还介绍了首个涉及自适应计算时间的模型,不仅在与没有自适应部分的类似模型相比性能更佳,还能深入理解模型的推理过程。
Oct, 2016
该论文介绍了利用深度网络来模拟人类心智状态,并在多智能体环境中进行信念预测和强化学习的初步实验结果。
Jul, 2023
通过系统的关系推理方法和轨迹预测,我们提出了一种适用于多智能体系统的社交机器人导航研究,通过该方法,在密集、互动场景中,在安全性、效率性和社交遵循性方面显著优于最强基准线。
Jan, 2024
本研究提出一种模拟语言特征的通信协议,通过将高维信息编码为低维表示来分析对任务表现的影响,进而提高任务完成率,并强调了语言作为代理之间共同表征的作用及其对泛化能力的影响。
May, 2023
本文提出了一种隐式的基于模型的多智能体强化学习方法,基于价值分解方法,能够提高在不同部分可观察的马尔可夫决策过程领域中的样本效率。
Apr, 2022
本文基于主动推断的认知框架提出了一种新颖的多智能体合作联合行动的计算模型,并通过两个模拟实验验证了该模型的有效性。
Oct, 2022
本文介绍了一种新颖的框架 Relational Neural Machines,它可以对学习器的参数和基于一阶逻辑的推理器进行联合训练,下面将介绍其在大规模关系任务中的可行性和良好效果。
Feb, 2020
通过与神经网络和热带代数的连接,将算法推理集成到机器学习模型中的潜力展示出来。
Feb, 2024