- 基于视觉情节记忆的探索
使用视觉情节记忆作为内在动机的机器人探索问题的研究,通过卷积递归神经网络自编码器学习时空特征的高效表达,结构相似度作为内在动机信号来引导探索,超过了好奇心驱动的变分自编码器在发现动态异常方面的表现。
- CVPR视觉语言导航的体积环境表示
基于视觉观察和自然语言指令,本论文提出了一种基于体素化环境表示的视觉语言导航模型,在多任务学习的影响下,预测 3D 占用、3D 房间布局和 3D 边界框,并通过在线采集的环境表示进行体积状态估计和建立序列记忆,取得了在 VLN 基准测试(R - Larimar:具有情节记忆控制的大型语言模型
Larimar 是一种新颖的、仿脑结构的体系架构,用于增强大型语言模型(LLMs)的分布式情景记忆,实现动态、一次性的知识更新,无需计算昂贵的重新训练或微调。实验结果表明,Larimar 在多个事实编辑基准上达到与竞争对手相当的准确率,甚至 - ICLR面向具身化智能体的空间感知变压器内存
本文研究了空间感知变压器模型在新的事后记忆模式中的应用,该模式结合了时间和空间维度,提高了记忆利用效率,并在各种环境和下游任务中展示了改进的准确性。
- 通过嵌入情景记忆的 NDT 实现车辆行为预测
通过 Episodic Memory implanted Neural Decision Tree (eMem-NDT) 来解释目标车辆的行为预测,模型具有清晰的可解释性、优异的性能和适用于实际使用的特点。
- 为大型语言模型代理赋予工作记忆能力
本文通过应用认知心理学的工作记忆框架来增强大型语言模型(LLMs)的架构,以解决其在人类记忆能力方面的限制,并提出了一种创新模型,包括集中的工作记忆中心和情景缓冲区,以提供更高的连续性,以实现复杂任务和合作场景中的细致语境推理。然而,对于情 - 基于显著性导向的隐藏联想回放用于持续学习
这篇研究论文介绍了一种用于持续学习的新框架,它将关联记忆与回放策略相结合,通过稀疏内存编码归档显著的数据片段,并引入面向内容的记忆检索机制,通过实验证明了该方法在各种持续学习任务中的有效性。
- 记忆训练场:无尽回合中基于记忆的智能体面临的部分可观测挑战
Memory Gym 引入了一种独特的基准测试,旨在测试深度强化学习代理的能力,具体比较门控循环单元(GRU)和 Transformer-XL(TrXL)在记忆长序列、抵抗噪声和泛化能力方面的性能。
- ICMLSpotEM: 基于视频的记忆检索的高效搜索
SpotEM 是一种有效的远程视频检索方法,它使用语义索引和剪辑选择器技术减少检索时耗费的时间和计算资源。
- 适应性和交互式图像字幕生成的研究:数据增强和情节记忆方向
本文提出了一种交互式机器学习(IML)管道,用于图像字幕生成,其中使用简单的数据增强方法和持续学习方法来将用户输入逐步集成到训练过程中,通过实验发现应用分段记忆是保持先前聚类中知识的有效策略。
- 双记忆强化学习
本研究提出了一种名为 2M 的方法,将历史记忆存储和强化学习相结合,以提高数据效率并在深度强化学习方面取得更好的表现,同时也提供了将任何历史记忆代理与其他非策略强化学习算法相结合的通用框架。
- 短时、情节性和语义记忆系统的机器
使用认知科学理论作为参考,研究者构建了一种基于知识图谱的具有短期、情节和语义记忆系统的智能体,并通过深度 Q 学习方法来使这个智能体在自己设计的强化学习环境中学会如何驾驭记忆来最大效益地回答问题。结果表明,与没有类似记忆结构的智能体相比,拥 - ICML变形金刚是元强化学习算法
本文介绍了 TrMRL,这是一种运用 Transformer 架构的基于元强化学习的代理(Meta-Reinforcement Learning Algorithm),它结合了最近的工作内存以递归方式构建情境记忆,并利用 self-atte - 非传统的多智能体强化学习
提出一种应对 The off-beat actions 下模型自由 MARL 算法的算法框架,并通过一种新的时序奖励重分配方案,利用 LeGEM 建立代理的情节性记忆以提高多智能体协调。结果表明,该算法显着提升了多智能体协调并提高了样本效率 - CVPR情节记忆问答
通过 Episodic Memory Question Answering (EMQA) 任务以及一系列数据集和模型的介绍,本文阐述了在面向家居环境下,使用智能语音助手等 AR 设备进行信息沟通的场景中,利用换人的机器学习算法,更好地实现 - 一台具备类人记忆系统的机器
本研究基于认知科学理论显式建模了一个拥有语义记忆和情景记忆系统的智能体,并展示了这种智能体比仅有其中一个记忆系统更优秀的性能表现。通过 OpenAI Gym 兼容的 “the Room” 环境,我们让智能体学习如何编码、存储和检索记忆,以最 - CVPRvCLIMB: 一种新颖的视频类别增量学习基准
本文提出 vCLIMB 连续学习基准测试,旨在探究在视频领域中,利用深度模型进行随时间增量式学习时出现的挑战,作者提出了一种能应用于基于记忆的连续学习模型的时间一致性正则化方法,能显著提高模型在未修剪连续学习任务中的性能,最高可提高 24% - 具有好奇心驱动探索的情节式多智能体强化学习
本篇论文提出了 Episodic Multi-agent 强化学习方法,并把个体 Q 值预测误差作为内部奖励,使用情节式记忆从经验中提升策略训练,从而实现多代理协作性问题的有效探索和高效学习。在 StarCraft II 微型管理基准测试中 - ICML核心连续学习
本文介绍基于 kernel 方法的 kernel continual learning 模型,通过采用 episodic memory 存储子集样本的方式,利用 kernel ridge regression 算法学习任务特定的分类器,避免 - IJCAI利用剧集记忆解决连续控制问题
本研究使用 Actor-Critic 架构,通过修改 critic 的目标函数,将记忆机制引入连续控制问题中,使用基于经验的记忆缓冲区优先级排列方式,验证了在广泛的行动空间下,使用记忆机制能够提高连续控制中代理的性能,并且相较于最先进的自由