Feb, 2024

层次主动推断中的动态规划

TL;DR通过动态规划,我们指的是人脑推断和施加与认知决策相关的运动轨迹的能力。最近的范式 —— 主动推断,为生物有机体的适应提供了基本见解,不断努力减小预测误差以限制在适合生活的状态中。在过去的几年中,许多研究表明,人类和动物行为可以用主动推断的过程来解释,无论是作为离散决策还是连续运动控制,这激发了机器人技术和人工智能领域的创新解决方案。然而,文献对于如何在不断变化的环境中有效规划行动仍缺乏全面的展望。本研究以建模工具使用为目标,深入探讨了主动推断中的动态规划主题,牢记生物目标导向行为的两个关键方面:理解和利用物体操纵的作用机会,以及学习自身与环境(包括其他代理者)之间的分层交互。我们从一个简单单元开始,逐渐描述更高级的结构,比较最近提出的设计选择,并为每个部分提供基本示例。本研究与传统的神经网络和强化学习的观点不同,指向主动推断中尚未开拓的方向:分层模型中的混合表示。