Mar, 2023

深度主动推理的解构

TL;DR本文介绍了基于主动推理的深度强化学习理论,利用 Monte-Carlo 搜索和深度学习扩展此框架,实现更复杂任务的解决,实验表明,除了最后一层的 critic network 以及转移和编码器网络的方差层,将期望自由能最小化的主动推理代理与将奖励最大化的代理的学习表示相似,但前者会因动作选择一直选择下方而无法收集足够多的数据,与后者相比差异在于双方的认知价值。