Oct, 2022

容量有限认知及强化学习的速率失真理论

TL;DR本文介绍了一种信息理论模型,它使用一个有限传输速率的通信通道作为决策代理行为的描述,并在此基础上研究了一种基于学习目标的容量有限的决策制定方法, 为实现高效的学习算法提供了贝叶斯遗憾界的保证。