有限认知负荷下的贝叶斯强化学习

May, 2023

有限认知负荷下的贝叶斯强化学习

Bayesian Reinforcement Learning with Limited Cognitive Load

Dilip Arumugam, Mark K. Ho, Noah D. Goodman, Benjamin Van Roy

TL;DR生物和人工智能在决策过程中都受到信息处理能力的限制，因此一般的自适应行为理论应该考虑代理的学习历史、决策和能力约束之间的复杂交互。最近的计算机科学研究开始通过强化学习、贝叶斯决策制定和速率失真理论中的思想来澄清这些动态的形成规律。这项研究成果提出了基于能力限制的贝叶斯强化学习的规范框架，用于模拟处理约束对学习和行动选择的影响。本文对这一领域的最新算法和理论结果进行了简明审视，特别关注如何将这些思想应用于认知和行为科学中的问题。

Abstract

All biological and artificial agents must learn and make decisions given limits on their ability to process information. As such, a general theory of adaptive behavior should be able to account for the complex interactions between an agent's →

adaptive behavior learning history capacity constraints reinforcement learning bayesian decision-making

发现论文，激发创造

容量有限认知及强化学习的速率失真理论

本文介绍了一种信息理论模型，它使用一个有限传输速率的通信通道作为决策代理行为的描述，并在此基础上研究了一种基于学习目标的容量有限的决策制定方法，为实现高效的学习算法提供了贝叶斯遗憾界的保证。

Oct, 2022

信息论有界理性

本文提出了基于信息理论思想的有限理性理论，并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策，扩展后得到的类别决策问题非常广泛，包括古典决策规则等极限情况以及可信和风险敏感规划。

Dec, 2015

将行为约束纳入在线 AI 系统

通过行为约束的观察来学习一组行为约束的新型在线代理，称为 Behavior Constrained Thompson Sampling（BCTS）。我们提供了一个新算法，允许在遵守外生约束条件的情况下进行在线学习。我们的实验表明，这种代理能够在行为约束集合内运行，而不会明显降低其整体奖励性能。

Sep, 2018

以计算有限的强化学习为基础的持续学习

一个高效地累积知识、在长期生命周期中不断发展更复杂技能的代理机构，可以推动人工智能能力的前沿。本文概述和形式化了持续学习的概念，引入了一个框架和一套工具来激发进一步的研究。

Jul, 2023

逐步强化学习

该论文讨论了如何设计数据高效的强化学习智能体，提供了信息获取、信息表示和信息保留等方面的原则指导，并通过简单智能体的计算结果强调了数据效率的重要性。

Mar, 2021

使用脑启发的调制强化学习可以提高对环境变化的适应能力

研究提出了一种新的神经元学习规则，它使用突触前输入来调制预测误差，将其嵌入表格和深度 Q 网络强化学习算法中，可以在简单而高动态的任务中胜过传统算法，这提出了一种新的生物智能核心原则。

May, 2022

有限理性代理人的决策制定

通过将有限理性概念与信息论观点相结合，将其融入博弈论框架中以预测自己及其它机器人或人类邻近代理的行为以及在其计算限制下采取行动，模拟与实际实验都证明这种方法可以帮助机器人推理其他代理的不同智能水平并计算出合理的策略。

Oct, 2022

使用主动推理的贝叶斯策略选择

该论文研究了基于自由能原理的主动推理对机器学习中的强化学习和示范学习问题的解决，并将此概念应用于标准问题山车问题，结果表明主动推理可以涵盖强化学习和示范学习技术。

Apr, 2019

交互式学习的信息论方法

本文提出了一种量化的交互式学习和自适应行为方法，并从模型和决策制定的角度整合了行为反馈。通过在最小复杂度下最大化预测能力，导出了最优行为政策和模型的类，并总结了这一过程的因果组织。该方法的基本原则之一是学习者的最优行为政策需要在勘探和控制之间保持平衡，这是一个新的重点。

Sep, 2007

智能问题解决作为集成的分层强化学习

通过综述认知心理学的文献，探讨分解抽象和预测处理等认知机制对分层机器学习的影响，并提出集成这些认知机制的方案来提升人工智能问题解决能力。

Aug, 2022