提出了一种通过识别和利用决策的实用结构,在机器学习系统中制定简化抽象的方法,该方法自动配置输出空间以最小化决策相关信息的损失,该方法通过减少所需的数据实现了更好的决策质量。
Mar, 2023
本文提出了基于信息理论思想的有限理性理论,并提供了将自由能量函数作为表征有限理性决策的目标函数的概念上的理据。该文讨论了单步决策以及如何使用等价变换将其扩展到序贯决策,扩展后得到的类别决策问题非常广泛,包括古典决策规则等极限情况以及可信和风险敏感规划。
Dec, 2015
该论文提出了一个信息论的有界理性决策模型,其中决策者在预期效用和信息处理成本之间进行权衡,被视为物理状态发生变化时的热力学机器,行为受制于自由能泛函。当忽略计算成本时,该模型还原为最大化预期效用原则。
Apr, 2012
本文介绍了一种信息理论模型,它使用一个有限传输速率的通信通道作为决策代理行为的描述,并在此基础上研究了一种基于学习目标的容量有限的决策制定方法, 为实现高效的学习算法提供了贝叶斯遗憾界的保证。
Oct, 2022
本文介绍了强化学习中抽象的理论,提供了符合需求的抽象函数的要求,并介绍了一组新算法和分析,旨在最大程度地减少有效强化学习的复杂性。
Mar, 2022
该研究旨在使用奖励函数来有效地做出明智的决策,通过提出抽象观测模型来降低计算成本并推导出期望信息论奖励函数的界限以及价值函数的界限,同时,提出了一种用于改善聚合方法的方法,实现了相同动作选择的计算时间减少。
Jan, 2022
通过聚类变量及其域的方法,发展了一种新的因果抽象方法,以更好地适应由 Pearl 的因果层次结构引发的个体因果分布,并进一步将这些结果与表示学习相结合,将这些结果更接近实际应用。
Jan, 2024
研究信息 - 理论有限理性的决策者组合问题,并提出了一种基于在线学习规则的问题空间的分区方案,旨在通过特定线性策略求解提高效率和减少成本。该模型适用于分类,回归,强化学习和自适应控制等领域。
Jul, 2019
本文综述了人类学习、推理和适应新领域的关键能力 —— 概念抽象和类比制定,以及通过符号方法、深度学习和概率编程归纳等多种途径构建具有这些能力的 AI 系统的优势和局限性,最后提出了设计挑战任务和评估指标的几点建议,以在此领域取得量化和可推广的进展。
Feb, 2021
探究决策代理如何在不完全了解环境的情况下,通过理性获取信息构建最优学习目标,同时基于信息导向采样(information-directed sampling)和速率失真理论(rate-distortion theory)提出了一种有效的学习目标设计和信息获取方法,通过实验证明了信息获取在决定学习内容方面的价值。
Oct, 2021