policy design | BriefGPT - AI 论文速递

关键词policy design

搜索结果 - 5

Ravestate：基于因果特异性引导的交互策略的分布式组合
在人机交互政策设计中，一种基于规则的方法是高效、可解释、表达力强且直观的。本文介绍了 Signal-Rule-Slot 框架，该框架改进了基于规则的符号系统设计的先前工作，并引入了一种新的贝叶斯交互规则效用概念 - 因果路径自信息。我们提供
PDF9 months ago
用于最优治疗方案和最优策略设计的加权稀疏决策树快速优化
本研究提出了三种算法来高效地稀疏加权决策树优化，解决了算法无法处理加权数据样本的问题，这在影响个体数据点上的倒数概率加权方面有重要应用.
PDF2 years ago
经济政策的强化学习：一个新的前沿？
该论文回顾了传统的代理人建模技术在经济建模中的历史障碍，并思考最近强化学习等新兴技术能否克服其中的一些问题。
PDF2 years ago
使用 AI 经济学家建立数据驱动、可解释和健壮的政策设计基础
AI Economist 框架结合两级强化学习和数据驱动的模拟，可用于优化政策设计，经实验证明该框架在 COVID-19 时期的政策制定中能够显著提高社会福利。
PDF3 years ago
信息受限基元的竞争性集成强化学习
通过信息理论机制，提出了一种基于分解原语的策略输入的设计方法，这种方法比扁平和分层策略的泛化性都更好。
PDF5 years ago