BriefGPT.xyz
Ask
alpha
关键词
policy design
搜索结果 - 5
Ravestate:基于因果特异性引导的交互策略的分布式组合
在人机交互政策设计中,一种基于规则的方法是高效、可解释、表达力强且直观的。本文介绍了 Signal-Rule-Slot 框架,该框架改进了基于规则的符号系统设计的先前工作,并引入了一种新的贝叶斯交互规则效用概念 - 因果路径自信息。我们提供
→
PDF
9 months ago
用于最优治疗方案和最优策略设计的加权稀疏决策树快速优化
本研究提出了三种算法来高效地稀疏加权决策树优化,解决了算法无法处理加权数据样本的问题,这在影响个体数据点上的倒数概率加权方面有重要应用.
PDF
2 years ago
经济政策的强化学习:一个新的前沿?
该论文回顾了传统的代理人建模技术在经济建模中的历史障碍,并思考最近强化学习等新兴技术能否克服其中的一些问题。
PDF
2 years ago
使用 AI 经济学家建立数据驱动、可解释和健壮的政策设计基础
AI Economist 框架结合两级强化学习和数据驱动的模拟,可用于优化政策设计,经实验证明该框架在 COVID-19 时期的政策制定中能够显著提高社会福利。
PDF
3 years ago
信息受限基元的竞争性集成强化学习
通过信息理论机制,提出了一种基于分解原语的策略输入的设计方法,这种方法比扁平和分层策略的泛化性都更好。
PDF
5 years ago
Prev
Next