BriefGPT.xyz
Ask
alpha
关键词
assume-guarantee paradigm
搜索结果 - 1
AAAI
假设保证强化学习
我们提出了一种模块化的强化学习方法,其中环境由并行演化的简单组件组成,通过对邻近组件行为进行假设并提供自身行为保证来独立合成每个组件的最优控制器。我们通过将假设 - 保证合同表达为正则语言并自动将其转换为 RL 中使用的标量奖励,结合每个组
→
PDF
7 months ago
Prev
Next