BriefGPT.xyz
Ask
alpha
关键词
parametric markov decision process
搜索结果 - 1
可验证的组合性强化学习系统
我们提出了一个可验证和组合的强化学习框架,其中一组强化学习子系统被组合起来以实现整体任务,子系统之间通过定义接口和部分可观察性相互交互。实验结果展示了该框架在各种环境中的新颖功能。
PDF
10 months ago
Prev
Next