BriefGPT.xyz
Ask
alpha
关键词
new environment
搜索结果 - 1
ICML
离线强化学习中从单个任务中发现多个解决方案
通过研究在线强化学习,在少样本适应新环境的情况下,从一个任务中学习多种行为的优势已经被证明。然而,在离线强化学习中,学习多个解决方案的适当方法并未在先前研究中得到充分探讨。本研究因此解决了在离线强化学习中从单个任务中找到多个解决方案的问题。
→
PDF
a month ago
Prev
Next