BriefGPT.xyz
大模型
Ask
alpha
关键词
convex coverage set
搜索结果 - 2
ICML
基于乐观的线性支持和继承特征的最优策略转移
介绍了一种基于 SF 的新算法,它允许 RL 代理结合现有策略,并在任意新问题上直接识别出最优策略,无需进一步与环境进行交互。该算法可通过广义策略改进将策略组合形成最优行为,且性能优于现有竞争算法。
PDF
2 years ago
多目标深度强化学习
文章提出 DOL 方法,通过使用高维输入的特征,计算包含所有潜在最优解的凸组合集,解决了高维多目标决策问题,并提供了一个包含两个实验的基准测试平台用于深度多目标强化学习。
PDF
8 years ago
Prev
Next