BriefGPT.xyz
Ask
alpha
关键词
idql
搜索结果 - 1
IDQL: 基于扩散策略的隐式 Q 学习作为一个演员 - 评论家方法
使用 Diffusion parameterized behavior policy 和 Implicit Q-learning (IQL) 模型,提出了一个新的 actor-critic 模型,称为 Implicit Diffusion
→
PDF
a year ago
Prev
Next