BriefGPT.xyz
Ask
alpha
关键词
cross-entropy guided policies
搜索结果 - 1
基于交叉熵引导策略的连续动作 Q 学习
本文提出了一个名为 Cross-Entropy Guided Policies (CGP) 的新方法来将 Q-learning 与使用 Cross-Entropy Method (CEM) 的迭代采样策略相结合,以提高其在连续值动作域中的运
→
PDF
5 years ago
Prev
Next