BriefGPT.xyz
Ask
alpha
关键词
extremum-seeking control
搜索结果 - 1
极值寻求动作选择以加速策略优化
通过引入基于极值搜索控制的自适应控制步骤,改进了模型自由强化学习中的动作选择,在标准策略优化中提高了学习效率。
PDF
3 months ago
Prev
Next