BriefGPT.xyz
Ask
alpha
关键词
regularized reinforcement learning
搜索结果 - 1
解耦动作空间的正则化
研究论文的主要内容是关于正则化强化学习,尤其是熵正则化的方法在最优控制和逆强化学习方面的应用。论文指出,改变动作数量对于标准非正则化强化学习方法没有影响,但会严重影响正则化的方法。为了避免过度正则化,需要解耦作用空间与正则项,并提出两种解决
→
PDF
a month ago
Prev
Next