BriefGPT.xyz
Ask
alpha
关键词
exploration and sparsity
搜索结果 - 1
线性可解的 MDP 与线性二次调节器的 Tsallis 熵正则化
对线性可解的 MDP 和线性二次调节器采用 Tsallis 熵来实现正则化,从而在探索和控制规律的稀疏性之间取得平衡。
PDF
4 months ago
Prev
Next