Mar, 2024

线性可解的 MDP 与线性二次调节器的 Tsallis 熵正则化

TL;DR对线性可解的 MDP 和线性二次调节器采用 Tsallis 熵来实现正则化,从而在探索和控制规律的稀疏性之间取得平衡。