Mar, 2024

深度强化学习的最优策略稀疏化和低秩分解

TL;DR使用 $L_0$- 范数正则化技术稀疏化深度强化学习策略,通过低秩分解提供压缩效果,以减少计算资源消耗和限制过拟合。