Jan, 2022

通过策略规范化对智能体进行特征化的强化学习

TL;DR该论文提出了一种基于正则化的强化学习方法,使代理人的行为具有指定的特征,从而增强了透明度和可解释性,并可应用于金融领域的个性化投资组合优化。