Nov, 2023

集群政策决策排名

TL;DR通过统计协方差估计的黑盒方法,基于聚类和决策重要性排序,来分析强化学习任务中决策对奖励的贡献和重要性,并与之前的基于统计错误定位的排序方法进行了比较。