Sep, 2023

透過忠實引出的解釋性策略抽取在強化學習中

TL;DR通过引入忠实度衡量机制并将其与强化学习反馈相结合,FIPE 方法在解释性和一致性方面优于现有方法,实验证明其在复杂控制环境中的性能和可理解性均较好。