BriefGPT.xyz
Ask
alpha
关键词
interpretable policy extraction
搜索结果 - 1
透過忠實引出的解釋性策略抽取在強化學習中
通过引入忠实度衡量机制并将其与强化学习反馈相结合,FIPE 方法在解释性和一致性方面优于现有方法,实验证明其在复杂控制环境中的性能和可理解性均较好。
PDF
10 months ago
Prev
Next