BriefGPT.xyz
Ask
alpha
关键词
visualize the policy structure
搜索结果 - 1
REVEAL-IT: 可解释性的具备进化 Agent 策略的增强学习
在本文中,我们提出了 REVEAL-IT 框架,用于解释复杂环境中代理人的学习过程。我们通过可视化策略结构和代理人在各种训练任务中的学习过程来理解一个特定的训练任务或阶段对代理人在测试中的性能有多大影响。然后,基于图神经网络的解释器学习突出
→
PDF
16 days ago
Prev
Next