BriefGPT.xyz
Ask
alpha
关键词
persona policies
搜索结果 - 1
多模态对抗仿真学习中的游戏角色生成
本论文提出了一种用于玩家测试的多重个人策略生成的新型模仿学习方法 —— 多模态生成对抗模仿学习(MultiGAIL),其使用辅助输入参数来学习不同的个人策略,基于生成对抗模仿学习的多重判别器作为奖励模型,通过比较代理和不同专家策略来推断出环
→
PDF
a year ago
Prev
Next