BriefGPT.xyz
Ask
alpha
关键词
actor-critic network
搜索结果 - 4
使用策略适应去交织 Actor-Critic 网络以支持动态治疗方案
通过使用新的去混淆 actor-critic 网络模型,基于电子健康记录的强化学习机制的动态治疗模式可获得更好的患者个体化通气治疗决策,从而提高患者的预后。
PDF
2 years ago
生成对抗奖励学习用于泛化行为倾向推断
提出了一种基于生成式逆强化学习的用户行为偏好建模方法,该方法可以自动学习用户的行为奖励函数,并通过辨别式演员 - 评论家网络和 Wasserstein 生成对抗网络进行建模和解释,实验证明该方法在交通信号控制、在线推荐系统和注视路径预测等场
→
PDF
3 years ago
TranS^3: 一个基于 Transformer 的框架,用于统一代码摘要和代码搜索
本文提出了一种基于 Transformer 和 Actor-Critic 网络的框架 TranS^3,以整合代码概括和代码搜索,并证明其在这两个领域中均优于现有方法。
PDF
4 years ago
AAAI
使用深度强化学习掌握 MOBA 游戏中的复杂控制
本文提出了一种深度强化学习框架,从系统和算法两个角度来解决 Multi-player Online Battle Arena(MOBA)1v1 游戏中复杂动作控制的问题,通过包括控制依赖解耦、动作遮罩、目标注意力和双剪辑 PPO 等多种新颖
→
PDF
5 years ago
Prev
Next