BriefGPT.xyz
大模型
Ask
alpha
关键词
actor-critic model
搜索结果 - 5
资产配置的深度强化学习:奖励剪切
本文旨在研究强化学习在资产配置中的应用,并比较了不同强化学习算法的表现,分析了每个模型的特点,引入了一种先进模型 Reward Clipping 并发现其在金融领域特别是投资组合优化中的优点更明显,特别是在牛市和熊市中。最后,本文将这些模型
→
PDF
2 years ago
AAAI
无监督的变形图像配准随机规划师 - 演员 - 评论家
该论文提出了一种基于强化学习方法的医学图像配准框架,引入了新的概念 Plan 来简化高维连续空间的训练过程,并在多个 2D 和 3D 医学影像数据集上进行了测试,结果表明该方法在注册大形变图像上表现优异且超过了同类算法。
PDF
3 years ago
CVPR
Actor-Critic 实例分割
该研究使用强化学习中的演员 - 评论家方法,在实例分割基准测试中始终提供准确度优势,以解决在场景中分割多个潜在相似且部分遮挡的对象的挑战性问题
PDF
5 years ago
未来成功学习解码
介绍了一种简单的、通用的策略,通过插值算法将 MLE-based 令牌生成策略的演员与能够估计所需属性的价值函数批判家结合来修改神经解码器的行为,从而生成具有特定属性(例如,预定长度的序列)的输出。该方法不仅能处理序列长度和后向概率等多种无
→
PDF
7 years ago
基于深度强化学习的室内场景目标驱动视觉导航
本研究解决深度强化学习的一些问题,如模型推理泛化能力差和数据效率低。提出一种策略演员 - 评论家模型,以目标以及当前状态为函数,并在 AI2-THOR 框架下应用模型以与物体交互,实现在 3D 场景中进行大量样本高效收集,易于应用到现实场景
→
PDF
8 years ago
Prev
Next