BriefGPT.xyz
大模型
Ask
alpha
关键词
factorized distribution
搜索结果 - 2
ICML
随机束和它们的发现:Gumbel-Top-k 技巧在不重复采样序列中的应用
应用 Gumbel-Top-k 技巧和分解可重复采样,使用随机束搜索进行无重复抽样序列模型的研究,发现序列采样中存在随机束搜索和确定性束搜索之间的理论联系,这一方法在翻译任务中表现优异,且采样无重复序列可用于构造期望 BLEU 得分和模型熵
→
PDF
5 years ago
AAAI
离散化连续动作空间的策略优化
本文研究了对连续控制中动作空间的离散化对于基于策略优化的影响,发现动作空间的离散化采用可分解动作分布的策略可以有效地解决离散动作数量的爆炸性增长,并且在复杂动态高维任务上可以通过在策略中使用序数参数化引入自然排序从而获得性能显著提升的优越表
→
PDF
5 years ago
Prev
Next