BriefGPT.xyz
Ask
alpha
关键词
regularize
搜索结果 - 2
ACL
重新考虑编码器 - 解码器中的扰动以实现快速训练
研究比较序列到序列问题中常用的扰动方法,包括定期抽样、对抗性扰动、词随机替换等,结果表明速度更快的简单技术如词元删除、输入符号的随机替换等与新提出的扰动方法具有可比性或者更好的性能。
PDF
3 years ago
ICLR
KL 正则化强化学习中的信息不对称
研究如何通过限制收集到的信息,学习可重用行为作为默认策略,从而加速和规范学习过程,同时探讨了该策略与信息瓶颈方法和变分 EM 算法之间的联系,并在离散和连续动作领域提出了经验结果。
PDF
5 years ago
Prev
Next