BriefGPT.xyz
Ask
alpha
关键词
bayes-by-backprop neural network
搜索结果 - 2
任务导向对话系统中深度强化学习的高效探索
提出了一种新的探索算法,基于 Bayes-by-Backprop 神经网络和重放缓冲区,可以大大提高深度 Q 学习在对话系统中的效率并比传统的探索策略学习得更快。
PDF
7 years ago
BBQ-Networks: 面向任务型对话系统的深度强化学习高效探索
该研究提出了一种新算法,通过 Thompson 采样和 Bayes-by-Backprop 神经网络,可以显著提高深度 Q 学习代理在对话系统中的探索效率,并表明混合已成功经历的 episode 的回放池可以使 Q 学习成为可能。
PDF
8 years ago
Prev
Next