BriefGPT.xyz
Ask
alpha
关键词
exploration algorithm
搜索结果 - 3
PAC 强化学习的主动覆盖
本研究提出了一个灵活的框架来解决强化学习过程中数据覆盖率问题,并通过 CovGame 算法来匹配最低采样复杂度,进而解决了不同的演示性增强学习任务问题。
PDF
a year ago
时间延长下的 ε- 贪心探索
本文提出了一种基于时域的 ε- 贪心探索算法,通过重复随机采样的行为来提高探索效果,该算法在许多不同领域都有良好的表现。
PDF
4 years ago
任务导向对话系统中深度强化学习的高效探索
提出了一种新的探索算法,基于 Bayes-by-Backprop 神经网络和重放缓冲区,可以大大提高深度 Q 学习在对话系统中的效率并比传统的探索策略学习得更快。
PDF
7 years ago
Prev
Next