BriefGPT.xyz
Ask
alpha
关键词
online computation
搜索结果 - 2
在线计算与不可信的建议
该研究考虑了在线计算的建议模型下,建议来源于不受信任的源头所带来的影响,并以滑雪租赁、装箱问题等在线问题为研究对象,得出了根据建议是否可信获得最差情况下的竞争性质算法的结论,解决了现有模型无法解决的差异化问题。
PDF
5 years ago
使用 Reservoir Sampling 将情景记忆集成到强化学习智能体中
该文研究了利用固定数量的过去状态来维护一个外部内存的新算法,使得深度强化学习代理能够在线记忆有用的状态,并可以在在线强化学习设置中实现梯度估计。
PDF
6 years ago
Prev
Next