BriefGPT.xyz
大模型
Ask
alpha
关键词
policy function
搜索结果 - 3
相当好的控制:何时近似解法比近似模型更好
现有的最优控制方法在处理真实系统中常遇到的复杂性(包括维度、过程误差、模型偏差和数据异质性)时遇到困难。最优控制方法通常寻求简化模型以适应,但何时适用于近似的、简化的模型的最优解胜过适用于更准确的模型的近似解尚未得到充分回答。深度强化学习(
→
PDF
10 months ago
在强化学习中学习稀疏表示
本文探讨强化学习算法中的 TD Learning 和基础节疤核在强化学习中的作用,使用计算机模拟来验证利用稀疏的联合表示来学习在特定环境下获得预期奖励的好处。
PDF
5 years ago
端到端自主驾驶的高效查询模仿学习
本论文介绍了一种名为 SafeDAgger 的基于 DAgger 算法的自动驾驶智能学习方法,能够有效地减少对参考策略的查询次数,加快收敛速度。
PDF
8 years ago
Prev
Next