BriefGPT.xyz
大模型
Ask
alpha
关键词
model error
搜索结果 - 4
强化学习中的最大熵模型修正
我们提出并理论分析了一种在强化学习中使用近似模型进行规划的方法,可以减少模型误差的不利影响,并且如果模型足够准确,还可以加速收敛到真实值函数。其中一个关键组成部分是基于最大熵密度估计形式的 MaxEnt 模型校正(MoCo)过程,该过程根据
→
PDF
7 months ago
COPlanner: 保守推进并乐观探索的模型引导强化学习规划器
提出了一种基于规划的框架 $ exttt {COPlanner}$,通过保守的模型展开和乐观的环境探索,解决了模型误差问题,提高了模型强化学习方法的样本效率和渐近性能。
PDF
9 months ago
运用机器学习技术纠正数据同化和预测应用中的模型误差
本研究将机器学习和数据同化相结合,提出了一种迭代方法来纠正现有知识型模型的误差,为地球科学建立了一个混合替代模型,该模型在短期到中期范围内有更好的预测表现
PDF
4 years ago
高斯过程回归的一致误差界及其在安全控制中的应用
本文利用高斯过程分布和连续性论证推导出一种新的弱假设下的统一误差界,分析了概率 Lipschitz 常数的演变和 Gaussian Process 模型控制未知动态系统的安全条件,且采用模拟程序验证了此方法的有效性。
PDF
5 years ago
Prev
Next