BriefGPT.xyz
Ask
alpha
关键词
optimization stability
搜索结果 - 3
通过样本操作提高安全强化学习的效率
通过样本操作提高安全强化学习的效率,动态调整采样过程以最大程度地最小化成本和最大化奖励之间的平衡,ESPO 理论上保证了收敛性、优化稳定性和改善样本复杂性界限。在 Safety-MuJoCo 和 Omnisafe 基准测试中,ESPO 在奖
→
PDF
a month ago
高质量表面重建的高斯点云
我们提出了一种新颖的基于点的表示方法,高斯 surfels,通过直接将 3D 高斯点的 z 缩放设置为 0,将原始的 3D 椭球形状变为 2D 椭圆,进而提供了对优化过程的明确指导,从而在优化稳定性和表面对齐方面取得了显著的改进。我们还设计
→
PDF
2 months ago
CVPR
基于流的核先验方法在盲超分辨率中的应用
本文提出了一种基于正交流的核先验(FKP),可以有效地解决缺失约束的核估计问题,其中,FKP 可以在隐空间中优化核而不是网络参数空间,从而提供了合理的核初始化,遍历学习到的核流形并提高优化稳定性。
PDF
3 years ago
Prev
Next