BriefGPT.xyz
Ask
alpha
关键词
structured priors
搜索结果 - 4
DiffMap: 使用扩散模型增强地图分割中的地图先验
构建高清地图是实现自动驾驶的关键需求之一。本研究提出了 DiffMap,一种利用潜在扩散模型对地图分割掩码的结构先验进行建模的新方法,可以提高语义分割方法的性能并有效修正分割输出中的结构错误,进而改进生成地图的质量。通过广泛的可视化分析,我
→
PDF
2 months ago
教学视频中的程序规划
本文提出 Dual Dynamics Networks(DDN)框架来解决学习结构化的、可规划的状态和动作空间的技术挑战,以应对复杂任务规划的问题;DDN 框架在真实世界的教学视频上展示了更好的规划性能。
PDF
5 years ago
基于方差的奖励函数用于近似贝叶斯强化学习
提出了一种基于后验概率分布的奖励加成方法,用于在 Bayesian RL 中解决探索与利用之间的困境,实现高效且有效的探索,能够利用结构化的先验知识,并证明其具有多项式样本复杂度。
PDF
12 years ago
贝叶斯多任务逆向强化学习
本文将逆向强化学习问题推广到多个任务,通过引入一定数量的结构化先验,我们将问题形式化为统计偏好提取。我们展示了我们的框架不仅允许我们从多个专家中有效地学习,而且还可以有效地区分每个专家的目标。
PDF
13 years ago
Prev
Next