BriefGPT.xyz
大模型
Ask
alpha
关键词
perception problems
搜索结果 - 3
ICLR
预训练视觉模型的无损调整在机器人操作中的应用
本文提出 “无损调适” 方案,以解决 fine-tuning 过程对预训练模型通用性的破坏,实验证明此方案在各种任务和模型(ViTs,NFNets 和 ResNets)上表现良好。
PDF
a year ago
CVPR
3D 场景理解的蒙特卡罗场景搜索
本论文探讨了如何利用通用 AI 算法进行 3D 场景理解来减少训练数据的需求,并提出了一种修改的蒙特卡洛树搜索算法,以从嘈杂的 RGB-D 扫描中检索对象和房间布局。在 ScanNet 数据集上应用本算法可以得到比一些手动注释更好的配置。
PDF
3 years ago
ICCV
视觉语言导航中可转移的表征学习
我们的方法将预先训练的视觉和语言表示技术适应于相关领域的任务,通过在跨模态序列对齐和序列一致性任务中适应这些表示技术,从而提高了在 Room-to-Room(R2R) 带权路径成功率(SPL)度量方面的性能。
PDF
5 years ago
Prev
Next