BriefGPT.xyz
Ask
alpha
关键词
visual backbones
搜索结果 - 4
ICCV
EfficientTrain++:高效视觉主干训练的广义课程学习
通过使用更简单的数据对形成更难样式的模型进行培训,我们将课程学习的思想进行了一般化。我们通过引入傅立叶光谱的裁剪操作和数据增强的强度调制,设计出一种简单而高效的培训方法 EfficientTrain++,它减少了各种流行模型在 ImageN
→
PDF
2 months ago
CVPR
PVUW2023 VSS 赛道第三名方案:基于大型模型的 VSPW 语义分割
本论文介绍了基于 InternImage-H 和 Mask2former 的视觉背骨和分割头以及 CascadePSP 和 Segment Anything Model 这两种后处理方法在视频语义分割中的应用,最终在 PVUW2023 VS
→
PDF
a year ago
EfficientTrain: 探索通用课程学习,以培训视觉主干
本文提出一种新的课程学习方法,以高效训练视觉骨干(例如视觉变换器)。该方法利用深度网络的内在学习动态,实现在训练早期仅学习每个样例中更容易学习的部分,逐渐增加难度。通过在输入的 Fourier 频谱中引入裁剪操作,本方法可以更高效地学习低频
→
PDF
2 years ago
CVPR
简单而有效:CLIP 嵌入用于具身人工智能
通过比较使用传统的 ImageNet 预训练模型和使用 CLIP 模型训练的模型,在实现与物理机器人和虚拟模拟任务相关的领域,我们展示并证明了在不加入神经复杂性、语义地图、辅助训练任务与深度图等的情况下使用 EmbCLIP 基线的高性能表现
→
PDF
3 years ago
Prev
Next