visual backbones | BriefGPT

关键词visual backbones

搜索结果 - 4

ICCVEfficientTrain++：高效视觉主干训练的广义课程学习
通过使用更简单的数据对形成更难样式的模型进行培训，我们将课程学习的思想进行了一般化。我们通过引入傅立叶光谱的裁剪操作和数据增强的强度调制，设计出一种简单而高效的培训方法 EfficientTrain++，它减少了各种流行模型在 ImageN
PDF2 months ago
CVPRPVUW2023 VSS 赛道第三名方案：基于大型模型的 VSPW 语义分割
本论文介绍了基于 InternImage-H 和 Mask2former 的视觉背骨和分割头以及 CascadePSP 和 Segment Anything Model 这两种后处理方法在视频语义分割中的应用，最终在 PVUW2023 VS
PDFa year ago
EfficientTrain: 探索通用课程学习，以培训视觉主干
本文提出一种新的课程学习方法，以高效训练视觉骨干（例如视觉变换器）。该方法利用深度网络的内在学习动态，实现在训练早期仅学习每个样例中更容易学习的部分，逐渐增加难度。通过在输入的 Fourier 频谱中引入裁剪操作，本方法可以更高效地学习低频
PDF2 years ago
CVPR简单而有效：CLIP 嵌入用于具身人工智能
通过比较使用传统的 ImageNet 预训练模型和使用 CLIP 模型训练的模型，在实现与物理机器人和虚拟模拟任务相关的领域，我们展示并证明了在不加入神经复杂性、语义地图、辅助训练任务与深度图等的情况下使用 EmbCLIP 基线的高性能表现
PDF3 years ago