BriefGPT.xyz
Ask
alpha
关键词
training recipes
搜索结果 - 4
TinyLLaVA:一个小规模大型多模态模型的框架
通过 TinyLLaVA 框架的研究与实验,我们发现数据的质量、训练配方和模型选择对于设计和分析小规模的大型多模型模型非常重要;通过将更好的数据质量和更好的训练配方相结合,我们发现较小规模的模型可以与更大规模的模型达到相当的性能,这些发现可
→
PDF
4 months ago
MixCon3D: 协同多视角和跨模态对比学习的混合 3D 表征增强
MixCon3D 结合 2D 图像和 3D 点云之间的互补信息,增强对比学习,并通过提供更准确全面描述真实世界 3D 物体的多视图 2D 图像集成,增强传统的三模态表示,加强文本对齐。我们对 3D 对比学习的各种训练配方进行了全面调查,并建
→
PDF
8 months ago
ICCV
图像三维物体检测的公平和全面比较
我们构建了一个模块化设计的代码库,制定了强大的训练配方,设计了一个错误诊断工具箱,讨论了基于图像的三维物体检测的当前方法。
PDF
9 months ago
ICML
带有衰减剪枝掩码的 N:M 结构稀疏化训练配方
本文研究 N:M 稀疏性训练的不同方法,并提出了两种新的基于衰减的修剪方法,即 “修剪掩码衰减” 和 “稀疏结构衰减”。研究表明,这些提出的方法在保持与非结构化稀疏性可比的模型精度同时,增加的总训练计算量(FLOPs)相对较小。
PDF
2 years ago
Prev
Next