BriefGPT.xyz
大模型
Ask
alpha
关键词
data scale
搜索结果 - 5
从合成音频 Doppelgangers 进行对比学习
通过使用合成音频生成具有因果关系的音色、音高和时间包络变化的混合音频,我们提出了一种轻量级的方法来学习健壮的音频表示,该方法可以减轻从真实世界音频中获取大规模数据的负担,并在标准音频分类基准上取得强大的表现。
PDF
25 days ago
CVPR
DiverGen: 通过学习更多样化的生成数据改善实例分割中的数据分布
通过构建多样化的生成数据集策略以提高模型性能,我们的 DiverGen 方法在 LVIS 数据集上较强模型 X-Paste 表现出更好的实例分割效果,所有类别平均精确度提高了 1.1%,稀有类别的平均精确度提高了 1.9%(框)和 2.5%
→
PDF
2 months ago
自动驾驶中的开源数据生态系统:现状与未来
通过系统考察当前两代自动驾驶数据集,本综述提供关于高质量数据集创建原则、数据引擎系统的关键作用,以及采用生成式基础模型促进可扩展数据生成等方面的见解。此外,本综述还详细分析了第三代自动驾驶数据集应具备的特征和数据规模,并深入探讨需要解决的科
→
PDF
7 months ago
重新审视人 - 场景交互的空间占用
人 - 场景交互生成是一项具有挑战性且关键的任务,但是受到有限的数据规模的限制。通过将纯运动序列视作与不可见场景占用交互的记录,利用大规模配对的数据集 Motion Occupancy Base(MOB),我们提出了一种新的人 - 占有交互
→
PDF
7 months ago
自监督学习对语音识别的受益及演讲者识别
本研究通过 Voxceleb-1 数据集进行了一系列实验来探究自监督学习在演讲者相关任务中表现良好的因素,结果表明模型的收益来源于语音预测损失、数据规模和模型大小的组合,同时自监督量化器的影响较小。我们进一步采用了集成梯度属性方法和损失函数
→
PDF
2 years ago
Prev
Next