BriefGPT.xyz
大模型
Ask
alpha
关键词
data-efficient training
搜索结果 - 2
ICML
变压器是通用预测器
本研究发现了 Transformer 架构在语言模型方面的局限性,证明了它在信息理论意义上具有普适预测性,并在非渐近数据区域中分析了各种 Transformer 架构组件的性能,尤其是在数据有效训练的情境中。我们通过对合成和真实数据集的实验
→
PDF
a year ago
ICLR
PseudoSeg: 为语义分割设计伪标签
本文提出了一种利用伪标签进行半监督语义分割训练的策略,通过合理融合不同来源和强数据增强来生成实验结果验证有效性。
PDF
4 years ago
Prev
Next