BriefGPT.xyz
Ask
alpha
关键词
in-batch negative
搜索结果 - 1
面向内存受限环境的深层对比学习批量大小缩放
该论文介绍了一种称为渐变缓存的技术,该技术使用批次内负样本来学习高质量表示,并使得梯度可以逐个子集计算,从而减少内存使用。
PDF
3 years ago
Prev
Next