BriefGPT.xyz
Ask
alpha
关键词
test loss
搜索结果 - 3
ICML
自我监督学习中是否存在双重跌落现象?
在自监督模型中,双下降现象可能不存在,两种未被研究的设置(标准自编码器和线性自编码器)的测试损失曲线分别为经典的 U 形或单调递减形,这一结果帮助我们更好地认识此现象的理论基础。
PDF
a year ago
多任务学习中高效识别任务分组
本文提出了一种方法来选择哪些任务应该在多任务学习模型中共同训练,该方法通过训练所有任务并量化一个任务的梯度对其他任务损失的影响来确定任务分组,实验结果表明相较于在一起训练所有任务,该方法可以在 11.6 倍的速度下将测试损失降低 10%。
PDF
3 years ago
ICLR
基于结构化特征的随机梯度下降学习曲线
研究机器学习算法(如神经网络)的泛化能力如何受数据分布结构影响,提出了一种基于随机梯度下降的可解模型来预测任意协方差结构的特征测试误差,并在各种数据集上验证其准确性;同时证明小批量 SGD 在固定计算预算下的最优批量通常较小,取决于特征相关
→
PDF
3 years ago
Prev
Next