深度网络训练中课程学习的威力

ICMLApr, 2019

On The Power of Curriculum Learning in Training Deep Networks

Guy Hacohen, Daphna Weinshall

TL;DR本研究分析了课程学习对深度神经网络训练的影响，使用转移学习和自举法解决难度排序问题，以及不同的步伐函数指导采样，并最终证明其有效地修改了优化模型的全局最小解。

Abstract

Training neural networks is traditionally done by providing a sequence of random mini-batches sampled uniformly from the entire training data. In this work, we analyze the effect of curriculum learning, which inv

neural networks curriculum learning cnns transfer learning optimization landscape

发现论文，激发创造

基于转移学习的课程学习：深度网络的理论和实验

本文针对在随机梯度下降优化凸线性回归损失时的课程学习进行了理论研究，并探讨了在训练卷积神经网络时如何通过迁移学习推断课程学习。实验证明，理论与实践表现相似，课程学习能够有效地提升模型的泛化性能，并对异常情况拥有鲁棒性。

Feb, 2018

课程学习：综述

该文介绍了如何通过课程学习来训练机器学习模型，从而提高性能和准确率，并且探讨了如何排序和引入更难的数据，同时提供了未来工作的一些方向。

Jan, 2021

关于使用混合输入进行奇偶目标的课程学习可证明的优势

采用课程学习策略和稀疏样本可改善神经网络学习效率，对于一个混合了稀疏和密集输入的数据分布，采用应用在稀疏样本中的 curriculum noisy-GD/SGB 算法训练的 2 层 ReLU 神经网络可在有限的步数内学习到足够大次数的奇偶类型问题，而对于任何通过 noisy-GD/SGB 算法训练的神经网络，无论宽度或深度的大小，都需要额外的步骤才能学习，这可以通过理论和实验得出的结论加以支持。

Jun, 2023

神经机器翻译中课程学习的实证探索

采用概率课程学习方法，可以在不损失翻译质量的前提下，缩短德语 - 英语翻译模型的收敛时间，但具体效果受到样本难度标准、课程表和超参数的影响。

Nov, 2018

神经网络的自动课程学习

本篇论文提出了一种新的方法，通过评估学习进程来自动化选择神经网络学习课程，从而最大化学习效率。通过提供来自学习进展指标的信号以激励非静态多臂赌博机算法来的确定随机教学计划。对于 3 个课程上的 LSTM 网络的实验结果表明，我们的方法可以显著加快学习速度，在某些情况下，将实现令人满意的性能水平所需的时间减半。

Apr, 2017

信息检索的课程学习策略：一个基于对话响应排序的实证研究

本文探讨了在神经检索模型训练中，如何通过对训练数据进行智能排序（即通过实行课程学习）来提高检索效率。作者利用大规模数据和会话响应排序任务，研究了如何确定难度以及如何过渡到更难的实例，取得了 2％的性能改进。

Dec, 2019

课程何时奏效？

本文通过实验研究探究按难度排序训练的有效性，发现在标准测试数据集中，curricula 只有微弱的优势，证明其优势完全来自动态的训练集大小，同时发现在有限时间预算或数据存在噪声的情况下，curriculum 学习可以提高性能，而 anti-curriculum 则不能。

Dec, 2020

EfficientTrain: 探索通用课程学习，以培训视觉主干

本文提出一种新的课程学习方法，以高效训练视觉骨干（例如视觉变换器）。该方法利用深度网络的内在学习动态，实现在训练早期仅学习每个样例中更容易学习的部分，逐渐增加难度。通过在输入的 Fourier 频谱中引入裁剪操作，本方法可以更高效地学习低频信息，并通过减弱数据增强以暴露原始图像特征，设计了一种课程学习计划。结果表明，此方法简单、通用、有效，可以在不损失准确性的情况下，在 ImageNet-1K/22K 上将多种流行模型（例如 ResNet、ConvNeXt、DeiT、PVT、Swin 和 CSWin）的训练时间缩短 > 1.5 倍。

Nov, 2022

训练样本的顺序重要吗？使用课程学习改进神经数据转文本生成

本文研究从结构化数据和文本对中选择训练样本以优化 CURRICULUM LEARNING，并提出了一种软编辑距离度量方法，实验表明，该方法能够提高训练速度和性能。

Feb, 2021

可视化和理解长短期记忆网络的课程学习

本文研究了课程学习对长短期记忆 (LSTM) 网络的影响，其中包括情感分析任务和与自然语言处理中序列预测任务相似的合成任务。实验表明，课程学习对 LSTM 的内部状态有积极影响，可以帮助构建有建设性的表示，特别是在训练数据有限的情况下可以发挥更大的作用。此外，当使用课程学习时，模型的大小也会显著提高。

Nov, 2016