ICLRFeb, 2017

学习需要学习的数据

TL;DR本文提出了一种基于深度强化学习框架的自适应数据选择策略,名为神经数据过滤(NDF),它利用神经网络自适应地选择和过滤重要数据实例,以最大化未来的累计奖励,并在各种神经网络建模和应用中取得了与标准随机梯度下降过程相当的准确度。