- ICML大批次经验回放
本文将回放缓冲区采样问题看作梯度估计的重要采样问题,并提出了一种新的采样方案 LaBER,与 DQN、分布式 RL 和 actor-critic 方法相结合,能够在 Atari 游戏和 PyBullet 环境中提供比其他优先级方案更好的性能 - 机器学习中离散随机性的 Gumbel-max 技巧及其扩展综述
本文介绍了使用 Gumbel-max trick 从分类分布中抽样的方法,并概述了该方法的扩展,包括从结构化领域中抽样、多重抽样、通过渐变估计神经网络优化中的误差反向传播等,并提供了以 Gumbel 为基础算法的机器学习文献综述、常见设计选 - IJCAI随机动态环境下的反事后价值函数用于方差降低
本篇论文介绍了一种基于信息论的新颖后见价值函数,与常用的状态价值函数相比在随机动态环境下具有更稳定的性能。
- WaveGrad 2: 文本到语音合成的迭代改进
本论文介绍了 WaveGrad 2,这是一种非自回归的生成模型,用于语音合成。通过迭代细化过程,模型使用梯度估计语音波形的对数条件密度,从而生成音频波形。实验证明,该模型可以生成高保真音频。
- ICML用超网络重新组合强化学习构建块
本文提出使用超网络结构来改善强化学习和 Meta-RL 算法中梯度估计和学习步骤方差的问题,以提高学习效率和最终性能。实验表明,该方法可在不同的任务和算法中得到一致的改进。
- SIGIR计算高效的 Plackett-Luce 排名模型优化 —— 针对相关性和公平性
本文提出了一种名为 PL-Rank 的新算法,用于估计 PL 排名模型关于相关性和公平度量的梯度,相比现有的策略梯度方法,PL-Rank 的采样效率更高且计算成本更低,可以用于更真实、更公平的实际排名系统。
- CVPR透过梯度:通过梯度反演进行图像批量恢复
使用 GradInversion 算法,结合梯度计算和图像还原技术,在保护隐私的前提下,能准确地从深度神经网络的训练中恢复待处理图片,并可在多个任务中实现高度复现的效果。
- 学习频域逼近用于二值神经网络
本文提出了一种使用正弦函数组合估计傅里叶频率域中的符号函数梯度的方法,同时嵌入噪声自适应模块来弥补近似误差,结果表明该方法训练的二进制神经网络可达到最先进的精度水平。
- 基于非线性投影的梯度估计方法,用于查询高效的黑盒攻击
本文探讨了如何在项目的低维空间中高效地估计梯度,并提供了一个高效的非线性梯度投影边界黑盒攻击方案和其在多个数据集上的优越性能的演示和评估。
- MALI: 一种内存高效、反向精确的神经常微分方程积分器
通过异步 Leapfrog(ALF)求解器,我们提出了 Memory-efficient ALF Integrator(MALI),其内存成本与 adjoint 方法中的求解器步骤数量具有恒定的内存成本,并保证了反向轨迹中的精度(从而保证了 - AAAI使用 REINFORCE 的高效样本强化学习
研究了 RL 中的 policy gradient methods,建立了 REINFORCE 算法的全局收敛理论,围绕梯度估计和采样效率等方面进行了研究。
- Rao-Blackwell 算法优化直通 Gumbel-Softmax 梯度估计器
本研究提出了一种对 Gumbel-Softmax estimator 进行 Rao-Blackwellization 的方法,可在不增加函数评估数量的情况下减少方差,从而降低均方误差,并在两种无监督潜变量模型中得到了实证验证。
- 神经 ODE 梯度估计的自适应检查点伴随方法
本文提出了一种自适应检查点伴随方法,旨在解决通过神经常微分方程求解器进行反向传播时,由于梯度估计方法不准确导致的错误率高的问题。使用该方法,针对图像分类和时间序列建模任务,半数训练时间内将错误率减半。此外,采用该方法进行训练的神经常微分方程 - CVPRQEBA: 基于边界的黑盒攻击高效查询方案
本文介绍了一种基于模型终极预测标签的查询高效边界型黑盒攻击 (QEBA),并在 ImageNet 和 CelebA 数据集上进行了广泛的实验。实验结果表明,与最先进的黑盒攻击相比,QEBA 能够使用更少的查询次数以更低的扰动量实现攻击,并在 - 应用随机参数移位法计算一般量子演化分析梯度
本文研究了如何直接从量子测量中估计要优化的函数的梯度,提出了一种基于 Pauli 旋转扩展的哈密顿量的梯度估计算法,可适用于带噪声量子门的多量子位参数量子演化。
- ICLR用于表征学习的互信息梯度估计
通过得分估计隐式分布,我们提出了互信息梯度估计器(MIGE),用于基于 InfoMax 和信息瓶颈方法的无监督学习深层表示,并扩展了 MIGE 的应用。在高维和大 MI 设置下,MIGE 表现出紧密和平滑的 MI 梯度估计,并且实验结果表明 - 自动微分在最小值函数中的超高效性
本文研究了用于最小化函数的梯度估计方法的渐近误差,并找到了自动估计器误差接近于解析估计器误差平方的超高效现象,分析了这些估计器的收敛率和计算复杂度,并给出了实际指南以在它们之间进行选择。
- 机器学习中的蒙特卡罗梯度估计
介绍使用 Monte Carlo 梯度估计策略解决机器学习中的梯度问题和灵敏度分析的方法和历史发展,并深入探讨了路径、分数函数和测度梯度估计器的应用、关系和可能的泛化。
- SIGIR在线学习排序的梯度探索方差减小
提出了在线学习排名中梯度估计的降低方差方法,通过在当前查询下的已检查文档的特征向量所组成的 “文档空间” 中进行方向投影,可以减少梯度估计的高方差,进而改善模型估计的效果。
- 从零开始训练语言 GANs
本研究通过采用大批处理、密集奖励和鉴别器规则等现有技术来稳定和改善语言生成对抗网络,从而成功实现了 ScratchGAN 的从零训练,并表明其在语料库 EMNLP2017 News 和 WikiText-103 上的质量和多样性指标相当于最