- CVPR使用神经网络实现鲁棒性和可重现的主动学习
本研究旨在证明在相同实验条件下,不同类型的主动学习算法(基于不确定性、多样性和委员会的),与随机采样基准相比,产生的收益不一致,这种性能度量的差异性可能导致结果与以前报告的结果不一致,强正则化下,主动学习方法在各种实验条件下显示出微小或无优 - KDD块交替:一种用于深度学习安全的随机方法
本文提出了基于概率性的防御策略 Block Switching,将模型层中的一个块替换为多个并行通道,并在运行时随机分配活动通道以对抗对手,实验证明其相对于其他随机防御更具有效性。
- AAAI多目标推荐系统的多梯度下降
本文提出了用随机梯度下降的方法(MGDRec)来解决推荐系统中多目标优化问题,通过梯度规范化将不同度量指标作为一个整体优化,确保同时提升多个利益相关者的目标,避免了全梯度计算的缺点并且在提高准确率的同时也提升了产品的质量。
- ICLR基分解的随机条件生成网络
本文介绍了 BasisGAN,一个基于随机条件的多模式图像生成器,该生成器通过采样基元素而不是滤波器来大大降低建模参数空间的成本,并在图像多样性和保真度上没有牺牲,同时证明了这种采样如何影响所生成图像的外观。
- CVPR多智能体张量融合用于上下文轨迹预测
自动驾驶中准确预测其他车辆 / 行人的运动轨迹非常重要,本文提出了一种基于多智能体张量融合网络的模型,可以模拟代理人之间的交互和约束以及环境场景等因素,从而实现对未来运动轨迹的精准预测,并在高速公路和行人数据集上表现出最先进的预测精度。
- 概率二元神经网络
本文提出使用二进制权重和激活的神经网络的概率训练方法 - BLRNet,通过随机性避免了对 sign () 等不可微函数的梯度的逼近,并仍在测试时获得完全的二进制神经网络。 此外,它允许通过从权重分布中进行抽样来进行任时集成预测以提高性能和 - ICML用于评估体系结构性能的 Boo (n)
本文提出了一种纠正深度学习架构评估中普遍问题的方法,即使用最好的单一模型表现来评估。我们提出了一种规范化的预期最佳 -$n$($ ext {Boo}_n$)表现来解决由于训练过程中的随机因素(包括随机参数初始化和数据排列)所导致的波动性问题 - 随机对抗视频预测
本文探讨了两种机器学习模型用于生成视频未来帧预测的方法,并将它们相结合得到更真实、多样性更好的预测结果。
- 重新审视街机学习环境:通用智能体的评估协议和开放问题
该文章探讨了 Arcade Learning Environment(ALE) 作为评估平台对研究社区的影响,并重点说明在该平台中评估代理时的一些核心问题。此外,该文章还提出了一些研究方法的最佳实践,并介绍了一个支持多种游戏模式的新版本 A - ICLR嘈杂网络用于探索
本研究提出了一种名为 NoisyNet 的深度强化学习智能体,通过参数噪声的添加,可以有效地探索问题空间,在 Atari 游戏中,用 NoisyNet 替换传统的探索启发式方法后,智能体的分数得到了大幅提升,有些情况下,甚至可以达到超人类水 - NIPS学习针对重复操作系统的个性化最优控制
此研究讨论在参数不确定性的情况下,以在线学习的方法针对连续操作系统进行最优控制,在考虑随机性因素的情况下,设计了一种能够个性化控制输入的智能体,并在模拟系统上验证了算法的有效性。
- 语言变化中的进化力量
研究语言变化的机制,使用语料库分析了英语中三个语法变化,结果表明对于某些语言变化,我们可以拒绝随机漂移并选择选择性驱动力,但对于其他语言变化,这种情况并非如此。
- 在线随机匹配:新算法和界限
本文提出了一些基本的算法变体和改进,旨在提高已知 IID 模型和具有随机奖励延伸的模型的竞争比率,另外提出了加强型线性规划基准来提高非加权边的概率的情况。