- ACLFastSeq: 使序列生成更快
本文介绍了基于 Transformer 的自然语言生成模型在解码过程中存在推理速度瓶颈,提出了 FastSeq 框架以加速序列生成,采用了注意力缓存优化、重复 n-gram 检测、并行 IO 等优化技术,有效提升了推理速度,并且可以适用于多 - 旅行商问题的 Transformer 网络
本文利用强化学习和 Transformer 结构设计了用于 Traveling Salesman Problem 的新型算法,相较于以往的算法在 TSP50 和 TSP100 上有了更好的表现
- 梯度集中:一种深度神经网络新的优化技术
本文提出了一种新型优化方案 —— 梯度集中(Gradient Centralization,GC),通过将梯度向量集中到零均值来优化神经网络训练,这可以被视为一种具有约束损失函数的投影梯度下降法,实验证明它能够显著优化深度神经网络的泛化能力 - ICLR深度神经网络中线性区域特性的实证研究
通过局部属性的研究,探究了 DNN 的表达能力和优化技术对其决策边界的影响,并希望这一研究能够启示新型优化技术的设计和发现 DNN 的行为模式。
- 学习可解释的交通信号控制策略
本文介绍了几种在线优化技术用于调整可解释控制函数的参数,并且研究发现,采用基于价值的强化学习可以更好地训练控制函数,特别是 Deep Regulatable Hardmax Q-learning 算法可以使得可解释信号灯控制函数得到优化,从 - 优化边缘语音识别
本文研究边缘设备上的语音识别问题,通过使用端到端的神经结构,并应用更有效的神经网络拓扑和优化技术,成功构建了一个高精度的,在边缘设备上运行的小型语音识别系统。
- 烟雾模拟的基于传输的神经风格迁移
本文提出了一种基于传输的神经风格迁移算法,可用于体状烟雾数据。采用优化技术近似仿真状态,从而使得自然图像的特征可以转移到烟雾模拟图像中,实现了从简单图案到复杂结构的通用内容感知操纵,通过控制升降运算和无旋动能势可以实现传输引起的风格化速度场 - ICML分布式非凸优化中通信高效动量随机梯度下降的线性加速分析
本文研究了分布式优化方法在深度学习中的应用,发现分布式动量随机梯度下降在性能、通讯效率方面存在一定优势,并证明其拥有与分布式随机梯度下降相同的线性加速性质。
- WWW大规模图上完全个性化 PageRank 的分布式算法
本文提出了使用分布式计算框架计算大型边加权图的全面边加权个性化 PageRank 的新方法,使用了蒙特卡罗近似并结合优化技术,其准确性表现显着超过基线算法,并且速度比现有技术快数个数量级。
- 通过二元分类提升二元优化:以作业车间调度为案例研究
通过使用逻辑回归模型和优化算法,研究了通过连续评估解决方案,学习用于预测优化问题最优解组件的可行性,并将其集成到 tabu 搜索算法中,提高了算法的性能。
- MM具聚合操作的递归 Datalog 程序的不动点语义和优化
本文提出一种简单的综合解决方案,该方案扩展了 Horn Clause 的声明性最小固定点语义,以及 Datalog 系统采用的自底向上实现方法中使用的优化技术,以将 Datalog 的语义和优化技术扩展到包括 min、max、count 和 - ICCV物体状态和操作行为的联合发现
该研究提出一个联合模型,通过视频分析自动发现对象状态和相关的操作行为,模型使用判别聚类成本和约束来学习识别、定位对象状态和对它进行操作的动作,并且不需要额外的监督。通过将对象状态发现与操作识别相结合,取得了良好的实验效果。
- 广义卡尔曼平滑:建模与算法
通过最优化视角,我们讨论了动态系统的常规统计模型,并充分利用了非光滑凸惩罚和约束,提供了与信号处理和机器学习中重要模型的联系。我们调查了这些问题的优化技术,特别关注动态问题结构,并用数值例子说明了建模概念和算法。
- ICLR通过矩阵分解理解可训练稀疏编码
本文研究了利用神经网络加速解决数据分析和机器学习中稀疏编码优化问题的原因,发现其加速与字典的 Gram 矩阵核的一个特定矩阵分解有关,且优化加速条件主要存在于迭代过程的开始阶段。
- 通过随机游走估算图形统计量的通用框架
本文提出了一种基于随机游走的框架,通过优化技术和收集样本来估算任何规模的图形统计数据,并取得了在准确性和时间成本方面都优于现有技术的效果。
- 神经网络矩阵分解
本文介绍一种基于神经网络与矩阵分解的方法,使用最优化技术得到潜在特征向量并据此构建神经网络,进而代替传统内积的矩阵分解方法,从而在一些测试数据集上达到更好的效果。
- 优化覆盖计算
本文介绍针对 DLN 的优化技术,以提高其在生物医学领域和语义 Web 访问控制策略中建模的应用范例的推理效率,并在 30K + 公式的大型知识库上进行了实验验证,超过一级数量级的加速效果,该文首次实现了非单调性 KB 在这种规模下的实时推 - ICML优化不可分解性能度量:两个类别的故事
本文提出一种自适应线性化技术,实现了基于 TPR 和 TNR 的点随机更新,通过提出 SPADE 和 STAMP 方法,可以应对实际中出现的数据标签不平衡及其他特殊要求,并获得了显着的速度优势和精准度,同时确保了收敛性。
- 使用简单方法初始化修正线性单元的循环神经网络
本文提出了用由修正线性单元组成的循环神经网络,并采用单位矩阵或其缩放版本来初始化循环权重矩阵来解决长期依赖性的问题,并在四个基准测试中证明了我们的解决方案与 LSTM 相当。
- 现代推理技术在结构离散能量最小化问题中的比较研究
该研究比较了 32 种现代化的最优化技术在计算机视觉中的应用,结果表明,与之前研究不同,多面体方法与整数规划解决方案在运行时间和解决方案质量方面在大范围的模型类型上具有竞争力。