- 局部自适应的可微回归
通过在对应的局部区域中基于局部学习模型的加权平均构建全局连续和可微模型的一般框架,我们在处理具有不同密度或不同局部区域功能值范围的数据方面取得了竞争优势,并且通过在局部模型中混合核脊回归和多项式回归项并连续地拼接它们,我们在理论上实现了更快 - ICML模型解释的功能信息观
本文提出模型可解释性的理论框架,通过测量相关特征对于网络对输入的功能熵的贡献来解释深度网络,通过广泛的实验,我们证明了我们的方法在图像、文本和音频等各种数据信号上超过了现有的可解释性采样方法。
- ICCVPCAM: 刚体点云的交叉关注矩阵积进行刚体对齐
提出了一种名为 PCAM 的深度神经网络,用于点云对齐和配准任务,通过点对应和加权,将几何和语境信息结合,实现了空间特征的匹配,达到了最先进的结果。
- 深度神经网络的性能与对于微分同胚的相对稳定性相关
通过定义最大熵概率分布,研究了给定范数下的典型微分同胚,确认了深度学习中关于稳定性的一些传统假设,以及微分同胚相对于普通变换的稳定性与测试误差之间的相关性。
- 超参数下标签不平衡和组别敏感分类
本文中,我们提出通过向深度网络添加 logit 权重调整来解决标签不平衡和组敏感分类问题。我们发现线性分类器必须引入乘性权重调整,而不是加性调整,以便在 TPT 中改变分类边界,我们提出了矢量缩放(VS)损失。此外,我们在状态 - 最新数据 - 基于 Hessian 的 SGD 分析:深度网络的动力学和泛化
本文通过对训练损失函数的海森矩阵及其相关量的分析,探讨了随机梯度下降(SGD)的优化动态和泛化行为等三个问题,并在合成数据、MNIST 和 CIFAR-10 数据集上进行了大量实验支持其理论结果。
- 低成本多层网络的景观连通性解释
在深度网络的损失面中模式连接是一个令人惊讶的现象,本文通过数学解释为阐述这个现象提供了理论支持,并通过实验进行验证。
- ICLR知识流:超越你的教师
通过知识流的方式将多个深度网络(教师)的知识传递给新的深度网络模型(学生),解决了在新任务中选择哪个网络或为微调新模型选择哪个网络的初始化的问题,并在监督和强化学习任务中提供比微调和其他知识交流方法更好的表现。
- ICML过参数化的两层神经网络的优化与泛化的细粒度分析
该论文分析了一个简单的 2 层 ReLU 网络的训练和泛化,通过对相关内核的特性进行追踪,提出了更紧致的训练速度特征描述和网络大小无关的泛化界限以及对梯度下降训练的广泛平滑函数可学性的证明。
- Pipe-SGD: 分布式深度神经网络训练的去中心化管道式 SGD 框架
本文提出一种基于 AllReduce 的分布式深度学习训练方法,并通过在四节点 GPU 集群测试,证明具有两个宽度的流水线架构可以将同步和异步训练的优点相结合,可将训练时间提高多达 5.4 倍。
- ECCV基于匹配的视频对象分割:VideoMatch
该研究提出了一种基于匹配的视频目标分割算法,在不需要 fine-tuning 的情况下实现了实时性和较短的计算时间。
- 深度神经网络:它们为视觉做了什么?
本文讨论了当前深度神经网络在计算机视觉领域的优势与劣势,并探讨了如何解决计算机视觉中所面临的组合爆炸问题。我们认为,当前的深度神经网络很难克服这个困难,因此需要重新思考我们评估算法性能的方法。
- 通过压缩方法增强深度网络的泛化界限
本论文通过新的简洁再参数化方法的引入和新的 “噪声稳定性” 属性的发现,提供了一种基于压缩的框架来估计神经网络的泛化性能边界,并将此方法拓展到卷积神经网络中。
- 深度域自适应的残差参数转移
本文介绍了一种神经网络结构 —— 附带残差网络,其可灵活地维护域间的相似性,并在必要时模拟区别。实验证明,该方法比现有最先进的方法具有更高的准确性且不会过于复杂。
- GANs 是否真的学习了数据分布?一项实证研究
研究 GANS 是否可以准确学习目标分布,发现当判别器具有有限大小时,GAN 的训练目标可能无法防止模态崩溃。通过基于生日悖论的新测试方法,提供了实证证据证明当前的 GAN 方法不能完全学习目标分布的任何支持度数量的分布。
- 使用哈希技巧压缩神经网络
本研究提出了 HashedNets 这一新型网络结构,在使用深度学习技术进行移动设备应用时,可以通过哈希函数来分组并共享连接权重参数,进而大幅缩小神经网络所需的存储空间,而不会明显影响其泛化性能。
- 关于学习某些深度表示的可证界
本文介绍了一种具有可证明保证的算法,学习了一个由 Hinton 等人推广的生成模型视图中的深度网络类。该算法使用分层学习的技术,通过观察特征的相关性和使用全局图恢复过程推断出底层网络的边缘结构,并揭示了随机边缘权重神经网络的有趣结构。
- 高性能神经网络用于视觉物体分类
本研究使用 GPU 实现卷积神经网络,并利用监督学习的方法进行特征提取,通过设计深度分层结构比以往浅层网络获得更好的性能,在目标分类和手写数字识别任务中取得了目前最佳的结果。