- 蛋白质语言模型与结构预测:联系与进展
本文系统地概述了蛋白质语言模型在蛋白质结构预测中的应用和方法,介绍了网络架构、预训练策略、常用蛋白质数据库等方面的最新进展和挑战,并展望了未来发展方向。
- 航拍图像中唯一必要的是中心点
本研究使用中心点进行标注,开发了单阶段和两阶段网络结构,在三个航拍目标检测数据集上表现和使用更详细标注的方法几乎等效。
- CVPRYouTube-VOS 2022 大赛第 5 名解决方案:视频目标分割
本文提出了一个简单而有效的解决方案,通过分析数据集分布、引入公共静态和视频分割数据集增补数据集,改进了三种不同特性的网络结构并训练多个网络去学习视频中物体的不同特性,通过简单的整合和精细的后处理确保精准的视频对象分割。在 Youtube-V - 领域通用和适应预训练的广泛研究
本研究对深度模型的预训练、网络结构、大小等方面进行了广泛的研究和深入分析,发现通过使用最先进的主干网络可以有效提高领域适应基线和设置新的基线,为未来的领域转移研究提供了更多的见解。
- 前向 ReLU 网络的解决方案理论探讨
本文通过推导基本规则来解释前馈 ReLU 网络的机制,以解释工程网络架构,并提供了加强解决方案普遍性的几种方法。
- ICML深度学习模型选择的可扩展边缘似然估计
作为深度学习中模型选择的有前途的边际似然方法由于参数估计上的困难很少被使用。本研究提出了可伸缩的边缘似然估计方法,用于基于训练数据独立地选择超参数和网络结构。该方法建立在拉普拉斯方法和高斯牛顿逼近的黑塞矩阵的基础上,并在标准回归和图像分类数 - 各种图像翻译任务的空间相关损失
我们提出了一种新的空间相关损失函数,用于保持场景结构的一致性,支持图像转换过程中的大幅度外观变化,在单模态、多模态和单图像转换的所有三种非配对图像到图像的转换模式中都表现出显著的改进。
- ICCVWhere2Act: 基于像素的 3D 关节目标对象动作预测
本文提出一种基于深度学习的方法,通过对物体的可动部分及其所需的操作进行分析,从图像中提取高度本地化的操作信息,从而实现对视觉场景的语义理解。
- ICML正交化 SGD 和嵌套架构用于任意时间的神经网络
提出了一种新的 SGD 算法 -- 正交 SGD,用于训练支持任意行为的网络架构,通过重用内部状态,可以在时间上产生一系列越来越准确的输出,该算法可以在任务特定梯度之间动态地平衡,并显著提高网络的泛化性能。
- CVPR重新思考通道维度以实现高效模型设计
本文提出一种轻量级模型的通道维度配置方法,该方法可以在计算成本有限的情况下实现更好的性能,并在 ImageNet 分类和迁移学习任务中取得了显着的表现。
- ECCVQUEST: 量化嵌入空间用于知识转移
本文提出一种通过量化空间来传输知识、学习教师网络中的主视觉概念的知识蒸馏方法,通过对多种网络结构和常用基准数据集的广泛评估,证明了该方法优于现有的知识蒸馏方法。
- 通过隐式微分优化数百万个超参数
使用梯度优化算法,利用隐函数定理及反向黑塞矩阵逼近来提高超参数优化的效率,成功应用于训练超大规模网络架构,例如数据增强网络,整个过程只比标准训练多花费少量内存与计算资源。
- KDDAutoGrow: 深度卷积网络中的自动层增长
AutoGrow 是一种自动发现 Deep Neural Networks 中最优深度的方法,它通过在不同的网络架构和数据集上应用鲁棒性的增加和停止策略来探索不同深度的组合,并且在一些数据集上表现比人类专家更好。
- ICML学习什么和在哪里转移
本研究提出了一种基于元学习的转移学习方法,可以在异构架构和任务之间自动学习来自源网络的知识应该转移到目标网络的哪个位置,该方法在多种数据集和网络架构上都显著优于手工制定的传统方法。
- ECCV探索深度神经网络的语义鲁棒性
本文提出了一种理论上有根据的方法来分析深度神经网络(DNNs)在语义空间中的稳健性,主要是通过基于优化积分界限表达的方法来定量评估不同网络结构的语义稳健性。通过实验证明,尽管 InceptionV3 比 ResNet50 具有更高的准确度, - 面向上下文的神经机器翻译学习
本文中,我们提出了一种新的学习算法,用于增进神经机器翻译模型对附加上下文的理解,通过使用多级成对排名损失函数,我们在基于 transformer 的大语境翻译系统中进行了评估,并通过与实际和随机语境下的性能对比表明,使用所提出的算法训练的模 - ICLR高效神经结构压缩的可学习嵌入空间
在网络结构域上,我们提出了一种增量学习嵌入空间的方法,借此实现对架构的选择,该算法可在压缩架构搜索中优于随机搜索和强化学习,其找到的压缩架构也比经典的手动设计的紧凑架构 ShuffleNet 更好。
- 学习训练二元神经网络
研究二进制神经网络在移动设备等低计算能力设备上的训练过程,并探索网络结构、超参数等因素对于准确性的影响,提高了二进制神经网络的训练精度。
- 深度人脸识别:一项综述
本文全面回顾了深度人脸识别的最近发展,涵盖了算法设计、数据库、协议和应用场景等广泛主题,概述了不同的网络架构和损失函数,将相关的面部处理方法分为 “一对多增强” 和 “多对一归一化” 两类,并总结和比较了常用的数据库用于模型训练和评估,最后 - ECCV发出声音的物体
本文提出了一种利用未标记视频进行跨模态自监督学习的网络架构,实现音频和视觉之间的信息检索和图像中声音对象的准确定位,同时探究了基于 AVC 任务的网络架构设计方法,并与此相关的数据准备问题进行了讨论。