- 迈向更公平的人脸识别数据集
利用生成的训练数据集中的人口属性平衡机制,提出了一种全面的评估方法,旨在促进更公平、透明的人脸识别和验证,并发现在减少人口属性不公平的同时,性能差距仍然存在。
- ICML最大编码速率削减的全局几何分析
学习结构化和紧凑的深度表示的目标是最大编码速率降低(MCR^2),近来在完全可解释和高效的深度网络架构的推导中引起了越来越多的关注。本文对 MCR^2 问题的所有局部和全局最优解以及其他类型的临界点的性质进行了完全的刻画。通过理论分析和实验 - 利用简单生成表现评估图像质量
自动编码器 VAE-QA 是一种用于在全参考下预测图像质量的简单高效方法,通过利用现有的自动编码器,它显著提升了跨数据集的泛化能力,具有更少的可训练参数、较小的内存占用和更快的运行时间。
- ICLR非负对比学习
通过非负对比学习(NCL),我们提出非负矩阵分解(NMF)的新应用,旨在提取可解释的特征,在数学上与 NMF 目标保持一致,不仅在特征区分度、特征选择方面表现出众,而且在下游分类任务中表现优异。
- 自动机器学习在持续学习中的应用
这篇论文概述了 AutoML 在增量学习方面的潜力,强调了 AutoML 在增量学习中改进深度表示和自适应学习以适应更多真实世界任务的关键领域。
- 自监督学习模型在基于传感器的人类活动识别中的表征解释、分析和探索
本文研究自监督学习在传感器人体活动识别中的应用,并分析了两个最近的自监督学习框架 SimCLR 和 VICReg 的深层表示,比较了监督和自监督模型对输入数据噪声的鲁棒性,并通过可解释性方法探索了 SSL 和监督表示中编码的性质。研究表明, - Hub-VAE: 无监督基于 Hub 的变分自编码器正则化
本文介绍了一种利用 hub-based priors 对未监督深度学习进行正则化的算法,同时使用 hub-based contrastive loss 对潜在空间进行数据驱动的正则化,以达到在 embedding space 中实现更好的聚 - 交叉领域潜在调制的变分迁移学习
通过引入一种全新的跨域潜在调制机制来实现有效迁移学习,利用源域和目标域的深度表示进行交叉调制,通过可视化的证据得到支撑,我们提出了一种基于变分自编码器框架的解决方案,并在多个迁移学习基准任务中展示了强大的表现,特别是在无监督领域适应和图像到 - ECCV区分度 - 可转移性权衡:一个信息论的观点
该研究通过时间分析发现了深度表征学习中鉴别性和可转移性之间的矛盾,并提出了一种基于信息瓶颈理论的对抗性学习框架以平衡两者,从而在图像分类和迁移学习任务中取得了显著的性能提升。
- ICML神经激活编码的无监督表征学习
该篇论文提出神经激活编码作为一种新颖的方法,通过学习无标注数据来获取深度表示,以便进行下游应用;该方法通过最大化编码器的非线性表达力,从而在嘈杂的通信通道上最大化编码器与数据的激活模式之间的互信息,进而增加了 ReLU 编码器的不同线性区域 - 多个领域的少样本分类通用表示学习
本文介绍了通过适配器和居中核对齐等方法,利用多个分别训练的网络的知识来同时学习多个领域上通用的深度表示,通过距离学习方法来有效适应之前未见过的领域,并在 Meta-Dataset 基准测试中取得显著的性能提升。
- ICLRDeepAveragers:通过求解派生的非参数 MDP 实现离线强化学习
研究了一种离线强化学习方法,在静态数据集的基础上通过有效解决有限表示 MDPs 的方式进行。该方法可应用于任何学习表示,并具有支持多种解决方案、零成本调整等特性;其主要贡献是引入了 Deep Averagers with Costs MDP - ICLR用于表征学习的互信息梯度估计
通过得分估计隐式分布,我们提出了互信息梯度估计器(MIGE),用于基于 InfoMax 和信息瓶颈方法的无监督学习深层表示,并扩展了 MIGE 的应用。在高维和大 MI 设置下,MIGE 表现出紧密和平滑的 MI 梯度估计,并且实验结果表明 - 自监督增强少样本学习的监督
本论文提出了一种利用自我监督任务作为辅助损失函数来改善小型标注数据集上深度表示可迁移性的技术,其中使用自监督损失学习的表示减少了元学习的相对误差率,此方法在各种学习任务中都取得了良好的表现。
- CVPR深度视觉城市识别可视化
本研究使用卷积神经网络进行城市识别,并使用 Grad-CAM 技术生成加权掩模,聚类物体和统计措施来量化高解释性的特征,同时研究了不同的网络架构和初始化方式对城市识别深度特征的可解释性的影响。
- 利用密集网络和 Fisher 剪枝加速凝视预测
通过 Fisher pruning 方法和知识蒸馏的结合,我们获得了更高效的视觉显著性预测体系结构,为单幅图像凝视预测的加速在现实世界应用和视频显著性模型开发中具有重要意义。
- 生成对抗网络概述
本文概述了生成对抗网络在信号处理中的应用,讨论了 GANs 的训练方法和构建策略以及它们在 deep representations 学习中的表现和存在的挑战。
- 聚焦注意力:自然图像中准确的文本识别
本文提出了一种名为 Focusing Attention Network 的方法,利用聚焦注意机制来消除针对复杂和 / 或低质量图像的 “注意力漂移” 现象,同时采用 ResNet-based 网络来丰富场景文本图像的深层表示,并在 III - 神经形态计算 deep learning 机器
本篇论文介绍了一种名为 Event-Driven Random BP (eRBP) 规则的神经形态计算方法,可用于学习深度表示,其具有在神经形态硬件中实现的优势,并且与 GPU 上的人工神经网络模拟相比,分类准确性相近且在学习过程中鲁棒性较 - CVPR深度表示和图像聚类的联合无监督学习
在本论文中,我们提出了一种循环框架用于深度表示和图像聚类的联合无监督学习 (JULE)。通过在卷积神经网络 (CNN) 输出的表示层上堆叠聚类算法的连续操作的循环过程,在前向传递中进行图像聚类,在后向传递中进行表示学习。我们的主要想法是将两