- GeNIe:通过扩散生成难负样本图像
数据增强在训练深度模型中至关重要,防止其对有限数据过拟合。常见的数据增强方法虽然有效,但最近生成式人工智能的进展,如用于图像生成的扩散模型,使得更复杂的增强技术成为可能,能够生成类似于自然图像的数据。我们引入了 GeNIe,它利用一个以文本 - REDS: 动态资源约束下的资源高效深度子网络
使用 Resource-Efficient Deep Subnetworks (REDS) 实现对变量资源的模型自适应,通过构造性地利用神经元的置换不变性来支持计算效率,以满足动态资源限制。在各项基准结构上评估 REDS,展示其在子模型测试 - 对 Adversarial CAPTCHA 的历史、分类和生成的调查
通过将敌对示例与 CAPTCHA 结合,生成能够欺骗深度模型的敌对 CAPTCHA,以解决安全性和可用性的权衡问题,本文分类方法并系统回顾生成敌对示例和敌对 CAPTCHA 的常用方法,并分析可用于防御敌对 CAPTCHA 的一些防御方法和 - 布尔变异与布尔逻辑反向传播
基于布尔集合引入了变异概念,并基于此概念发展了布尔逻辑反向传播原则。利用这一概念,可以构建以布尔数字作为权重和激活的深度模型,并使用布尔逻辑而不是实数运算进行操作。特别地,可以在布尔领域直接训练布尔深度模型,而无需潜在权重。层次内合成和反向 - 广义主干网络设计的图像修复网络对比研究
现有图像修复网络在任务通用性方面仍然面临挑战,我们选择了五个代表性的图像修复网络,对五个经典的图像修复任务进行了比较研究,并提出了通用图像修复骨干网络 X-Restormer,实验证明其在各种任务下具有良好的通用性和最先进的性能。
- 真假:通过分布匹配进行有效的训练数据合成
我们通过广泛的实验验证了我们的合成数据在各种图像分类任务中的有效性,既可以替代真实数据集,也可以作为其增强,同时也有益于挑战性任务,如超出分布的泛化和隐私保护。
- HelmSim: 学习亥姆霍兹动力学进行可解释的流体模拟
本文提出了 HelmSim 作为一种准确且可解释的流体模拟器,通过嵌入 HelmDynamic 模块到多尺度积分网络中,来集成学习到的 Helmholtz 动态,并在多个空间尺度上沿时间维度生成未来的流体,实验证明 HelmSim 在数值模 - 音视频说话人验证基于联合交叉注意力
通过跨模态联合注意力来提升说话人验证的性能,进一步发掘音频和视觉融合在说话人验证领域的潜力。
- 通过可视化解释深度人脸算法的调查
该研究通过对面部可解释性算法的元分析,揭示了现有面部可解释性工作的结构和层次结构,并通过用户研究确定了实用的面部可解释性算法的设计考虑。
- 基于解剖一致的伪模态元学习的领域泛化
深度模型在应用于未知领域时往往存在泛化能力有限的问题,特别是在视网膜血管分割任务中,我们提出了一种基于解剖一致伪模态的元学习方法(MAP),通过学习结构特征来提高模型的泛化能力。我们首先利用特征提取网络生成三个不同的伪模态,这些模态与原始图 - 轻量级图像超分辨率的全一次卷积网络
基于参数无关的空间位移操作,我们提出了一种简单而有效的全 $1 imes1$ 卷积网络,名为 Shift-Conv-based Network (SCNet),在保持令人印象深刻的计算效率的同时,赋予全 $1 imes1$ 卷积网络强大的表 - ICCV更多观点,更多了解:通过多模态视觉数据进行零样本点云分割
零射点云分割方法探索了如何识别在训练阶段未见过的点云中的新物体,并利用深度模型从已标记的已知类别转移知识到未标记的未知类别,提出了一种新颖的多模态零射学习方法,以更准确地对齐视觉和语义特征,在两个流行的基准数据集 SemanticKITTI - 朝向对称感知的周期材料生成
我们提出了 SyMat,一种能够捕捉周期性材料结构物理对称性的新型材料生成方法,其通过生成原子类型集,晶格长度和晶格角度的变分自动编码器模型来生成材料的原子类型和晶格,同时,SyMat 采用基于打分的扩散模型来生成材料的原子坐标,在坐标扩散 - 动态不确定性下的大规模数据集修剪
本文提出了一种数据集剪枝方法,利用预测不确定性和训练动态来生成一个信息量丰富的子集,从而用人口可承受的计算成本代替大规模数据集进行深度模型训练,实验结果表明该方法表现优于现有技术,对 ImageNet-1K 和 ImageNet-21K 数 - 基于知识图谱的混合表示学习
本文提出一种新颖的认知图层(EGLayer),以实现深度模型和结构化知识图间信息更有效交换,进而实现更有效的表示学习,从而将人类混合学习应用于计算机视觉任务。
- 从声音到语法:探究口语语言模型的句法
研究了自我监督和视觉基础的多个口语模型对句法的编码方式,证明句法结构被最明显地捕获在中间层,并在参数较多的模型中表现得更加明显。
- ADLER -- 一种基于海森矩阵的自适应学习速率策略
本研究基于深度模型,提供了一种基于局部二次逼近的自适应 SGD 学习率策略,并将其与格点搜索 SDG 学习率及 Gauss-Newton 近似法进行比较。该策略的 Hessian 矩阵的正半定估计精确度较高,可以在分类任务中对不同结构(有或 - SimHaze:用于实际除雾的游戏引擎模拟数据
本文提出了一种基于计算机图形学的生成配对干净 - 有雾图像的方法,并利用这个方法生成 SimHaze,一个新的合成雾数据集,此数据集可以用于训练去雾模型。通过使用此数据集进行训练,最新的去雾模型的性能明显优于以前的去雾数据集。
- WinDB: 免 HMD、免畸变的全景视频固定学习
本研究介绍了一种用于平面全景视频的 WinDB 辅助窗口虚化视点采集方法,并基于此方法发布了一个新的 PanopticVideo-300 数据集,同时提供了一个针对视点漂移问题的简单基准设计。
- 利用低维参数子空间表示输入变换
通过子空间可配置网络探讨模型权重最适合为参数化的连续转换低维线性子空间的配置假设,为解决输入转换和最优模型权重之间的基本关系提供了一种新的方法。