- 频率感知变换器用于学习图像压缩
学习图像压缩 (LIC) 已成为近年来在图像存储和传输方面的有效解决方案,然而,现有的 LIC 方法存在潜在的表示冗余问题,限制了其对各向异性频率成分和方向细节的捕捉。为了克服这些挑战,我们提出了一种新颖的频率感知变换器 (FAT) 模块, - 用简单的确定性自编码器学习低秩潜空间的理论与实证洞见
我们提出了一种名为低秩自动编码器(LoRAE)的新方法,它通过使用低秩正则化器自适应地重构一个低维潜在空间,同时保持自动编码器的基本目标,以便在嵌入数据于一个低维空间的同时保留重要信息。我们在理论上为模型建立了更严格的误差界限,而在实践中, - 通过任务示范实现形态不同机器人之间的对应学习
我们提出了一种学习不同机器人之间的对应关系的方法,并通过一系列实验验证了该方法的有效性。
- 通过随机化潜在表示欺骗文本欺骗者
通过随机化输入的潜在表示,我们提出了一个名为 AdvFooler 的轻量级、适应各种攻击方法的防御机制,主要目标是困惑生成对抗样本的过程,从而达到误导对手的效果,并在两个基准数据集上证明近乎最先进的防御能力。
- 有限数量的标量量化:简化 VQ-VAE
我们提出使用有限数量标量量化(FSQ)替代 VQ-VAEs 中的向量量化(VQ),通过将 VAE 表示投影到少量维度中,并将每个维度量化为固定值的小集合,从而实现离散表示。我们在图像生成中使用 MaskGIT,以及在深度估计、上色和全景分割 - ICML多环境双超先验神经图像压缩
提出了基于 Transformer 的非线性变换和包含两个不同超先验的熵模型,通过有效地捕获输入图像的局部和全局信息以及利用远距关系提取长程信息,能够在速率 - 失真性能方面表现优于现有的方法。
- RePo: 通过正则化后验可预测性提高强化学习模型的弹性
这篇论文提出了一种视觉模型驱动的强化学习方法,它学习到了一个对噪声和干扰具有弹性的潜在表示,通过鼓励表示能够最大程度地预测动态和奖励,并在观察和潜在表示之间限制信息流。此方法对于视觉干扰具有显著的抵抗力,在动态环境中能够有效运行。此外,作者 - 联邦学习的个性化解缠
本文提出了一种通过将潜在表示明确分离成两部分来更好地处理个性化联邦学习的方法,并使用一种新颖的联邦双重变分自编码器(FedDVA)实现了解缠结,从而更好地平衡跨客户的知识共享和模型个性化,从而提高了 PFL 的可靠性和效果。
- StyleGAN 知道 Normal、Depth、Albedo 等等
本篇论文探讨了 StyleGAN 生成的图像中内在属性图像的表征方式,并较之 SOTA 方法更为鲁棒。
- 事件骨架生成的扩散模型
通过引入嵌入和舍入技术及自定义基于边缘的损失函数,将离散事件图形转换为可学习的潜在表示,并提出去噪训练过程来维持模型鲁棒性,我们提出了一种新颖的扩散事件图模型(DEGM),该模型能保证在模式生成过程中逐步优化的潜在表示中进行错误修正,实验结 - Urban-StyleGAN: 学习生成和操作城市场景的图像
通过新型神经网络 Urban-StyleGAN,使用分组策略和无监督潜在空间探索算法,实现了更好的城市场景生成和内容控制。
- 潜在互动 A2C 用于开放多智能体系统中改进强化学习
本文介绍了一种基于编码器 - 解码器结构的潜在 IA2C 方法,其利用去中心化的训练和执行,学习隐藏状态和其他代理的动作的潜在表示,实验结果表明,潜在 IA2C 显著提高了样本效率,并在具有开放代理人口的时间上进行了评估。
- 通过相关最大化和最小化实现多模态理解
使用 Multimodal Understanding Through Correlation Maximization and Minimization(MUCMM) 框架,该框架可以轻松地嵌入到任何预训练网络中,学习模态数据的常见和个体 - 基于对比度聚焦的视角不变自监督骨架动作识别学习
该研究提出了一种名为 FoCoViL 的自监督框架,使用对比损失函数学习共同的视图不变属性,进而获得更具判别能力的潜在表示,并通过自适应聚焦方法来增强对比学习以获得更清晰的聚类界限,该方法在无监督和有监督分类器上都表现良好。
- 激光:用于三维生成建模的潜在集表示
Laser-NV 是一种基于集合型潜在变量模型的生成模型,通过几个视角进行快速前向推理,同时结合几何分析的注意机制生成一般三维物体的高保真且一致性良好的图像。
- 时间序列的双向降维的一种函数方法
本文提出了一种非线性函数对函数的降维方法,使用连续神经元的连续隐藏层来学习函数数据中固有的结构,通过降低函数特征数和观测时间点数来得到一个低维的潜在表征,从而在时间序列的维度缩减方面取得了比目前方法更好的效果。
- CVPR面向鲁棒性无监督时间序列异常检测的有损压缩
本文提出了一种新的损失因果时间卷积神经网络自编码器来进行异常检测,其使用速率 - 失真损失和熵瓶颈来学习压缩编码的潜在表示,有助于实现更实际的无监督异常检测方案。
- 学习使辅助任务泛化的表示
本文主要研究在 assistive tasks 中应用 sim2real 技术时的问题,并提出了一种解决方案 —— 通过学习一种好的 latent representation 来匹配 test-time humans 能够准确映射到的人类 - 分解因果解释以进行实质性决策
本文提出了一种新的算法回溯框架 DEAR,通过解缠共变特征的潜在表示来捕捉实践回溯的主要愿景,从而在特征依赖的情况下提供可靠且低成本的回溯。
- 自优化特征转换
提出了一种自优化框架,用于固有特征空间的转换,以增强机器学习模型的泛化能力,通过使用强化学习来改善性能并比较不同的训练策略。