- 免细胞潜在探索
该论文利用学习到的潜在表示,引入了基于 “Go-Explore” 范例的 “潜在 Go-Explore”(LGE) 方法,该方法将普适应用于强化学习探索任务中,并在多个具有遥远探索难度的环境中展现比当下最佳算法更具鲁棒性和优异性能,例如 M - GAUDI:用于沉浸式 3D 场景生成的神经结构设计师
GAUDI 是一种生成模型,能够捕捉到复杂、逼真的三维场景的分布,并能够实时渲染出来。它以一种可扩展但强大的方式解决了这个具有挑战性的问题,首先优化了一个潜在表示,将辐射场和摄像机姿态进行了解耦。然后利用这个潜在表示来学习一个生成模型,使得 - 神经分布式图像压缩与交叉注意特征对齐
本文介绍了一种新的编解码方法,可以压缩成对立体图像并利用解码器端的相关性附加信息,以更有效地重构图像。该算法利用了交叉注意力模块对齐处理相关特征图,实验验证了其在 KITTI 和 Cityscape 数据集上的优越性能。
- CVPR基于能量的潜在对齐器用于增量学习
该文提出了一种基于能量流形的增量学习方法 ELI,该方法可以通过学习潜在表示的能量流形来解决增量学习中出现的表示偏移问题,从而防止深度学习模型遗忘先前的知识,经实验证明该方法可以有效地提高分类和对象检测任务的性能。
- 自上而下和自下而上推理的长文档摘要
本文提出了一种层次化的潜在结构,通过自下而上的推理使用本地自我注意力来提高文本摘要模型的效率,并通过自上而下的修正使标记能够捕获长距离依赖性,此方法在各种摘要数据集上表现出竞争性或更好的性能,并且使用更少的训练数据和较少的模型参数可以总结整 - MMPointCaps: 使用胶囊网络和欧几里得距离路由处理原始点云
本研究提出了 PointCaps,一种新的卷积胶囊体系结构,以及一种新的欧几里得距离路由算法和类独立潜在表示,在原始点云的分类、重建和分割中拥有更好的表现,具有显著的参数和 FLOP 数量低的优势。
- CVPR基于 Mini-Batch 特征交换的三维形状变分自编码器潜在因素解耦 —— 以身体和面部为例
本文提出了一种直观而有效的自监督方法,通过跨不同形状交换任意特征来培训三维形状变分自编码器,从而鼓励特征的解缠缚潜在表示。实验结果表明,我们开发的方法正确解耦了身体和面部特征的生成,同时保持了良好的表示和重构能力。
- ICCVHighlightMe: 从人类中心视频中检测亮点
文章介绍了一种基于图形表示多个可观测到的人类中心模式(例如姿势和面部表情)的视频的方法,使用带有空间 - 时间图卷积的自动编码器网络来检测基于这些模式的人类活动和互动,并将这些模式的基于活动和互动的潜在结构表示映射到基于帧的高亮度分数,用于 - 稳定的多智能体交互影响力研究
该研究探讨如何通过学习其他机器人的策略,以及动态模型的帮助,定义一个无监督的稳定奖励来影响其他机器人的策略以实现稳定,并展示了其在自动驾驶、紧急通信和机器人操作等方面的有效性。
- ICCV多帧超分辨率和降噪的深度重参化
本文提出了一种基于深度重参数化的多帧图像修复方法,通过引入学习的错误度量和目标图像的潜在表示,将最大后验形式直接模拟在潜在空间中,并集成了学习的图像先验,实现了深度学习与经典 MAP 公式的多帧融合。本方法在多组实验证明其泛化性和效果优越性 - ICML对抗式叠加自编码器用于公平表示学习
本研究提出了一种基于不同层级的数据表征的公平表征学习方法,通过堆叠不同的自编码器在不同的潜在空间强制执行公平性,更好地满足公平度量标准并提高数据表征的公平性。
- 可逆去噪网络:轻量级真实噪声去除方案
提出了一种基于可逆网络的去噪方法 InvDN,通过将噪音输入转换成低分辨率的干净图像和包含噪音的潜在表示,再在反转时用来自先验分布的另一个采样的潜在表示来替换噪音表示,实现了对 SIDD 数据集最优的性能表现,且运行时间更短,模型大小只有最 - ICCV动态未访问环境下的潜在布局定位 - LaLaLoc
LaLaLoc 利用房间布局的潜在表示进行本地化,通过潜在空间中的直接交叉模态姿态优化实现对全景图的细粒度姿态估计,从而在没有先前访问的情况下弥补了其它方法的缺陷,具有鲁棒性和较高的准确性。
- ICCV通过潜在对抗扰动实现可靠的快速对抗训练
本研究提出了一种基于潜在对抗扰动的单步对抗性训练方法,通过梯度正则化来确保性能稳定,并且与现有的基于输入空间的对抗性训练方法相比,具有更高的计算效率和更好的表现。
- ICML邻居嵌入变分自编码器
本文介绍了变分自编码器(VAE)在 posterior collapse 现象中的缺陷,并提出了一种基于邻居嵌入的 VAE(NE-VAE)模型,它能够防止 posterior collapse 现象的发生,同时保留大部分潜变量维度的活跃性, - ICLR领域鲁棒性视觉仿真学习与互信息约束
介绍了一种名为 Disentangling Generative Adversarial Imitation Learning(DisentanGAIL)的新算法,可通过对抗学习来自动学习高维度任务表现观察的特征,从而成功进行模仿,同时忽略 - SWAGAN: 一种基于样式波纹驱动的生成模型
本文介绍一种新型的基于样式和小波变换的生成对抗网络 (SWAGAN),通过在频域中实现渐进式生成,以小波为特征的潜在表示在每一步中都得到了很好的保留,从而提高了生成图像的视觉质量和计算性能。
- 过拟合之乐:实例自适应数据压缩
本文介绍一种基于自动编码器和潜变量表示的神经压缩方法,并探讨了在训练后适应单个视频、发送模型更新以及重新调整参数等方面的改进措施。结果表明,相较于仅调整编码器的方式,对整个模型进行调整可以提高图像在视频中的压缩性能约 1 dB。
- 主动学习稀疏半监督动作识别
该研究提出了 SESAR 方法,它将无监督学习和少量有监督学习相结合,通过两个组件对骨骼动作序列进行训练,从而实现骨骼动作识别,其性能超越其他方法,即使只使用 1% 已标记的数据。
- 深度局部多视角学习
提出跨部分多视角网络(CPM-Nets)框架,通过模拟数据传输实现多视角表征的完整性,并通过对抗策略稳定地翻译丢失视图的代价与补充性进行结构化编码,进一步增强数据的完整性,同时引入非参数分类损失,以防止过度拟合。全面实验证明了该算法在分级识