- 月球计划:以多模态条件实现可控视频生成和编辑
这项研究展示了一种新的视频生成模型 Moonshot,该模型同时考虑图像和文本的多模态输入,在控制视频的外观和几何结构方面具有更好的能力,并通过与预训练图像 ControlNet 模块集成,展现了较现有模型更优的视觉质量和时间一致性,可以用 - Wild2Avatar: 遮挡背后的人类渲染
通过 Wild2Avatar,在遮挡的自然单目视频中呈现出移动人物的视觉外观,该方法通过将场景分解为遮挡、人物和背景三个部分,设计广泛的客观函数以帮助实现人物与遮挡和背景的解耦,并确保人体模型的完整性,通过在自然环境下进行实验证明了该方法的 - 自监督结肠镜息肉重新识别
提出了一种基于注意力机制、自我监督机器学习模型的结直肠息肉追踪方法,用于聚合来自多个镜头的息肉数据,为 CADx 任务提供帮助。
- 基于时间尺度连续性的自监督多目标跟踪
通过在图像序列帧上进行一致的关联性评分,我们提出了一种学习重新识别特征的训练目标,可以显著降低 ID 开关,即使在 BDD100k 基准测试中表现和受监督的方法相当,也能够设置自监督多目标跟踪的新颖技术。
- 探测 DeepFake 视频中的行为特征
通过比较不同来源的合成视频,本研究发现合成视频在视觉和互动方面与原始视频相比都存在差异,这表明行为特征可以用于识别深度伪造视频。
- 利用 ViT 特征进行语义外观转换
本文介绍了一种名为 Splice 的方法,通过集成 ViT 模型的语义信息,将一个自然图像中的物体的视觉外观转移到另一个图像中,该方法不需要使用对抗训练,也不需要任何额外的输入信息。
- CVPR学习视觉外观的动态地图
使用每天拍摄的、带时间和地理位置数据的数十亿张影像,通过一个不需要人工标注的框架,构建了一个全球范围内的、动态的、可细粒度理解时空下视觉特征的地图,支持基于影像的地图创建、影像地理位置确认和元数据验证等多种应用。
- 基于 Stripe 和属性感知的网络:用于车辆再识别的双分支深度模型
介绍了一种基于双分支条纹和属性感知的深度卷积神经网络(SAN)用于车辆重新识别。实验结果表明,该方法优于其他最先进的车辆重新识别方法。
- CVPR基于文本指导的人物图像合成
本论文提出了一种新颖的方法,根据自然语言描述操纵人物图像的视觉外观和姿态,并进行了广泛的实验以证明该方法的有效性。
- CA3Net: 面向人物再识别的上下文 - 注意力属性外观网络
本文介绍了一种新的人物再识别方法 CA3Net,它利用深度学习技术,同时利用语义属性和视觉外观,以及身体部位之间的空间依赖关系,学习生成具有鉴别性和鲁棒性的行人表示。实验证明,该方法在 Market-1501 和 DukeMTMC-reID - LaSOT:大尺度单目标跟踪高度质量基准
本文提出了 LaSOT,一个用于对象跟踪的高质量基准数据集,它包括大量具有视觉挑战的序列,同时还提供了自然语言方面的数据丰富,以促进自然语言特征的研究。35 种跟踪算法在该数据集上进行了实验,并发现仍有很大的改善空间。
- CVPR零样本识别的渐进式集成网络
本研究提出了一种新型的渐进式集成网络模型,采用多个投影标签嵌入来解决零样本图像识别问题,在有标记和无标记的数据上进行训练,为未标记的类提供知识转移,通过渐进式训练框架和预测伪标签来逐步标注最自信的图像,并更新集成网络以扩展到广义零样本学习情 - CVPR人员再识别的注意力感知组合网络
该论文提出了一种新型的名为 Attention-Aware Compositional Network 的框架,用于人物再识别。该框架主要包括姿态引导下的部分关注和关注感知特征组合两个模块,并利用人体姿态估计结果来处理姿态变化和背景混杂的问 - CVPR人员再识别的多级分解网络
本研究提出了 Multi-Level Factorisation Net (MLFN) 模型,它能够将人的视觉外观分解成多个语义层面的潜在辨别因素,从而实现有效的人员再识别。此方法可以解决深度学习模型需要大量人工标注属性的问题,并在三个 R - Vista: 一种考虑视觉、社交和时间因素的艺术推荐模型
本研究针对大规模数字艺术社区 Behance 的用户行为,建立了一个基于视觉外观、时间动态和社交动态的推荐系统。
- Sherlock: 视觉感知一类协同过滤的稀疏分层嵌入
为建立成功的推荐系统,我们需要针对用户偏好和物品属性描述寻找关键维度,其中在像服装推荐等领域,将用户偏好解释为建模所需的物品的视觉外观也使得推荐变得更具挑战性,因此本论文提出了一种采用新型层次嵌入结构,可以同时考虑高层次(颜色、暗度等)和微 - CVPR匹配函数学习
本篇论文介绍了一种学习匹配函数的方法,该方法能自动发现允许视觉外观变化的空间,并学习相关特征在不同相对位置和尺度上的匹配分数的重要性。该算法已在 KITTI、Sintel 和 TimeLapse 数据集上实现了有希望的结果。
- 在线展示广告中视觉外观对用户反应的影响
本文介绍了通过对右媒体系统中广告创意进行大规模数据分析,研究创意外观对展示广告点击率的影响关系,给出了可供实践应用的关键点,并提供了评估基准。