- 差分隐私联邦学习的高效语言模型架构
通过修改递归神经网络中的 Sigmoid 和 Tanh 激活功能,我们提出了一个尺度不变的耦合输入遗忘门(SI CIFG)递归网络模型,该模型在大规模实验中收敛更快且性能更好,对于交叉设备联邦学习和具有差分隐私的联邦学习提供了改进的隐私效用 - 3D 感知的讲话头部视频动作转移
本研究提出了一种新颖的 3D 感知说话人视频动作迁移网络 Head3D,通过生成可视化可解释的 3D 标准头部,从 2D 主体帧中充分利用主体外貌信息,以适应驱动视频帧对齐。我们的方法的一个关键组成部分是自我监督的 3D 头部几何学习模块, - 用循环模型进行音频 - 乐谱检索的片段摘要
设计了一种跨模态循环网络,通过学习联合嵌入,能够总结相应音频和乐谱的更长的段落,解决了强对齐数据和音频与乐谱节奏差异导致的局部和全局差异问题,并在实验中验证了该方法在所有可能的配置中进行更准确的检索。
- ICCV基于不确定性引导的自适应弯曲算法实现鲁棒且高效的立体匹配
通过引入新的不确定性引导自适应相关性 (UGAC) 模块,本文提出一种动态计算相关性以实现鲁棒立体匹配的新视角。通过适应性调整采样区域和学习参数,UGAC 模块使得立体匹配能够更加鲁棒和高效地进行。实验证明,在 ETH3D、KITTI 和 - RBSR: 高效灵活的爆发超分辨率循环网络
本文提出了一种逐帧融合的、高效灵活的循环网络,以底帧为关键提示,并引入隐式加权损失,用于促进从具有可变数量的输入帧中获取知识,以实现从序列低分辨率和噪声图像重建高分辨率图像的目标。我们在合成和真实数据集上进行了广泛实验,结果表明,我们的方法 - CVPR统一的金字塔循环网络用于视频帧插值
UPR-Net 是一种基于光流和轻量级循环模块的新型统一金字塔递归网络,采用迭代合成策略和双向光流估计来提高大运动情况下的帧间插值鲁棒性能。
- CVPR基于循环最近点的三维点云场景流估计
本文提出一种基于递归网络的零阶方法,可用于解决对不规则点云数据进行 3D 场景流估计和点云配准两项任务,实验结果表明该方法能够超越以往方法并达到新的最佳表现。
- 自闸记忆循环网络用于高效可伸缩 HDR 去鬼影
本文提出了一种基于递归网络的 HDR 去霓虹方法,使用卷积和递归的结构以生成视觉效果良好,没有去霓虹的 HDR 图像。该方法引入了一种新的递归单元结构,即自门内存(SGM)单元,它优于标准 LSTM 单元,同时包含更少的参数并具有更快的运行 - ICCV基于接触感知的蒙皮动作转移
本文提出了一种运动重新定位方法,能够保留自身联系并防止相互穿透,利用一种新颖的几何条件循环网络和编码器空间优化策略实现高效的重新定位,通过实验证明其结果优于以往方法。
- 基于目标驱动的阶段性网络用于轨迹预测
本文提出了 Stepwise Goal-Driven Network (SGNet) 的循环网络来预测观察到的行人或车辆在多个时间尺度上的轨迹,并通过连续建模目标的变化提供更准确和详细的信息。作者在三个第一人称交通数据集和三个鸟瞰数据集上对 - 基于位置感知的单张图像反射去除
本文提出了一种基于位置感知的深度学习单图像去反射新方法,在该网络中,反射检测模块回归一个概率性反射信念图,采用多尺度拉普拉斯特征作为输入,设计了一种递归网络,用于逐步精细调整照射和反射层。
- 众人皆醉我独醒:让我依你所愿地说话
该研究提出了一种基于音频输入的编辑目标肖像画面的方法,通过将目标视频帧分解为表情、几何和姿势三个正交参数空间,再利用循环神经网络将源音频转化为表情参数,并在保留原始视频背景的同时合成一个逼真的人物主体,最后利用动态编程构建一个有序连贯且令人 - 有序或无序:基于视频的人员再识别的重新审视
本文探究了对于基于视频的行人再识别(VPRe-id)任务在学习良好的视觉表示是否真的需要采用循环网络(RNNs),然后提出了一种基于集成学习的方法,可有效地解决该问题并实现了最先进的性能水平。
- 事件相机实现高速和高动态范围视频
本文提出了一种使用循环网络从事件流中直接学习重建图像的方法,并在此基础上扩展到从事件流合成彩色图像的方法,实验证明该网络在处理高速现象和挑战性照明条件下具有较好的图像质量和高动态范围重建,并作为事件数据的中间表示进行了分类和视觉惯性积分导航 - 从事件相机到视频:将现代计算机视觉引入事件相机
研究使用成熟的计算机视觉技术对从事件数据中重建的视频进行对象分类和图像重建,从而充分发挥事件相机的优异特性。
- CVPRRVOS:端到端的循环神经网络用于视频对象分割
该研究提出了一种基于循环神经网络的视频多目标分割模型,实现了零样本学习和时间上的目标连贯性,此模型在 DAVIS-2017 和 YouTube-VOS 基准测试上取得了优异的表现,并且其推理时间比现有方法更快。
- ECCV向前并讲述:视频描述的渐进式生成器
本研究提出了一种基于序列学习的新方法,通过选择一系列鲜明的视频片段和产生连贯的句子描述来生成对给定视频的一个连贯段落描述。该方法在 ActivityNet Captions 数据集上表现出能够生成高质量段落描述的能力,比其他方法产生的描述更 - 感知视频超分辨率增强时间连续性
本文介绍了一种基于循环对抗网络的视频放大方法,利用感知损失函数来实现高质量和时域一致性的视频放大。
- NIPS个性化生存预测及其上下文解释网络
通过使用基于递归神经网络的预测模型,结合患者特征分析,构建出可解释的癌症患者存活时间分布预测模型,实验结果表明其相比于其他基线模型在预测性能上有明显优势。
- CAR-Net: 明视注意力循环网络
提出了利用空间导航环境和行为之间的依赖关系进行路径预测的可解释框架,利用 Clairvoyant Attentive Recurrent Network(CAR-Net)解决路径预测任务,并成功地应用于 Formula One 赛道、Sta