面部动作的线性解耦表示学习
本文介绍了一种无需外部监督即可将线性编码的面部语义从 StyleGAN 中分离的方法,并结合稳定的三维可变形面部重建方法将单视图 GAN 生成物分解为多个语义。同时,我们还展示了沿着分离表示进行引导外推可以帮助进行数据增强,并提供了对我们学习到的面部表示的分析。
Mar, 2021
提出一种无监督学习框架,利用未标记的数据来学习视频表示,通过学习推断不同视图的三维运动,捕捉视角不变的动作特征,以及增强视角不变特征的学习方法,并在多个数据集上证明该方法对动作识别的有效性。
Sep, 2018
提出一种新颖的多视图动作识别方法,通过可学习的变换器解码查询和两个监督对比损失将学习到的动作特征与视图信息分离,从而显著提高了多视图动作识别的性能。
Dec, 2023
提出了一种基于结构稀疏性的联合稀疏回归学习方法,利用来自稀疏部位集的多模态特征的组合将每个动作建模为结构稀疏性,以此来表示各个部位的动态和外观。
Jul, 2015
本文提出了一种新型的人脸反欺诈方法,旨在通过解缠活体特征和内容特征从图像中提取最终进行分类的活体特征,并采用卷积神经网络和低层级和高层级监控的结合来提高其泛化能力,并在公共基准数据集上进行了充分的实验结果验证。
Aug, 2020
本文提出了一个辅助的特征细化头(FR Head),通过空间 - 时间分解和对比特征细化来识别骨架的歧义样本,从而强化对多层的监督,并在多个数据集上进行了广泛的实验,得到了与最先进方法相竞争的结果。
Mar, 2023
本文提出了一种无监督的深度学习方法来分离在野外拍摄的脸部图像中的多个潜在变化因素,其中多个潜在变化因素的乘法交互通过多线性(张量)结构明确地建模。该方法学习了面部表情和姿态的分离表示,可用于各种应用,包括面部编辑,以及三维面部重建和面部表情、身份和姿态的分类。
Nov, 2017
DrNET 是一种用于学习从视频中生成分离图像表示的新型模型,通过利用视频的时间一致性和新型的对抗性损失函数来学习一种表示,该表示将每一帧分解为一个固定部分和一个随时间变化的成分,这种分离的表示可以用于一系列任务,例如将标准 LSTM 应用于随时间变化的成分,从而预测未来的帧。
May, 2017