面部动作的线性解耦表示学习

Jan, 2017

Linear Disentangled Representation Learning for Facial Actions

Xiang Xiang, Trac D. Tran

TL;DR本文提出了一种线性模型来处理具有挑战性的现实多通道信号，该模型在 2D 面部视频中进行人脸动作识别，其基于稀疏表示分类的直观线性模型，利用帧之间的低秩性质来减去底层的中性脸部，从而识别面部动作单位，取得不错的性能。

Abstract

Limited annotated data available for the recognition of facial expression and action units embarrasses the training of deep networks, which can learn disentangled invariant features. However, a →

facial expression action units linear model multichannel signals sparse representation based classification

发现论文，激发创造

线性解缠表示和无监督动作估计

通过改变损失函数的设置，可以在 VAE 模型中诱导线性分离表示，这是一种理想的表示形式，符合经典分离指标，并提出了一种方法诱导不可约表示。

Aug, 2020

线性编码面部语义的无监督解缠

本文介绍了一种无需外部监督即可将线性编码的面部语义从 StyleGAN 中分离的方法，并结合稳定的三维可变形面部重建方法将单视图 GAN 生成物分解为多个语义。同时，我们还展示了沿着分离表示进行引导外推可以帮助进行数据增强，并提供了对我们学习到的面部表示的分析。

Mar, 2021

无监督学习视角不变动作表示

提出一种无监督学习框架，利用未标记的数据来学习视频表示，通过学习推断不同视图的三维运动，捕捉视角不变的动作特征，以及增强视角不变特征的学习方法，并在多个数据集上证明该方法对动作识别的有效性。

Sep, 2018

从面部图像学习解耦表情表示

本文使用对抗学习方法学习人脸图像的解缠表示，提高了在 AffectNet 数据集上表情识别任务的准确率。

Aug, 2020

DVANet：多视角行为识别中视角和动作特征的解耦合

提出一种新颖的多视图动作识别方法，通过可学习的变换器解码查询和两个监督对比损失将学习到的动作特征与视图信息分离，从而显著提高了多视图动作识别的性能。

Dec, 2023

深度视频中的多模态多部分学习与动作识别

提出了一种基于结构稀疏性的联合稀疏回归学习方法，利用来自稀疏部位集的多模态特征的组合将每个动作建模为结构稀疏性，以此来表示各个部位的动态和外观。

Jul, 2015

通过分离表示学习进行人脸反欺骗

本文提出了一种新型的人脸反欺诈方法，旨在通过解缠活体特征和内容特征从图像中提取最终进行分类的活体特征，并采用卷积神经网络和低层级和高层级监控的结合来提高其泛化能力，并在公共基准数据集上进行了充分的实验结果验证。

Aug, 2020

基于骨架的动作识别中学习判别性表示

本文提出了一个辅助的特征细化头（FR Head），通过空间 - 时间分解和对比特征细化来识别骨架的歧义样本，从而强化对多层的监督，并在多个数据集上进行了广泛的实验，得到了与最先进方法相竞争的结果。

Mar, 2023

一种用对抗神经张量方法学习分离表示的方法

本文提出了一种无监督的深度学习方法来分离在野外拍摄的脸部图像中的多个潜在变化因素，其中多个潜在变化因素的乘法交互通过多线性（张量）结构明确地建模。该方法学习了面部表情和姿态的分离表示，可用于各种应用，包括面部编辑，以及三维面部重建和面部表情、身份和姿态的分类。

Nov, 2017

从视频中无监督地学习解缠表示

DrNET 是一种用于学习从视频中生成分离图像表示的新型模型，通过利用视频的时间一致性和新型的对抗性损失函数来学习一种表示，该表示将每一帧分解为一个固定部分和一个随时间变化的成分，这种分离的表示可以用于一系列任务，例如将标准 LSTM 应用于随时间变化的成分，从而预测未来的帧。

May, 2017